diff --git "a/log.txt" "b/log.txt"
new file mode 100644--- /dev/null
+++ "b/log.txt"
@@ -0,0 +1,6888 @@
+The following values were not passed to `accelerate launch` and had defaults used instead:
+	`--num_processes` was set to a value of `4`
+		More than one GPU was found, enabling multi-GPU training.
+		If this was unintended please pass in `--num_processes=1`.
+	`--num_machines` was set to a value of `1`
+	`--mixed_precision` was set to a value of `'no'`
+	`--dynamo_backend` was set to a value of `'no'`
+To avoid this warning pass in values for each of the problematic parameters or run `accelerate config`.
+Params using prompt template alpaca:
+base_model: baichuan-inc/Baichuan2-7B-Base
+data_path: ../../data/belle_dolphine/p12.jsonl
+output_dir: ../out/lora/p12
+batch_size: 32
+micro_batch_size: 2
+num_epochs: 1
+learning_rate: 0.0004
+cutoff_len: 4096
+val_set_size: 0
+lr_scheduler: cosine
+warmup_steps: 100
+lora_r: 16
+lora_alpha: 16
+lora_dropout: 0.05
+lora_target_modules: ['gate_proj', 'down_proj', 'up_proj']
+train_on_inputs: False
+add_eos_token: False
+group_by_length: False
+wandb_project: lora-moe
+wandb_run_name: belle_dolphine-p12
+wandb_watch: 
+wandb_log_model: 
+resume_from_checkpoint: False
+
+gradient_accumulation_steps:  4
+gradient_accumulation_steps:  4
+gradient_accumulation_steps:  4
+gradient_accumulation_steps:  4
+Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:  50%|█████     | 1/2 [00:11<00:11, 11.09s/it]Loading checkpoint shards:  50%|█████     | 1/2 [00:11<00:11, 11.10s/it]Loading checkpoint shards:  50%|█████     | 1/2 [00:11<00:11, 11.81s/it]Loading checkpoint shards:  50%|█████     | 1/2 [00:12<00:12, 12.22s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:16<00:00,  7.82s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:16<00:00,  8.31s/it]
+Loading checkpoint shards: 100%|██████████| 2/2 [00:16<00:00,  7.81s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:16<00:00,  8.30s/it]
+pre-trained model's BOS EOS and PAD token id: 1 2 0  => It should be 1 2 None
+pre-trained model's BOS EOS and PAD token id: 1 2 0  => It should be 1 2 None
+Loading checkpoint shards: 100%|██████████| 2/2 [00:17<00:00,  8.40s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:17<00:00,  8.91s/it]
+Loading checkpoint shards: 100%|██████████| 2/2 [00:18<00:00,  8.56s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:18<00:00,  9.11s/it]
+pre-trained model's BOS EOS and PAD token id: 1 2 0  => It should be 1 2 None
+pre-trained model's BOS EOS and PAD token id: 1 2 0  => It should be 1 2 None
+trainable params: 23,199,744 || all params: 7,529,172,992 || trainable%: 0.30813137146205183
+trainable params: 23,199,744 || all params: 7,529,172,992 || trainable%: 0.30813137146205183
+Map:   0%|          | 0/216925 [00:00<?, ? examples/s]Map:   0%|          | 85/216925 [00:00<04:17, 841.73 examples/s]Map:   0%|          | 0/216925 [00:00<?, ? examples/s]Map:   0%|          | 173/216925 [00:00<04:12, 859.61 examples/s]Map:   0%|          | 85/216925 [00:00<04:20, 832.03 examples/s]Map:   0%|          | 266/216925 [00:00<04:04, 885.72 examples/s]Map:   0%|          | 173/216925 [00:00<04:13, 854.00 examples/s]Map:   0%|          | 356/216925 [00:00<04:03, 889.59 examples/s]Map:   0%|          | 300/216925 [00:00<04:16, 844.42 examples/s]Map:   0%|          | 447/216925 [00:00<04:01, 896.66 examples/s]Map:   0%|          | 389/216925 [00:00<04:12, 856.80 examples/s]Map:   0%|          | 575/216925 [00:00<04:07, 872.69 examples/s]Map:   0%|          | 515/216925 [00:00<04:16, 843.64 examples/s]Map:   0%|          | 664/216925 [00:00<04:07, 874.78 examples/s]Map:   0%|          | 600/216925 [00:00<04:17, 841.67 examples/s]Map:   0%|          | 754/216925 [00:00<04:06, 875.94 examples/s]Map:   0%|          | 685/216925 [00:00<04:16, 843.27 examples/s]Map:   0%|          | 846/216925 [00:00<04:04, 882.05 examples/s]Map:   0%|          | 772/216925 [00:00<04:14, 848.45 examples/s]Map:   0%|          | 940/216925 [00:01<04:01, 893.91 examples/s]trainable params: 23,199,744 || all params: 7,529,172,992 || trainable%: 0.30813137146205183
+trainable params: 23,199,744 || all params: 7,529,172,992 || trainable%: 0.30813137146205183
+Map:   0%|          | 904/216925 [00:01<04:12, 856.47 examples/s]Map:   0%|          | 1046/216925 [00:01<05:03, 710.65 examples/s]Map:   0%|          | 0/216925 [00:00<?, ? examples/s]Map:   0%|          | 0/216925 [00:00<?, ? examples/s]Map:   1%|          | 1138/216925 [00:01<04:44, 759.17 examples/s]Map:   0%|          | 1000/216925 [00:01<05:12, 691.02 examples/s]Map:   0%|          | 54/216925 [00:00<06:52, 526.08 examples/s]Map:   0%|          | 87/216925 [00:00<04:13, 855.15 examples/s]Map:   1%|          | 1230/216925 [00:01<04:30, 798.14 examples/s]Map:   1%|          | 1089/216925 [00:01<04:53, 735.05 examples/s]Map:   0%|          | 115/216925 [00:00<06:18, 572.25 examples/s]Map:   0%|          | 174/216925 [00:00<04:11, 860.41 examples/s]Map:   1%|          | 1321/216925 [00:01<04:20, 827.17 examples/s]Map:   1%|          | 1181/216925 [00:01<04:37, 776.76 examples/s]Map:   0%|          | 181/216925 [00:00<05:56, 608.45 examples/s]Map:   0%|          | 265/216925 [00:00<04:07, 876.22 examples/s]Map:   1%|          | 1269/216925 [00:01<04:29, 800.82 examples/s]Map:   1%|          | 1454/216925 [00:01<04:14, 845.01 examples/s]Map:   0%|          | 268/216925 [00:00<05:05, 708.65 examples/s]Map:   0%|          | 353/216925 [00:00<04:07, 876.19 examples/s]Map:   1%|          | 1361/216925 [00:01<04:19, 829.35 examples/s]Map:   1%|          | 1544/216925 [00:01<04:12, 851.92 examples/s]Map:   0%|          | 351/216925 [00:00<04:49, 748.37 examples/s]Map:   0%|          | 477/216925 [00:00<04:13, 852.16 examples/s]Map:   1%|          | 1453/216925 [00:01<04:13, 850.13 examples/s]Map:   1%|          | 1636/216925 [00:01<04:08, 866.24 examples/s]Map:   0%|          | 435/216925 [00:00<04:38, 776.70 examples/s]Map:   0%|          | 565/216925 [00:00<04:12, 856.77 examples/s]Map:   1%|          | 1543/216925 [00:01<04:10, 860.83 examples/s]Map:   1%|          | 1724/216925 [00:02<04:08, 866.11 examples/s]Map:   0%|          | 522/216925 [00:00<04:29, 804.30 examples/s]Map:   0%|          | 656/216925 [00:00<04:09, 867.09 examples/s]Map:   1%|          | 1633/216925 [00:01<04:07, 869.65 examples/s]Map:   1%|          | 1814/216925 [00:02<04:06, 874.10 examples/s]Map:   0%|          | 615/216925 [00:00<04:17, 841.46 examples/s]Map:   0%|          | 744/216925 [00:00<04:08, 869.58 examples/s]Map:   1%|          | 1724/216925 [00:02<04:05, 878.36 examples/s]Map:   1%|          | 1907/216925 [00:02<04:02, 886.55 examples/s]Map:   0%|          | 702/216925 [00:00<04:14, 848.65 examples/s]Map:   0%|          | 835/216925 [00:00<04:05, 878.70 examples/s]Map:   1%|          | 1814/216925 [00:02<04:04, 879.17 examples/s]Map:   0%|          | 788/216925 [00:01<04:14, 849.67 examples/s]Map:   1%|          | 1903/216925 [00:02<04:04, 879.20 examples/s]Map:   1%|          | 2000/216925 [00:02<05:00, 714.63 examples/s]Map:   0%|          | 878/216925 [00:01<04:10, 862.78 examples/s]Map:   0%|          | 969/216925 [00:01<04:05, 879.22 examples/s]Map:   1%|          | 1995/216925 [00:02<04:02, 887.99 examples/s]Map:   1%|          | 2093/216925 [00:02<04:40, 766.84 examples/s]Map:   0%|          | 968/216925 [00:01<04:07, 872.16 examples/s]Map:   1%|          | 2188/216925 [00:02<04:24, 811.07 examples/s]Map:   1%|          | 1088/216925 [00:01<05:04, 709.79 examples/s]Map:   1%|          | 2091/216925 [00:02<05:03, 707.26 examples/s]Map:   1%|          | 2278/216925 [00:02<04:17, 832.17 examples/s]Map:   1%|          | 1089/216925 [00:01<05:05, 707.37 examples/s]Map:   1%|          | 1179/216925 [00:01<04:47, 751.55 examples/s]Map:   1%|          | 2186/216925 [00:02<04:40, 764.97 examples/s]Map:   1%|          | 2370/216925 [00:02<04:10, 856.05 examples/s]Map:   1%|          | 1177/216925 [00:01<04:49, 745.13 examples/s]Map:   1%|          | 1271/216925 [00:01<04:33, 789.89 examples/s]Map:   1%|          | 2279/216925 [00:02<04:27, 803.76 examples/s]Map:   1%|          | 2463/216925 [00:02<04:04, 876.46 examples/s]Map:   1%|          | 1266/216925 [00:01<04:36, 779.37 examples/s]Map:   1%|          | 1364/216925 [00:01<04:21, 823.40 examples/s]Map:   1%|          | 2373/216925 [00:02<04:15, 838.19 examples/s]Map:   1%|          | 2553/216925 [00:03<04:03, 878.99 examples/s]Map:   1%|          | 1357/216925 [00:01<04:25, 810.65 examples/s]Map:   1%|          | 1453/216925 [00:01<04:16, 840.43 examples/s]Map:   1%|          | 2468/216925 [00:02<04:07, 867.84 examples/s]Map:   1%|          | 1442/216925 [00:01<04:24, 816.02 examples/s]Map:   1%|          | 2676/216925 [00:03<04:11, 851.21 examples/s]Map:   1%|          | 2562/216925 [00:03<04:01, 886.59 examples/s]Map:   1%|          | 1576/216925 [00:01<04:19, 831.18 examples/s]Map:   1%|          | 1529/216925 [00:01<04:19, 829.51 examples/s]Map:   1%|          | 1668/216925 [00:02<04:12, 850.92 examples/s]Map:   1%|▏         | 2806/216925 [00:03<04:10, 853.14 examples/s]Map:   1%|          | 2695/216925 [00:03<04:02, 883.50 examples/s]Map:   1%|          | 1657/216925 [00:02<04:18, 832.38 examples/s]Map:   1%|          | 1757/216925 [00:02<04:11, 856.98 examples/s]Map:   1%|▏         | 2893/216925 [00:03<04:10, 853.93 examples/s]Map:   1%|▏         | 2828/216925 [00:03<04:02, 882.32 examples/s]Map:   1%|          | 1742/216925 [00:02<04:17, 835.27 examples/s]Map:   1%|          | 1853/216925 [00:02<04:03, 884.98 examples/s]Map:   1%|          | 1828/216925 [00:02<04:16, 840.20 examples/s]Map:   1%|          | 1944/216925 [00:02<04:01, 890.62 examples/s]Map:   1%|▏         | 3000/216925 [00:03<05:11, 687.06 examples/s]Map:   1%|▏         | 2959/216925 [00:03<04:03, 876.95 examples/s]Map:   1%|          | 1914/216925 [00:02<04:14, 843.83 examples/s]Map:   1%|▏         | 3082/216925 [00:03<04:59, 713.46 examples/s]Map:   1%|          | 2042/216925 [00:02<05:08, 695.73 examples/s]Map:   1%|▏         | 3172/216925 [00:03<04:42, 756.68 examples/s]Map:   1%|▏         | 3086/216925 [00:03<04:57, 719.89 examples/s]Map:   1%|          | 2000/216925 [00:02<05:19, 672.91 examples/s]Map:   1%|          | 2136/216925 [00:02<04:45, 751.49 examples/s]Map:   2%|▏         | 3258/216925 [00:03<04:33, 780.09 examples/s]Map:   1%|▏         | 3179/216925 [00:03<04:41, 759.98 examples/s]Map:   1%|          | 2086/216925 [00:02<04:59, 716.70 examples/s]Map:   1%|          | 2228/216925 [00:02<04:30, 793.59 examples/s]Map:   2%|▏         | 3346/216925 [00:04<04:25, 805.88 examples/s]Map:   2%|▏         | 3267/216925 [00:03<04:31, 785.67 examples/s]Map:   1%|          | 2179/216925 [00:02<04:39, 768.15 examples/s]Map:   1%|          | 2318/216925 [00:02<04:21, 820.41 examples/s]Map:   2%|▏         | 3433/216925 [00:04<04:19, 822.36 examples/s]Map:   2%|▏         | 3358/216925 [00:04<04:22, 814.85 examples/s]Map:   1%|          | 2273/216925 [00:02<04:24, 812.33 examples/s]Map:   1%|          | 2411/216925 [00:02<04:12, 849.45 examples/s]Map:   2%|▏         | 3555/216925 [00:04<04:21, 816.54 examples/s]Map:   1%|          | 2366/216925 [00:02<04:14, 843.25 examples/s]Map:   1%|          | 2501/216925 [00:03<04:08, 862.44 examples/s]Map:   2%|▏         | 3489/216925 [00:04<04:16, 830.50 examples/s]Map:   2%|▏         | 3643/216925 [00:04<04:16, 830.48 examples/s]Map:   1%|          | 2454/216925 [00:03<04:11, 851.44 examples/s]Map:   1%|          | 2625/216925 [00:03<04:14, 842.41 examples/s]Map:   2%|▏         | 3611/216925 [00:04<04:20, 819.92 examples/s]Map:   2%|▏         | 3755/216925 [00:04<04:27, 796.02 examples/s]Map:   1%|          | 2574/216925 [00:03<04:18, 827.95 examples/s]Map:   1%|▏         | 2713/216925 [00:03<04:11, 850.93 examples/s]Map:   2%|▏         | 3700/216925 [00:04<04:16, 830.55 examples/s]Map:   2%|▏         | 3839/216925 [00:04<04:24, 806.88 examples/s]Map:   1%|          | 2659/216925 [00:03<04:18, 829.67 examples/s]Map:   1%|▏         | 2841/216925 [00:03<04:12, 849.30 examples/s]Map:   2%|▏         | 3827/216925 [00:04<04:16, 832.40 examples/s]Map:   2%|▏         | 3963/216925 [00:04<04:22, 811.29 examples/s]Map:   1%|▏         | 2789/216925 [00:03<04:15, 838.32 examples/s]Map:   1%|▏         | 2971/216925 [00:03<04:10, 852.79 examples/s]Map:   2%|▏         | 3952/216925 [00:04<04:16, 830.16 examples/s]Map:   1%|▏         | 2878/216925 [00:03<04:12, 846.59 examples/s]Map:   2%|▏         | 4062/216925 [00:05<05:53, 601.76 examples/s]Map:   2%|▏         | 4041/216925 [00:05<05:11, 683.30 examples/s]Map:   1%|▏         | 3085/216925 [00:03<05:07, 696.16 examples/s]Map:   1%|▏         | 3000/216925 [00:03<05:11, 686.05 examples/s]Map:   2%|▏         | 4132/216925 [00:05<04:51, 730.24 examples/s]Map:   1%|▏         | 3176/216925 [00:03<04:49, 738.29 examples/s]Map:   2%|▏         | 4166/216925 [00:05<05:40, 623.96 examples/s]Map:   1%|▏         | 3082/216925 [00:03<04:59, 714.61 examples/s]Map:   2%|▏         | 4219/216925 [00:05<04:39, 760.15 examples/s]Map:   2%|▏         | 3261/216925 [00:04<04:39, 763.46 examples/s]Map:   2%|▏         | 4253/216925 [00:05<05:15, 673.55 examples/s]Map:   1%|▏         | 3166/216925 [00:04<04:47, 743.04 examples/s]Map:   2%|▏         | 4306/216925 [00:05<04:30, 785.98 examples/s]Map:   2%|▏         | 3346/216925 [00:04<04:32, 783.21 examples/s]Map:   2%|▏         | 4343/216925 [00:05<04:54, 722.18 examples/s]Map:   1%|▏         | 3250/216925 [00:04<04:39, 764.33 examples/s]Map:   2%|▏         | 4395/216925 [00:05<04:21, 812.59 examples/s]Map:   2%|▏         | 3434/216925 [00:04<04:24, 805.91 examples/s]Map:   2%|▏         | 4428/216925 [00:05<04:43, 750.52 examples/s]Map:   2%|▏         | 3336/216925 [00:04<04:31, 787.98 examples/s]Map:   2%|▏         | 4480/216925 [00:05<04:19, 818.33 examples/s]Map:   2%|▏         | 3520/216925 [00:04<04:20, 819.14 examples/s]Map:   2%|▏         | 4515/216925 [00:05<04:32, 780.33 examples/s]Map:   2%|▏         | 3423/216925 [00:04<04:24, 807.28 examples/s]Map:   2%|▏         | 4568/216925 [00:05<04:15, 831.83 examples/s]Map:   2%|▏         | 4602/216925 [00:05<04:24, 803.23 examples/s]Map:   2%|▏         | 3510/216925 [00:04<04:19, 821.29 examples/s]Map:   2%|▏         | 3651/216925 [00:04<04:15, 833.79 examples/s]Map:   2%|▏         | 4695/216925 [00:05<04:14, 834.66 examples/s]Map:   2%|▏         | 3741/216925 [00:04<04:11, 847.95 examples/s]Map:   2%|▏         | 4726/216925 [00:05<04:22, 809.02 examples/s]Map:   2%|▏         | 3634/216925 [00:04<04:19, 821.11 examples/s]Map:   2%|▏         | 4814/216925 [00:05<04:19, 816.26 examples/s]Map:   2%|▏         | 3868/216925 [00:04<04:12, 845.15 examples/s]Map:   2%|▏         | 4850/216925 [00:06<04:22, 808.81 examples/s]Map:   2%|▏         | 3749/216925 [00:04<04:26, 800.16 examples/s]Map:   2%|▏         | 4903/216925 [00:06<04:15, 830.49 examples/s]Map:   2%|▏         | 4944/216925 [00:06<04:13, 836.04 examples/s]Map:   2%|▏         | 3835/216925 [00:04<04:22, 811.05 examples/s]Map:   2%|▏         | 3994/216925 [00:04<04:13, 840.04 examples/s]Map:   2%|▏         | 4994/216925 [00:06<04:09, 847.76 examples/s]Map:   2%|▏         | 3961/216925 [00:05<04:21, 814.81 examples/s]Map:   2%|▏         | 5041/216925 [00:06<05:09, 683.92 examples/s]Map:   2%|▏         | 4091/216925 [00:05<05:05, 696.13 examples/s]Map:   2%|▏         | 5087/216925 [00:06<05:10, 681.52 examples/s]Map:   2%|▏         | 5132/216925 [00:06<04:48, 734.28 examples/s]Map:   2%|▏         | 4181/216925 [00:05<04:48, 738.57 examples/s]Map:   2%|▏         | 5171/216925 [00:06<04:56, 715.28 examples/s]Map:   2%|▏         | 5223/216925 [00:06<04:32, 776.14 examples/s]Map:   2%|▏         | 4086/216925 [00:05<05:11, 682.58 examples/s]Map:   2%|▏         | 4276/216925 [00:05<04:30, 786.19 examples/s]Map:   2%|▏         | 5258/216925 [00:06<04:41, 751.03 examples/s]Map:   2%|▏         | 5316/216925 [00:06<04:20, 813.78 examples/s]Map:   2%|▏         | 4171/216925 [00:05<04:57, 715.54 examples/s]Map:   2%|▏         | 4368/216925 [00:05<04:20, 816.25 examples/s]Map:   2%|▏         | 5346/216925 [00:06<04:30, 783.52 examples/s]Map:   2%|▏         | 5406/216925 [00:06<04:13, 834.19 examples/s]Map:   2%|▏         | 4257/216925 [00:05<04:45, 746.11 examples/s]Map:   2%|▏         | 4457/216925 [00:05<04:15, 830.95 examples/s]Map:   3%|▎         | 5440/216925 [00:06<04:16, 823.79 examples/s]Map:   3%|▎         | 5496/216925 [00:06<04:09, 847.05 examples/s]Map:   2%|▏         | 4344/216925 [00:05<04:34, 774.05 examples/s]Map:   2%|▏         | 4551/216925 [00:05<04:07, 858.19 examples/s]Map:   3%|▎         | 5529/216925 [00:06<04:12, 837.88 examples/s]Map:   2%|▏         | 4430/216925 [00:05<04:27, 794.76 examples/s]Map:   2%|▏         | 4645/216925 [00:05<04:01, 879.02 examples/s]Map:   3%|▎         | 5628/216925 [00:07<04:07, 855.25 examples/s]Map:   3%|▎         | 5616/216925 [00:06<04:10, 842.73 examples/s]Map:   2%|▏         | 4518/216925 [00:05<04:20, 814.12 examples/s]Map:   3%|▎         | 5720/216925 [00:07<04:02, 870.45 examples/s]Map:   3%|▎         | 5707/216925 [00:07<04:06, 857.95 examples/s]Map:   2%|▏         | 4776/216925 [00:05<04:02, 873.53 examples/s]Map:   2%|▏         | 4606/216925 [00:05<04:16, 827.16 examples/s]Map:   3%|▎         | 5803/216925 [00:07<03:58, 885.52 examples/s]Map:   2%|▏         | 4866/216925 [00:05<04:02, 875.77 examples/s]Map:   3%|▎         | 5850/216925 [00:07<04:03, 866.74 examples/s]Map:   2%|▏         | 4697/216925 [00:05<04:10, 848.21 examples/s]Map:   3%|▎         | 5938/216925 [00:07<04:03, 866.84 examples/s]Map:   3%|▎         | 5933/216925 [00:07<04:01, 874.42 examples/s]Map:   2%|▏         | 4827/216925 [00:06<04:08, 852.43 examples/s]Map:   2%|▏         | 5000/216925 [00:06<04:57, 713.29 examples/s]Map:   2%|▏         | 4919/216925 [00:06<04:03, 869.02 examples/s]Map:   3%|▎         | 6041/216925 [00:07<05:05, 691.22 examples/s]Map:   2%|▏         | 5090/216925 [00:06<04:41, 753.42 examples/s]Map:   3%|▎         | 6045/216925 [00:07<04:55, 712.52 examples/s]Map:   3%|▎         | 6132/216925 [00:07<04:45, 737.42 examples/s]Map:   2%|▏         | 5180/216925 [00:06<04:28, 787.34 examples/s]Map:   3%|▎         | 6138/216925 [00:07<04:37, 759.02 examples/s]Map:   2%|▏         | 5041/216925 [00:06<04:57, 712.87 examples/s]Map:   3%|▎         | 6227/216925 [00:07<04:27, 787.57 examples/s]Map:   2%|▏         | 5272/216925 [00:06<04:18, 819.99 examples/s]Map:   3%|▎         | 6225/216925 [00:07<04:28, 783.69 examples/s]Map:   2%|▏         | 5128/216925 [00:06<04:43, 746.39 examples/s]Map:   3%|▎         | 6321/216925 [00:07<04:15, 825.01 examples/s]Map:   2%|▏         | 5361/216925 [00:06<04:12, 836.51 examples/s]Map:   3%|▎         | 6315/216925 [00:07<04:19, 812.33 examples/s]Map:   2%|▏         | 5216/216925 [00:06<04:32, 777.51 examples/s]Map:   3%|▎         | 6411/216925 [00:07<04:10, 841.15 examples/s]Map:   3%|▎         | 5451/216925 [00:06<04:08, 851.21 examples/s]Map:   3%|▎         | 6405/216925 [00:07<04:13, 831.79 examples/s]Map:   2%|▏         | 5306/216925 [00:06<04:22, 804.65 examples/s]Map:   3%|▎         | 6500/216925 [00:08<04:06, 853.75 examples/s]Map:   3%|▎         | 5540/216925 [00:06<04:05, 859.52 examples/s]Map:   3%|▎         | 6497/216925 [00:08<04:06, 853.77 examples/s]Map:   2%|▏         | 5395/216925 [00:06<04:16, 825.05 examples/s]Map:   3%|▎         | 6591/216925 [00:08<04:02, 868.93 examples/s]Map:   3%|▎         | 5632/216925 [00:06<04:01, 875.00 examples/s]Map:   3%|▎         | 6587/216925 [00:08<04:03, 864.62 examples/s]Map:   3%|▎         | 5487/216925 [00:06<04:08, 849.58 examples/s]Map:   3%|▎         | 6682/216925 [00:08<03:58, 879.78 examples/s]Map:   3%|▎         | 5724/216925 [00:06<03:59, 882.77 examples/s]Map:   3%|▎         | 6678/216925 [00:08<03:59, 876.25 examples/s]Map:   3%|▎         | 5582/216925 [00:07<04:01, 875.28 examples/s]Map:   3%|▎         | 6773/216925 [00:08<03:57, 884.18 examples/s]Map:   3%|▎         | 5815/216925 [00:07<03:58, 886.33 examples/s]Map:   3%|▎         | 6806/216925 [00:08<04:03, 861.15 examples/s]Map:   3%|▎         | 6864/216925 [00:08<03:56, 887.49 examples/s]Map:   3%|▎         | 5910/216925 [00:07<03:54, 900.59 examples/s]Map:   3%|▎         | 5716/216925 [00:07<04:00, 879.46 examples/s]Map:   3%|▎         | 6896/216925 [00:08<04:01, 871.17 examples/s]Map:   3%|▎         | 6993/216925 [00:08<04:00, 873.61 examples/s]Map:   3%|▎         | 5848/216925 [00:07<04:01, 874.41 examples/s]Map:   3%|▎         | 6044/216925 [00:07<04:55, 712.69 examples/s]Map:   3%|▎         | 7000/216925 [00:08<05:04, 690.08 examples/s]Map:   3%|▎         | 5978/216925 [00:07<04:02, 868.61 examples/s]Map:   3%|▎         | 7090/216925 [00:08<04:58, 703.86 examples/s]Map:   3%|▎         | 6136/216925 [00:07<04:38, 757.37 examples/s]Map:   3%|▎         | 7087/216925 [00:08<04:47, 729.84 examples/s]Map:   3%|▎         | 7181/216925 [00:08<04:39, 750.75 examples/s]Map:   3%|▎         | 6228/216925 [00:07<04:24, 795.73 examples/s]Map:   3%|▎         | 7176/216925 [00:08<04:33, 766.42 examples/s]Map:   3%|▎         | 6091/216925 [00:07<04:49, 727.71 examples/s]Map:   3%|▎         | 6321/216925 [00:07<04:14, 828.79 examples/s]Map:   3%|▎         | 7287/216925 [00:09<04:46, 732.79 examples/s]Map:   3%|▎         | 7268/216925 [00:08<04:20, 803.88 examples/s]Map:   3%|▎         | 6182/216925 [00:07<04:35, 764.47 examples/s]Map:   3%|▎         | 6412/216925 [00:07<04:08, 848.26 examples/s]Map:   3%|▎         | 7359/216925 [00:09<04:12, 830.44 examples/s]Map:   3%|▎         | 6272/216925 [00:07<04:25, 794.50 examples/s]Map:   3%|▎         | 7393/216925 [00:09<04:50, 720.82 examples/s]Map:   3%|▎         | 6503/216925 [00:07<04:04, 861.22 examples/s]Map:   3%|▎         | 7451/216925 [00:09<04:06, 850.21 examples/s]Map:   3%|▎         | 6360/216925 [00:08<04:18, 814.27 examples/s]Map:   3%|▎         | 7480/216925 [00:09<04:38, 753.32 examples/s]Map:   3%|▎         | 6596/216925 [00:08<04:00, 876.30 examples/s]Map:   3%|▎         | 6449/216925 [00:08<04:13, 831.57 examples/s]Map:   3%|▎         | 7567/216925 [00:09<04:28, 779.51 examples/s]Map:   3%|▎         | 7583/216925 [00:09<04:03, 859.56 examples/s]Map:   3%|▎         | 6687/216925 [00:08<03:58, 882.85 examples/s]Map:   3%|▎         | 6541/216925 [00:08<04:06, 852.13 examples/s]Map:   4%|▎         | 7654/216925 [00:09<04:21, 799.76 examples/s]Map:   4%|▎         | 7671/216925 [00:09<04:03, 860.51 examples/s]Map:   3%|▎         | 6818/216925 [00:08<03:59, 876.00 examples/s]Map:   3%|▎         | 6634/216925 [00:08<04:01, 871.64 examples/s]Map:   4%|▎         | 7737/216925 [00:09<04:19, 805.18 examples/s]Map:   4%|▎         | 7759/216925 [00:09<04:02, 861.68 examples/s]Map:   3%|▎         | 6909/216925 [00:08<03:58, 881.50 examples/s]Map:   3%|▎         | 6724/216925 [00:08<03:59, 877.44 examples/s]Map:   4%|▎         | 7828/216925 [00:09<04:11, 829.84 examples/s]Map:   4%|▎         | 7886/216925 [00:09<04:04, 855.72 examples/s]Map:   4%|▎         | 7915/216925 [00:09<04:09, 837.85 examples/s]Map:   3%|▎         | 6846/216925 [00:08<04:07, 848.33 examples/s]Map:   4%|▎         | 7978/216925 [00:09<04:00, 867.64 examples/s]Map:   3%|▎         | 7000/216925 [00:08<05:03, 691.26 examples/s]Map:   3%|▎         | 6937/216925 [00:08<04:03, 863.53 examples/s]Map:   3%|▎         | 7090/216925 [00:08<04:44, 738.39 examples/s]Map:   4%|▎         | 8000/216925 [00:10<05:14, 663.42 examples/s]Map:   4%|▎         | 8092/216925 [00:10<04:51, 715.75 examples/s]Map:   3%|▎         | 7180/216925 [00:08<04:29, 777.42 examples/s]Map:   4%|▎         | 8088/216925 [00:10<04:53, 712.64 examples/s]Map:   3%|▎         | 7043/216925 [00:08<04:58, 703.23 examples/s]Map:   4%|▍         | 8185/216925 [00:10<04:33, 763.18 examples/s]Map:   3%|▎         | 7269/216925 [00:08<04:20, 804.94 examples/s]Map:   4%|▍         | 8176/216925 [00:10<04:36, 754.18 examples/s]Map:   3%|▎         | 7138/216925 [00:08<04:36, 757.73 examples/s]Map:   4%|▍         | 8274/216925 [00:10<04:23, 791.12 examples/s]Map:   3%|▎         | 7365/216925 [00:09<04:08, 843.86 examples/s]Map:   4%|▍         | 8260/216925 [00:10<04:28, 776.66 examples/s]Map:   3%|▎         | 7229/216925 [00:09<04:24, 792.87 examples/s]Map:   4%|▍         | 8366/216925 [00:10<04:13, 824.00 examples/s]Map:   3%|▎         | 7454/216925 [00:09<04:04, 855.02 examples/s]Map:   4%|▍         | 8346/216925 [00:10<04:20, 799.42 examples/s]Map:   3%|▎         | 7315/216925 [00:09<04:19, 808.40 examples/s]Map:   3%|▎         | 7543/216925 [00:09<04:03, 858.80 examples/s]Map:   4%|▍         | 8495/216925 [00:10<04:09, 834.70 examples/s]Map:   4%|▍         | 8469/216925 [00:10<04:19, 802.85 examples/s]Map:   3%|▎         | 7404/216925 [00:09<04:13, 828.08 examples/s]Map:   4%|▎         | 7635/216925 [00:09<03:59, 873.86 examples/s]Map:   4%|▍         | 8587/216925 [00:10<04:04, 853.21 examples/s]Map:   4%|▍         | 8554/216925 [00:10<04:16, 813.82 examples/s]Map:   3%|▎         | 7497/216925 [00:09<04:06, 850.43 examples/s]Map:   4%|▎         | 7728/216925 [00:09<03:55, 887.16 examples/s]Map:   4%|▍         | 8679/216925 [00:10<03:59, 869.08 examples/s]Map:   4%|▍         | 8643/216925 [00:10<04:10, 831.99 examples/s]Map:   3%|▎         | 7589/216925 [00:09<04:01, 865.56 examples/s]Map:   4%|▎         | 7819/216925 [00:09<03:54, 891.07 examples/s]Map:   4%|▎         | 7678/216925 [00:09<04:00, 870.70 examples/s]Map:   4%|▍         | 8809/216925 [00:10<04:00, 866.54 examples/s]Map:   4%|▍         | 8766/216925 [00:10<04:13, 822.54 examples/s]Map:   4%|▎         | 7951/216925 [00:09<03:56, 883.05 examples/s]Map:   4%|▍         | 8901/216925 [00:10<03:57, 876.40 examples/s]Map:   4%|▍         | 8855/216925 [00:11<04:08, 836.40 examples/s]Map:   4%|▎         | 7812/216925 [00:09<03:58, 876.15 examples/s]Map:   4%|▍         | 8992/216925 [00:11<03:55, 883.30 examples/s]Map:   4%|▎         | 7902/216925 [00:09<03:58, 877.98 examples/s]Map:   4%|▎         | 8043/216925 [00:09<04:57, 701.10 examples/s]Map:   4%|▍         | 8978/216925 [00:11<04:11, 826.63 examples/s]Map:   4%|▎         | 7991/216925 [00:09<03:57, 878.89 examples/s]Map:   4%|▍         | 8135/216925 [00:09<04:38, 750.33 examples/s]Map:   4%|▍         | 9087/216925 [00:11<04:53, 709.28 examples/s]Map:   4%|▍         | 8226/216925 [00:10<04:24, 788.09 examples/s]Map:   4%|▍         | 9183/216925 [00:11<04:30, 766.86 examples/s]Map:   4%|▍         | 9082/216925 [00:11<05:12, 664.70 examples/s]Map:   4%|▎         | 8090/216925 [00:10<04:55, 705.56 examples/s]Map:   4%|▍         | 8322/216925 [00:10<04:11, 830.48 examples/s]Map:   4%|▍         | 9272/216925 [00:11<04:21, 793.99 examples/s]Map:   4%|▍         | 9167/216925 [00:11<04:56, 700.72 examples/s]Map:   4%|▍         | 8177/216925 [00:10<04:40, 743.96 examples/s]Map:   4%|▍         | 8415/216925 [00:10<04:03, 856.34 examples/s]Map:   4%|▍         | 9365/216925 [00:11<04:10, 827.22 examples/s]Map:   4%|▍         | 9250/216925 [00:11<04:44, 729.07 examples/s]Map:   4%|▍         | 8266/216925 [00:10<04:27, 780.13 examples/s]Map:   4%|▍         | 8504/216925 [00:10<04:01, 863.79 examples/s]Map:   4%|▍         | 9459/216925 [00:11<04:02, 854.47 examples/s]Map:   4%|▍         | 9334/216925 [00:11<04:34, 756.07 examples/s]Map:   4%|▍         | 8361/216925 [00:10<04:13, 821.22 examples/s]Map:   4%|▍         | 8594/216925 [00:10<03:59, 868.30 examples/s]Map:   4%|▍         | 9415/216925 [00:11<04:30, 768.38 examples/s]Map:   4%|▍         | 9591/216925 [00:11<04:00, 860.56 examples/s]Map:   4%|▍         | 8688/216925 [00:10<03:55, 886.03 examples/s]Map:   4%|▍         | 8491/216925 [00:10<04:09, 834.43 examples/s]Map:   4%|▍         | 9497/216925 [00:11<04:26, 778.96 examples/s]Map:   4%|▍         | 9681/216925 [00:11<03:58, 868.54 examples/s]Map:   4%|▍         | 8779/216925 [00:10<03:54, 889.30 examples/s]Map:   4%|▍         | 8614/216925 [00:10<04:11, 828.23 examples/s]Map:   4%|▍         | 9602/216925 [00:12<04:38, 745.66 examples/s]Map:   5%|▍         | 9801/216925 [00:12<04:06, 841.52 examples/s]Map:   4%|▍         | 8911/216925 [00:10<03:55, 882.25 examples/s]Map:   4%|▍         | 8699/216925 [00:10<04:10, 832.67 examples/s]Map:   5%|▍         | 9890/216925 [00:12<04:03, 848.83 examples/s]Map:   4%|▍         | 9705/216925 [00:12<04:46, 722.54 examples/s]Map:   4%|▍         | 8790/216925 [00:10<04:04, 849.81 examples/s]Map:   5%|▍         | 9978/216925 [00:12<04:02, 853.02 examples/s]Map:   4%|▍         | 9000/216925 [00:11<04:56, 701.17 examples/s]Map:   5%|▍         | 9786/216925 [00:12<04:39, 740.37 examples/s]Map:   4%|▍         | 8879/216925 [00:11<04:02, 858.50 examples/s]Map:   4%|▍         | 9091/216925 [00:11<04:38, 746.66 examples/s]Map:   5%|▍         | 9869/216925 [00:12<04:31, 761.38 examples/s]Map:   4%|▍         | 8971/216925 [00:11<03:58, 870.41 examples/s]Map:   4%|▍         | 9184/216925 [00:11<04:22, 791.22 examples/s]Map:   5%|▍         | 10091/216925 [00:12<04:55, 701.03 examples/s]Map:   4%|▍         | 9273/216925 [00:11<04:14, 815.54 examples/s]Map:   5%|▍         | 10181/216925 [00:12<04:37, 745.56 examples/s]Map:   4%|▍         | 9085/216925 [00:11<04:57, 697.76 examples/s]Map:   5%|▍         | 9969/216925 [00:12<06:04, 567.61 examples/s]Map:   4%|▍         | 9366/216925 [00:11<04:05, 844.28 examples/s]Map:   5%|▍         | 10270/216925 [00:12<04:25, 779.20 examples/s]Map:   4%|▍         | 9172/216925 [00:11<04:42, 735.33 examples/s]Map:   4%|▍         | 9457/216925 [00:11<04:01, 859.36 examples/s]Map:   5%|▍         | 10360/216925 [00:12<04:15, 809.19 examples/s]Map:   5%|▍         | 10040/216925 [00:12<06:47, 507.18 examples/s]Map:   4%|▍         | 9261/216925 [00:11<04:28, 772.81 examples/s]Map:   4%|▍         | 9551/216925 [00:11<03:56, 877.77 examples/s]Map:   5%|▍         | 10445/216925 [00:12<04:12, 818.67 examples/s]Map:   5%|▍         | 10122/216925 [00:13<06:03, 568.56 examples/s]Map:   4%|▍         | 9353/216925 [00:11<04:16, 808.92 examples/s]Map:   4%|▍         | 9641/216925 [00:11<03:55, 880.53 examples/s]Map:   5%|▍         | 10536/216925 [00:12<04:05, 841.70 examples/s]Map:   5%|▍         | 10206/216925 [00:13<05:29, 627.57 examples/s]Map:   4%|▍         | 9445/216925 [00:11<04:07, 837.49 examples/s]Map:   4%|▍         | 9731/216925 [00:11<03:54, 883.76 examples/s]Map:   5%|▍         | 10624/216925 [00:13<04:03, 847.61 examples/s]Map:   5%|▍         | 10282/216925 [00:13<05:13, 658.54 examples/s]Map:   4%|▍         | 9566/216925 [00:11<04:11, 823.10 examples/s]Map:   5%|▍         | 9851/216925 [00:11<04:05, 843.44 examples/s]Map:   5%|▍         | 10363/216925 [00:13<04:57, 695.32 examples/s]Map:   5%|▍         | 10751/216925 [00:13<04:04, 842.88 examples/s]Map:   4%|▍         | 9661/216925 [00:12<04:02, 853.25 examples/s]Map:   5%|▍         | 9939/216925 [00:12<04:03, 849.49 examples/s]Map:   5%|▍         | 10446/216925 [00:13<04:43, 728.88 examples/s]Map:   5%|▍         | 10844/216925 [00:13<03:58, 863.46 examples/s]Map:   4%|▍         | 9753/216925 [00:12<03:57, 870.94 examples/s]Map:   5%|▍         | 10533/216925 [00:13<04:29, 764.77 examples/s]Map:   5%|▌         | 10934/216925 [00:13<03:56, 871.33 examples/s]Map:   5%|▍         | 9846/216925 [00:12<03:53, 886.31 examples/s]Map:   5%|▍         | 10620/216925 [00:13<04:20, 790.51 examples/s]Map:   5%|▍         | 10046/216925 [00:12<04:59, 690.15 examples/s]Map:   5%|▍         | 9936/216925 [00:12<03:53, 887.99 examples/s]Map:   5%|▍         | 10706/216925 [00:13<04:16, 805.21 examples/s]Map:   5%|▍         | 10144/216925 [00:12<04:33, 755.68 examples/s]Map:   5%|▌         | 11044/216925 [00:13<04:51, 705.11 examples/s]Map:   5%|▍         | 10238/216925 [00:12<04:19, 797.09 examples/s]Map:   5%|▌         | 11135/216925 [00:13<04:34, 750.52 examples/s]Map:   5%|▍         | 10827/216925 [00:13<04:17, 801.29 examples/s]Map:   5%|▍         | 10042/216925 [00:12<04:53, 703.95 examples/s]Map:   5%|▍         | 10329/216925 [00:12<04:11, 821.34 examples/s]Map:   5%|▌         | 11224/216925 [00:13<04:22, 782.84 examples/s]Map:   5%|▍         | 10130/216925 [00:12<04:37, 744.44 examples/s]Map:   5%|▌         | 10947/216925 [00:14<04:18, 797.03 examples/s]Map:   5%|▍         | 10422/216925 [00:12<04:04, 845.94 examples/s]Map:   5%|▌         | 11314/216925 [00:13<04:13, 811.77 examples/s]Map:   5%|▍         | 10225/216925 [00:12<04:20, 794.15 examples/s]Map:   5%|▍         | 10516/216925 [00:12<03:57, 868.88 examples/s]Map:   5%|▌         | 11407/216925 [00:14<04:03, 842.42 examples/s]Map:   5%|▍         | 10312/216925 [00:12<04:14, 812.89 examples/s]Map:   5%|▌         | 11043/216925 [00:14<05:14, 654.40 examples/s]Map:   5%|▍         | 10611/216925 [00:12<03:52, 888.74 examples/s]Map:   5%|▍         | 10402/216925 [00:12<04:07, 833.47 examples/s]Map:   5%|▌         | 11539/216925 [00:14<04:00, 854.09 examples/s]Map:   5%|▌         | 11128/216925 [00:14<04:56, 694.10 examples/s]Map:   5%|▍         | 10704/216925 [00:13<03:49, 898.92 examples/s]Map:   5%|▌         | 11202/216925 [00:14<04:52, 703.88 examples/s]Map:   5%|▍         | 10526/216925 [00:13<04:09, 827.28 examples/s]Map:   5%|▌         | 11662/216925 [00:14<04:04, 839.24 examples/s]Map:   5%|▍         | 10829/216925 [00:13<03:57, 867.98 examples/s]Map:   5%|▌         | 11285/216925 [00:14<04:40, 733.77 examples/s]Map:   5%|▍         | 10613/216925 [00:13<04:06, 835.69 examples/s]Map:   5%|▌         | 11752/216925 [00:14<04:01, 851.31 examples/s]Map:   5%|▌         | 10922/216925 [00:13<03:54, 880.23 examples/s]Map:   5%|▌         | 11371/216925 [00:14<04:28, 766.22 examples/s]Map:   5%|▍         | 10704/216925 [00:13<04:01, 852.75 examples/s]Map:   5%|▌         | 11842/216925 [00:14<03:58, 859.85 examples/s]Map:   5%|▌         | 11458/216925 [00:14<04:19, 791.97 examples/s]Map:   5%|▍         | 10797/216925 [00:13<03:56, 871.45 examples/s]Map:   6%|▌         | 11932/216925 [00:14<03:56, 865.70 examples/s]Map:   5%|▌         | 11045/216925 [00:13<04:46, 718.88 examples/s]Map:   5%|▌         | 11547/216925 [00:14<04:11, 817.85 examples/s]Map:   5%|▌         | 10886/216925 [00:13<03:55, 875.74 examples/s]Map:   5%|▌         | 11136/216925 [00:13<04:30, 761.23 examples/s]Map:   5%|▌         | 11637/216925 [00:14<04:04, 838.09 examples/s]Map:   5%|▌         | 10975/216925 [00:13<03:54, 878.30 examples/s]Map:   6%|▌         | 12044/216925 [00:14<04:52, 701.03 examples/s]Map:   5%|▌         | 11228/216925 [00:13<04:18, 795.64 examples/s]Map:   5%|▌         | 11724/216925 [00:15<04:03, 843.79 examples/s]Map:   6%|▌         | 12134/216925 [00:14<04:34, 744.74 examples/s]Map:   5%|▌         | 11322/216925 [00:13<04:07, 830.34 examples/s]Map:   5%|▌         | 11813/216925 [00:15<03:59, 856.08 examples/s]Map:   5%|▌         | 11085/216925 [00:13<04:53, 700.15 examples/s]Map:   6%|▌         | 12222/216925 [00:15<04:23, 776.73 examples/s]Map:   5%|▌         | 11417/216925 [00:13<03:59, 859.46 examples/s]Map:   5%|▌         | 11900/216925 [00:15<03:59, 857.27 examples/s]Map:   5%|▌         | 11177/216925 [00:13<04:34, 749.51 examples/s]Map:   6%|▌         | 12310/216925 [00:15<04:15, 800.54 examples/s]Map:   5%|▌         | 11509/216925 [00:14<03:55, 870.93 examples/s]Map:   6%|▌         | 11988/216925 [00:15<03:57, 862.51 examples/s]Map:   5%|▌         | 11266/216925 [00:14<04:22, 783.94 examples/s]Map:   6%|▌         | 12404/216925 [00:15<04:05, 833.45 examples/s]Map:   5%|▌         | 11360/216925 [00:14<04:09, 822.35 examples/s]Map:   6%|▌         | 12494/216925 [00:15<04:00, 850.05 examples/s]Map:   5%|▌         | 11642/216925 [00:14<03:54, 874.19 examples/s]Map:   6%|▌         | 12086/216925 [00:15<05:03, 674.95 examples/s]Map:   5%|▌         | 11483/216925 [00:14<04:11, 817.43 examples/s]Map:   6%|▌         | 12621/216925 [00:15<04:01, 846.87 examples/s]Map:   5%|▌         | 11769/216925 [00:14<03:58, 861.11 examples/s]Map:   6%|▌         | 12172/216925 [00:15<04:45, 717.20 examples/s]Map:   5%|▌         | 11572/216925 [00:14<04:06, 832.04 examples/s]Map:   6%|▌         | 12709/216925 [00:15<03:58, 855.10 examples/s]Map:   5%|▌         | 11861/216925 [00:14<03:54, 873.82 examples/s]Map:   6%|▌         | 12263/216925 [00:15<04:27, 763.93 examples/s]Map:   5%|▌         | 11664/216925 [00:14<04:00, 853.01 examples/s]Map:   6%|▌         | 12799/216925 [00:15<03:55, 865.42 examples/s]Map:   6%|▌         | 11953/216925 [00:14<03:51, 883.94 examples/s]Map:   6%|▌         | 12351/216925 [00:15<04:17, 793.74 examples/s]Map:   5%|▌         | 11752/216925 [00:14<03:58, 858.83 examples/s]Map:   6%|▌         | 12889/216925 [00:15<03:53, 873.32 examples/s]Map:   6%|▌         | 12442/216925 [00:15<04:08, 821.53 examples/s]Map:   6%|▌         | 12046/216925 [00:14<04:47, 713.70 examples/s]Map:   6%|▌         | 12531/216925 [00:16<04:03, 839.37 examples/s]Map:   5%|▌         | 11878/216925 [00:14<04:01, 848.22 examples/s]Map:   6%|▌         | 12139/216925 [00:14<04:27, 764.18 examples/s]Map:   6%|▌         | 13000/216925 [00:16<04:50, 701.64 examples/s]Map:   6%|▌         | 12625/216925 [00:16<03:56, 864.54 examples/s]Map:   6%|▌         | 11965/216925 [00:14<04:00, 852.97 examples/s]Map:   6%|▌         | 12230/216925 [00:14<04:15, 799.74 examples/s]Map:   6%|▌         | 13087/216925 [00:16<04:35, 740.18 examples/s]Map:   6%|▌         | 12715/216925 [00:16<03:54, 872.17 examples/s]Map:   6%|▌         | 12321/216925 [00:15<04:07, 827.18 examples/s]Map:   6%|▌         | 13180/216925 [00:16<04:19, 784.09 examples/s]Map:   6%|▌         | 12805/216925 [00:16<03:53, 876.03 examples/s]Map:   6%|▌         | 12088/216925 [00:15<04:51, 701.77 examples/s]Map:   6%|▌         | 12410/216925 [00:15<04:03, 840.63 examples/s]Map:   6%|▌         | 13272/216925 [00:16<04:08, 818.57 examples/s]Map:   6%|▌         | 12896/216925 [00:16<03:51, 881.26 examples/s]Map:   6%|▌         | 12173/216925 [00:15<04:39, 733.75 examples/s]Map:   6%|▌         | 12505/216925 [00:15<03:55, 869.00 examples/s]Map:   6%|▌         | 13364/216925 [00:16<04:01, 843.96 examples/s]Map:   6%|▌         | 12260/216925 [00:15<04:27, 763.69 examples/s]Map:   6%|▌         | 12596/216925 [00:15<03:53, 876.76 examples/s]Map:   6%|▌         | 13000/216925 [00:16<04:58, 682.81 examples/s]Map:   6%|▌         | 13492/216925 [00:16<04:01, 843.40 examples/s]Map:   6%|▌         | 12351/216925 [00:15<04:15, 800.29 examples/s]Map:   6%|▌         | 12727/216925 [00:15<03:54, 872.40 examples/s]Map:   6%|▌         | 13090/216925 [00:16<04:37, 733.48 examples/s]Map:   6%|▌         | 12438/216925 [00:15<04:10, 815.27 examples/s]Map:   6%|▋         | 13621/216925 [00:16<04:00, 844.72 examples/s]Map:   6%|▌         | 12821/216925 [00:15<03:49, 888.21 examples/s]Map:   6%|▌         | 13182/216925 [00:16<04:21, 779.12 examples/s]Map:   6%|▌         | 12530/216925 [00:15<04:03, 839.49 examples/s]Map:   6%|▋         | 13715/216925 [00:16<03:54, 864.89 examples/s]Map:   6%|▌         | 12914/216925 [00:15<03:47, 895.81 examples/s]Map:   6%|▌         | 13272/216925 [00:17<04:11, 808.70 examples/s]Map:   6%|▋         | 13808/216925 [00:16<03:50, 879.61 examples/s]Map:   6%|▌         | 12660/216925 [00:15<04:01, 846.12 examples/s]Map:   6%|▌         | 13360/216925 [00:17<04:06, 825.07 examples/s]Map:   6%|▌         | 12753/216925 [00:15<03:56, 863.95 examples/s]Map:   6%|▌         | 13446/216925 [00:17<04:04, 832.31 examples/s]Map:   6%|▋         | 13943/216925 [00:17<03:50, 881.19 examples/s]Map:   6%|▌         | 13047/216925 [00:15<04:42, 720.99 examples/s]Map:   6%|▌         | 12843/216925 [00:15<03:54, 871.81 examples/s]Map:   6%|▌         | 13533/216925 [00:17<04:02, 838.96 examples/s]Map:   6%|▌         | 13136/216925 [00:16<04:29, 756.19 examples/s]Map:   6%|▌         | 12932/216925 [00:16<03:53, 875.44 examples/s]Map:   6%|▋         | 14045/216925 [00:17<04:41, 720.42 examples/s]Map:   6%|▌         | 13226/216925 [00:16<04:18, 789.34 examples/s]Map:   6%|▋         | 13655/216925 [00:17<04:05, 827.40 examples/s]Map:   7%|▋         | 14137/216925 [00:17<04:25, 764.23 examples/s]Map:   6%|▌         | 13316/216925 [00:16<04:09, 815.48 examples/s]Map:   6%|▌         | 13041/216925 [00:16<04:52, 696.43 examples/s]Map:   6%|▋         | 13779/216925 [00:17<04:06, 822.52 examples/s]Map:   7%|▋         | 14229/216925 [00:17<04:13, 799.77 examples/s]Map:   6%|▌         | 13409/216925 [00:16<04:01, 842.13 examples/s]Map:   6%|▌         | 13130/216925 [00:16<04:35, 739.69 examples/s]Map:   6%|▋         | 13864/216925 [00:17<04:05, 826.91 examples/s]Map:   7%|▋         | 14315/216925 [00:17<04:09, 812.68 examples/s]Map:   6%|▌         | 13498/216925 [00:16<03:58, 853.45 examples/s]Map:   6%|▌         | 13253/216925 [00:16<04:26, 763.85 examples/s]Map:   6%|▋         | 13978/216925 [00:17<04:13, 802.15 examples/s]Map:   7%|▋         | 14441/216925 [00:17<04:07, 818.08 examples/s]Map:   6%|▋         | 13628/216925 [00:16<03:57, 855.36 examples/s]Map:   6%|▌         | 13345/216925 [00:16<04:14, 799.55 examples/s]Map:   7%|▋         | 14529/216925 [00:17<04:03, 831.08 examples/s]Map:   6%|▋         | 13718/216925 [00:16<03:55, 863.76 examples/s]Map:   6%|▌         | 13433/216925 [00:16<04:08, 818.08 examples/s]Map:   6%|▋         | 14087/216925 [00:18<05:02, 670.17 examples/s]Map:   7%|▋         | 14617/216925 [00:17<04:00, 840.93 examples/s]Map:   6%|▋         | 13810/216925 [00:16<03:51, 875.71 examples/s]Map:   6%|▌         | 13523/216925 [00:16<04:02, 838.79 examples/s]Map:   7%|▋         | 14170/216925 [00:18<04:49, 701.15 examples/s]Map:   7%|▋         | 14707/216925 [00:18<03:57, 852.94 examples/s]Map:   6%|▋         | 13901/216925 [00:16<03:50, 881.84 examples/s]Map:   7%|▋         | 14253/216925 [00:18<04:37, 730.69 examples/s]Map:   7%|▋         | 14798/216925 [00:18<03:53, 866.71 examples/s]Map:   6%|▋         | 13652/216925 [00:16<04:00, 844.37 examples/s]Map:   6%|▋         | 13994/216925 [00:16<03:47, 890.53 examples/s]Map:   7%|▋         | 14340/216925 [00:18<04:24, 765.36 examples/s]Map:   7%|▋         | 14886/216925 [00:18<03:52, 867.43 examples/s]Map:   6%|▋         | 13742/216925 [00:17<03:56, 857.55 examples/s]Map:   7%|▋         | 14427/216925 [00:18<04:17, 786.22 examples/s]Map:   7%|▋         | 14974/216925 [00:18<03:52, 868.20 examples/s]Map:   6%|▋         | 13834/216925 [00:17<03:53, 870.65 examples/s]Map:   6%|▋         | 14094/216925 [00:17<04:46, 708.17 examples/s]Map:   7%|▋         | 14514/216925 [00:18<04:11, 805.63 examples/s]Map:   7%|▋         | 14180/216925 [00:17<04:33, 742.23 examples/s]Map:   6%|▋         | 13968/216925 [00:17<03:51, 877.32 examples/s]Map:   7%|▋         | 15088/216925 [00:18<04:48, 699.00 examples/s]Map:   7%|▋         | 14270/216925 [00:17<04:19, 780.25 examples/s]Map:   7%|▋         | 14640/216925 [00:18<04:08, 814.95 examples/s]Map:   7%|▋         | 15176/216925 [00:18<04:33, 738.20 examples/s]Map:   7%|▋         | 14363/216925 [00:17<04:07, 818.19 examples/s]Map:   7%|▋         | 14728/216925 [00:18<04:04, 827.40 examples/s]Map:   6%|▋         | 14082/216925 [00:17<04:46, 708.38 examples/s]Map:   7%|▋         | 15261/216925 [00:18<04:24, 762.79 examples/s]Map:   7%|▋         | 14451/216925 [00:17<04:03, 831.41 examples/s]Map:   7%|▋         | 14814/216925 [00:18<04:02, 832.90 examples/s]Map:   7%|▋         | 14168/216925 [00:17<04:34, 738.41 examples/s]Map:   7%|▋         | 15352/216925 [00:18<04:12, 799.70 examples/s]Map:   7%|▋         | 14546/216925 [00:17<03:54, 861.73 examples/s]Map:   7%|▋         | 14904/216925 [00:19<03:58, 847.78 examples/s]Map:   7%|▋         | 14254/216925 [00:17<04:24, 765.16 examples/s]Map:   7%|▋         | 15446/216925 [00:18<04:01, 834.43 examples/s]Map:   7%|▋         | 14639/216925 [00:17<03:50, 876.59 examples/s]Map:   7%|▋         | 14997/216925 [00:19<03:52, 867.49 examples/s]Map:   7%|▋         | 14347/216925 [00:17<04:12, 803.68 examples/s]Map:   7%|▋         | 15535/216925 [00:19<03:57, 848.19 examples/s]Map:   7%|▋         | 14729/216925 [00:17<03:49, 880.20 examples/s]Map:   7%|▋         | 14436/216925 [00:17<04:05, 824.71 examples/s]Map:   7%|▋         | 15626/216925 [00:19<03:52, 864.49 examples/s]Map:   7%|▋         | 14822/216925 [00:18<03:47, 888.53 examples/s]Map:   7%|▋         | 15090/216925 [00:19<04:52, 688.91 examples/s]Map:   7%|▋         | 14522/216925 [00:18<04:03, 832.63 examples/s]Map:   7%|▋         | 15717/216925 [00:19<03:49, 875.54 examples/s]Map:   7%|▋         | 15183/216925 [00:19<04:30, 745.79 examples/s]Map:   7%|▋         | 14954/216925 [00:18<03:49, 880.25 examples/s]Map:   7%|▋         | 14610/216925 [00:18<03:59, 843.89 examples/s]Map:   7%|▋         | 15808/216925 [00:19<03:48, 881.24 examples/s]Map:   7%|▋         | 15271/216925 [00:19<04:19, 777.82 examples/s]Map:   7%|▋         | 14699/216925 [00:18<03:56, 855.15 examples/s]Map:   7%|▋         | 15365/216925 [00:19<04:05, 820.34 examples/s]Map:   7%|▋         | 15045/216925 [00:18<04:46, 704.11 examples/s]Map:   7%|▋         | 15944/216925 [00:19<03:46, 887.78 examples/s]Map:   7%|▋         | 14788/216925 [00:18<03:53, 864.30 examples/s]Map:   7%|▋         | 15455/216925 [00:19<03:59, 840.95 examples/s]Map:   7%|▋         | 15136/216925 [00:18<04:28, 750.82 examples/s]Map:   7%|▋         | 14879/216925 [00:18<03:50, 876.19 examples/s]Map:   7%|▋         | 15542/216925 [00:19<03:57, 846.63 examples/s]Map:   7%|▋         | 16042/216925 [00:19<04:39, 719.59 examples/s]Map:   7%|▋         | 15233/216925 [00:18<04:12, 799.32 examples/s]Map:   7%|▋         | 14970/216925 [00:18<03:48, 883.01 examples/s]Map:   7%|▋         | 15631/216925 [00:19<03:55, 856.41 examples/s]Map:   7%|▋         | 16133/216925 [00:19<04:23, 760.64 examples/s]Map:   7%|▋         | 15325/216925 [00:18<04:03, 827.89 examples/s]Map:   7%|▋         | 16222/216925 [00:19<04:13, 791.02 examples/s]Map:   7%|▋         | 15419/216925 [00:18<03:55, 854.63 examples/s]Map:   7%|▋         | 15751/216925 [00:20<04:02, 830.19 examples/s]Map:   7%|▋         | 15085/216925 [00:18<04:51, 692.43 examples/s]Map:   8%|▊         | 16310/216925 [00:20<04:07, 811.30 examples/s]Map:   7%|▋         | 15513/216925 [00:18<03:49, 877.28 examples/s]Map:   7%|▋         | 15842/216925 [00:20<03:57, 847.90 examples/s]Map:   7%|▋         | 15177/216925 [00:18<04:31, 742.61 examples/s]Map:   8%|▊         | 16402/216925 [00:20<03:59, 838.95 examples/s]Map:   7%|▋         | 15265/216925 [00:19<04:20, 775.04 examples/s]Map:   7%|▋         | 15646/216925 [00:19<03:49, 877.04 examples/s]Map:   7%|▋         | 15966/216925 [00:20<04:02, 827.73 examples/s]Map:   8%|▊         | 16494/216925 [00:20<03:52, 860.24 examples/s]Map:   7%|▋         | 15352/216925 [00:19<04:12, 797.17 examples/s]Map:   7%|▋         | 15741/216925 [00:19<03:45, 893.58 examples/s]Map:   8%|▊         | 16584/216925 [00:20<03:50, 867.30 examples/s]Map:   7%|▋         | 15443/216925 [00:19<04:04, 825.48 examples/s]Map:   7%|▋         | 15832/216925 [00:19<03:44, 894.66 examples/s]Map:   8%|▊         | 16675/216925 [00:20<03:48, 874.70 examples/s]Map:   7%|▋         | 16085/216925 [00:20<04:57, 674.09 examples/s]Map:   7%|▋         | 15531/216925 [00:19<04:00, 837.94 examples/s]Map:   7%|▋         | 15966/216925 [00:19<03:45, 891.08 examples/s]Map:   7%|▋         | 16170/216925 [00:20<04:42, 710.10 examples/s]Map:   7%|▋         | 15619/216925 [00:19<03:56, 849.44 examples/s]Map:   8%|▊         | 16807/216925 [00:20<03:48, 874.55 examples/s]Map:   7%|▋         | 16249/216925 [00:20<04:36, 726.36 examples/s]Map:   7%|▋         | 15712/216925 [00:19<03:51, 869.22 examples/s]Map:   8%|▊         | 16897/216925 [00:20<03:47, 879.17 examples/s]Map:   8%|▊         | 16329/216925 [00:20<04:30, 741.53 examples/s]Map:   7%|▋         | 16088/216925 [00:19<04:38, 721.93 examples/s]Map:   7%|▋         | 15840/216925 [00:19<03:54, 857.46 examples/s]Map:   8%|▊         | 16412/216925 [00:21<04:22, 763.23 examples/s]Map:   7%|▋         | 16182/216925 [00:19<04:21, 766.71 examples/s]Map:   8%|▊         | 17000/216925 [00:20<04:43, 704.11 examples/s]Map:   7%|▋         | 16266/216925 [00:19<04:16, 782.06 examples/s]Map:   7%|▋         | 15953/216925 [00:19<04:05, 819.56 examples/s]Map:   8%|▊         | 17077/216925 [00:21<04:38, 716.89 examples/s]Map:   8%|▊         | 16528/216925 [00:21<04:22, 762.30 examples/s]Map:   8%|▊         | 16356/216925 [00:19<04:08, 808.46 examples/s]Map:   8%|▊         | 17170/216925 [00:21<04:20, 766.43 examples/s]Map:   8%|▊         | 16609/216925 [00:21<04:19, 771.10 examples/s]Map:   8%|▊         | 16446/216925 [00:20<04:01, 830.95 examples/s]Map:   7%|▋         | 16039/216925 [00:20<05:04, 659.48 examples/s]Map:   8%|▊         | 17258/216925 [00:21<04:11, 795.19 examples/s]Map:   8%|▊         | 16725/216925 [00:21<04:20, 768.77 examples/s]Map:   8%|▊         | 16538/216925 [00:20<03:55, 851.78 examples/s]Map:   7%|▋         | 16128/216925 [00:20<04:43, 708.91 examples/s]Map:   8%|▊         | 17344/216925 [00:21<04:06, 810.47 examples/s]Map:   8%|▊         | 16807/216925 [00:21<04:17, 778.29 examples/s]Map:   8%|▊         | 16629/216925 [00:20<03:51, 866.74 examples/s]Map:   7%|▋         | 16215/216925 [00:20<04:30, 743.24 examples/s]Map:   8%|▊         | 17434/216925 [00:21<03:59, 833.00 examples/s]Map:   8%|▊         | 16890/216925 [00:21<04:13, 789.04 examples/s]Map:   8%|▊         | 16720/216925 [00:20<03:48, 874.28 examples/s]Map:   8%|▊         | 16297/216925 [00:20<04:23, 760.11 examples/s]Map:   8%|▊         | 17521/216925 [00:21<03:57, 839.36 examples/s]Map:   8%|▊         | 16972/216925 [00:21<04:11, 793.48 examples/s]Map:   8%|▊         | 16813/216925 [00:20<03:45, 887.96 examples/s]Map:   8%|▊         | 16387/216925 [00:20<04:12, 794.62 examples/s]Map:   8%|▊         | 17609/216925 [00:21<03:54, 850.54 examples/s]Map:   8%|▊         | 16903/216925 [00:20<03:45, 887.15 examples/s]Map:   8%|▊         | 16513/216925 [00:20<04:08, 807.13 examples/s]Map:   8%|▊         | 17737/216925 [00:21<03:54, 849.78 examples/s]Map:   8%|▊         | 16996/216925 [00:20<03:43, 896.29 examples/s]Map:   8%|▊         | 17082/216925 [00:21<05:17, 629.84 examples/s]Map:   8%|▊         | 16602/216925 [00:20<04:02, 825.27 examples/s]Map:   8%|▊         | 17827/216925 [00:21<03:50, 861.99 examples/s]Map:   8%|▊         | 17168/216925 [00:22<04:54, 678.38 examples/s]Map:   8%|▊         | 16689/216925 [00:20<03:59, 834.53 examples/s]Map:   8%|▊         | 17090/216925 [00:20<04:45, 699.96 examples/s]Map:   8%|▊         | 17958/216925 [00:22<03:50, 862.08 examples/s]Map:   8%|▊         | 17252/216925 [00:22<04:39, 715.21 examples/s]Map:   8%|▊         | 16776/216925 [00:20<03:58, 840.86 examples/s]Map:   8%|▊         | 17182/216925 [00:20<04:25, 751.60 examples/s]Map:   8%|▊         | 17331/216925 [00:22<04:32, 732.95 examples/s]Map:   8%|▊         | 16892/216925 [00:21<04:06, 811.97 examples/s]Map:   8%|▊         | 17305/216925 [00:21<04:18, 771.88 examples/s]Map:   8%|▊         | 18085/216925 [00:22<04:44, 698.16 examples/s]Map:   8%|▊         | 17448/216925 [00:22<04:27, 744.68 examples/s]Map:   8%|▊         | 16977/216925 [00:21<04:04, 818.52 examples/s]Map:   8%|▊         | 17396/216925 [00:21<04:08, 803.98 examples/s]Map:   8%|▊         | 18171/216925 [00:22<04:32, 730.58 examples/s]Map:   8%|▊         | 17529/216925 [00:22<04:22, 758.41 examples/s]Map:   8%|▊         | 17486/216925 [00:21<04:00, 828.20 examples/s]Map:   8%|▊         | 18261/216925 [00:22<04:19, 766.39 examples/s]Map:   8%|▊         | 17610/216925 [00:22<04:19, 769.18 examples/s]Map:   8%|▊         | 17086/216925 [00:21<04:57, 670.64 examples/s]Map:   8%|▊         | 17574/216925 [00:21<03:57, 839.66 examples/s]Map:   8%|▊         | 18349/216925 [00:22<04:11, 790.73 examples/s]Map:   8%|▊         | 17695/216925 [00:22<04:12, 788.36 examples/s]Map:   8%|▊         | 17177/216925 [00:21<04:36, 723.52 examples/s]Map:   8%|▊         | 17664/216925 [00:21<03:53, 853.61 examples/s]Map:   8%|▊         | 18434/216925 [00:22<04:07, 802.55 examples/s]Map:   8%|▊         | 17779/216925 [00:22<04:08, 800.32 examples/s]Map:   8%|▊         | 17262/216925 [00:21<04:25, 753.01 examples/s]Map:   8%|▊         | 17757/216925 [00:21<03:48, 872.75 examples/s]Map:   9%|▊         | 18522/216925 [00:22<04:01, 821.32 examples/s]Map:   8%|▊         | 17902/216925 [00:22<04:07, 804.18 examples/s]Map:   8%|▊         | 17347/216925 [00:21<04:16, 776.81 examples/s]Map:   8%|▊         | 17846/216925 [00:21<03:47, 876.21 examples/s]Map:   9%|▊         | 18610/216925 [00:22<03:57, 834.47 examples/s]Map:   8%|▊         | 17984/216925 [00:23<04:07, 804.88 examples/s]Map:   8%|▊         | 17433/216925 [00:21<04:10, 796.58 examples/s]Map:   8%|▊         | 17937/216925 [00:21<03:44, 884.85 examples/s]Map:   9%|▊         | 18697/216925 [00:22<03:55, 842.41 examples/s]Map:   8%|▊         | 17519/216925 [00:21<04:05, 811.98 examples/s]Map:   9%|▊         | 18787/216925 [00:23<03:52, 854.00 examples/s]Map:   8%|▊         | 17606/216925 [00:21<04:01, 826.44 examples/s]Map:   8%|▊         | 18081/216925 [00:23<05:12, 636.95 examples/s]Map:   8%|▊         | 18046/216925 [00:21<04:43, 701.56 examples/s]Map:   9%|▊         | 18878/216925 [00:23<03:48, 866.03 examples/s]Map:   8%|▊         | 17695/216925 [00:22<03:57, 840.22 examples/s]Map:   8%|▊         | 18167/216925 [00:23<04:49, 685.84 examples/s]Map:   8%|▊         | 18137/216925 [00:22<04:24, 750.78 examples/s]Map:   9%|▊         | 18969/216925 [00:23<03:46, 874.86 examples/s]Map:   8%|▊         | 18243/216925 [00:23<04:43, 700.49 examples/s]Map:   8%|▊         | 18220/216925 [00:22<04:18, 768.36 examples/s]Map:   8%|▊         | 17814/216925 [00:22<04:03, 818.72 examples/s]Map:   8%|▊         | 18321/216925 [00:23<04:35, 719.71 examples/s]Map:   8%|▊         | 18314/216925 [00:22<04:05, 807.80 examples/s]Map:   8%|▊         | 17906/216925 [00:22<03:55, 843.94 examples/s]Map:   9%|▉         | 19092/216925 [00:23<04:47, 687.52 examples/s]Map:   8%|▊         | 18406/216925 [00:23<04:24, 750.18 examples/s]Map:   8%|▊         | 18401/216925 [00:22<04:00, 824.08 examples/s]Map:   8%|▊         | 17996/216925 [00:22<03:52, 855.25 examples/s]Map:   9%|▉         | 19182/216925 [00:23<04:29, 733.31 examples/s]Map:   9%|▊         | 18495/216925 [00:23<04:12, 784.57 examples/s]Map:   9%|▊         | 18496/216925 [00:22<03:51, 857.52 examples/s]Map:   9%|▉         | 19275/216925 [00:23<04:13, 779.50 examples/s]Map:   9%|▊         | 18578/216925 [00:23<04:09, 795.14 examples/s]Map:   9%|▊         | 18590/216925 [00:22<03:46, 877.25 examples/s]Map:   8%|▊         | 18088/216925 [00:22<04:50, 685.61 examples/s]Map:   9%|▉         | 19364/216925 [00:23<04:05, 804.91 examples/s]Map:   9%|▊         | 18662/216925 [00:24<04:06, 804.88 examples/s]Map:   9%|▊         | 18685/216925 [00:22<03:41, 895.95 examples/s]Map:   8%|▊         | 18178/216925 [00:22<04:30, 734.75 examples/s]Map:   9%|▉         | 19452/216925 [00:23<03:59, 823.09 examples/s]Map:   9%|▊         | 18745/216925 [00:24<04:04, 810.18 examples/s]Map:   9%|▊         | 18778/216925 [00:22<03:39, 903.76 examples/s]Map:   8%|▊         | 18265/216925 [00:22<04:19, 765.21 examples/s]Map:   9%|▉         | 19544/216925 [00:24<03:53, 844.41 examples/s]Map:   9%|▊         | 18835/216925 [00:24<03:58, 831.83 examples/s]Map:   9%|▊         | 18872/216925 [00:22<03:37, 912.23 examples/s]Map:   8%|▊         | 18356/216925 [00:22<04:07, 800.73 examples/s]Map:   9%|▉         | 19634/216925 [00:24<03:50, 857.48 examples/s]Map:   9%|▊         | 18921/216925 [00:24<03:57, 834.29 examples/s]Map:   9%|▊         | 18441/216925 [00:23<04:03, 813.76 examples/s]Map:   9%|▉         | 19726/216925 [00:24<03:46, 869.94 examples/s]Map:   9%|▊         | 18528/216925 [00:23<03:59, 827.63 examples/s]Map:   9%|▉         | 19000/216925 [00:23<04:32, 725.32 examples/s]Map:   9%|▉         | 19817/216925 [00:24<03:44, 878.79 examples/s]Map:   9%|▊         | 18620/216925 [00:23<03:53, 850.77 examples/s]Map:   9%|▉         | 19040/216925 [00:24<04:57, 665.33 examples/s]Map:   9%|▉         | 19092/216925 [00:23<04:17, 768.58 examples/s]Map:   9%|▉         | 19909/216925 [00:24<03:42, 885.78 examples/s]Map:   9%|▉         | 19126/216925 [00:24<04:40, 706.40 examples/s]Map:   9%|▉         | 19181/216925 [00:23<04:08, 795.63 examples/s]Map:   9%|▊         | 18750/216925 [00:23<03:52, 852.28 examples/s]Map:   9%|▉         | 19210/216925 [00:24<04:28, 737.36 examples/s]Map:   9%|▉         | 19270/216925 [00:23<04:01, 818.22 examples/s]Map:   9%|▉         | 20000/216925 [00:24<04:47, 684.53 examples/s]Map:   9%|▊         | 18842/216925 [00:23<03:48, 867.89 examples/s]Map:   9%|▉         | 19301/216925 [00:24<04:13, 779.07 examples/s]Map:   9%|▉         | 19362/216925 [00:23<03:54, 841.65 examples/s]Map:   9%|▉         | 20091/216925 [00:24<04:27, 736.88 examples/s]Map:   9%|▊         | 18932/216925 [00:23<03:46, 873.17 examples/s]Map:   9%|▉         | 19383/216925 [00:24<04:10, 788.31 examples/s]Map:   9%|▉         | 19454/216925 [00:23<03:49, 860.26 examples/s]Map:   9%|▉         | 20179/216925 [00:24<04:14, 772.82 examples/s]Map:   9%|▉         | 19468/216925 [00:25<04:05, 805.07 examples/s]Map:   9%|▉         | 19547/216925 [00:23<03:45, 876.37 examples/s]Map:   9%|▉         | 20271/216925 [00:24<04:02, 809.94 examples/s]Map:   9%|▉         | 19042/216925 [00:23<04:42, 699.76 examples/s]Map:   9%|▉         | 19559/216925 [00:25<03:57, 831.54 examples/s]Map:   9%|▉         | 19640/216925 [00:23<03:42, 888.47 examples/s]Map:   9%|▉         | 20360/216925 [00:25<03:56, 830.22 examples/s]Map:   9%|▉         | 19133/216925 [00:23<04:24, 746.67 examples/s]Map:   9%|▉         | 19645/216925 [00:25<03:55, 838.47 examples/s]Map:   9%|▉         | 20450/216925 [00:25<03:51, 846.99 examples/s]Map:   9%|▉         | 19222/216925 [00:24<04:12, 781.73 examples/s]Map:   9%|▉         | 19777/216925 [00:24<03:40, 895.08 examples/s]Map:   9%|▉         | 19731/216925 [00:25<03:53, 842.79 examples/s]Map:   9%|▉         | 20537/216925 [00:25<03:51, 849.99 examples/s]Map:   9%|▉         | 19313/216925 [00:24<04:02, 813.98 examples/s]Map:   9%|▉         | 19868/216925 [00:24<03:39, 896.08 examples/s]Map:   9%|▉         | 19818/216925 [00:25<03:52, 848.05 examples/s]Map:  10%|▉         | 20627/216925 [00:25<03:47, 861.40 examples/s]Map:   9%|▉         | 19404/216925 [00:24<03:56, 836.03 examples/s]Map:   9%|▉         | 19960/216925 [00:24<03:38, 900.15 examples/s]Map:  10%|▉         | 20718/216925 [00:25<03:45, 871.91 examples/s]Map:   9%|▉         | 19926/216925 [00:25<04:08, 793.87 examples/s]Map:   9%|▉         | 19496/216925 [00:24<03:50, 857.65 examples/s]Map:  10%|▉         | 20807/216925 [00:25<03:44, 873.40 examples/s]Map:   9%|▉         | 20080/216925 [00:24<04:40, 701.42 examples/s]Map:   9%|▉         | 19624/216925 [00:24<03:51, 853.61 examples/s]Map:  10%|▉         | 20934/216925 [00:25<03:48, 857.97 examples/s]Map:   9%|▉         | 20174/216925 [00:24<04:21, 753.46 examples/s]Map:   9%|▉         | 19714/216925 [00:24<03:48, 863.29 examples/s]Map:   9%|▉         | 20040/216925 [00:25<05:29, 597.85 examples/s]Map:   9%|▉         | 20263/216925 [00:24<04:10, 784.94 examples/s]Map:   9%|▉         | 19802/216925 [00:24<03:47, 866.62 examples/s]Map:   9%|▉         | 20129/216925 [00:26<04:59, 656.30 examples/s]Map:  10%|▉         | 21046/216925 [00:25<04:39, 701.34 examples/s]Map:   9%|▉         | 20353/216925 [00:24<04:01, 812.67 examples/s]Map:   9%|▉         | 19897/216925 [00:24<03:41, 889.02 examples/s]Map:   9%|▉         | 20213/216925 [00:26<04:42, 696.69 examples/s]Map:  10%|▉         | 21139/216925 [00:26<04:20, 750.71 examples/s]Map:   9%|▉         | 20445/216925 [00:24<03:53, 839.90 examples/s]Map:   9%|▉         | 20297/216925 [00:26<04:29, 728.59 examples/s]Map:  10%|▉         | 21237/216925 [00:26<04:03, 804.43 examples/s]Map:   9%|▉         | 20536/216925 [00:24<03:49, 853.96 examples/s]Map:   9%|▉         | 20000/216925 [00:24<04:35, 714.20 examples/s]Map:   9%|▉         | 20386/216925 [00:26<04:16, 767.29 examples/s]Map:  10%|▉         | 21331/216925 [00:26<03:53, 837.12 examples/s]Map:  10%|▉         | 20629/216925 [00:25<03:45, 871.58 examples/s]Map:   9%|▉         | 20086/216925 [00:25<04:23, 746.56 examples/s]Map:   9%|▉         | 20475/216925 [00:26<04:06, 798.10 examples/s]Map:  10%|▉         | 21420/216925 [00:26<03:50, 847.68 examples/s]Map:   9%|▉         | 20178/216925 [00:25<04:09, 789.01 examples/s]Map:   9%|▉         | 20562/216925 [00:26<04:01, 814.70 examples/s]Map:  10%|▉         | 20762/216925 [00:25<03:44, 873.77 examples/s]Map:  10%|▉         | 21511/216925 [00:26<03:46, 861.07 examples/s]Map:   9%|▉         | 20268/216925 [00:25<04:00, 816.13 examples/s]Map:  10%|▉         | 20650/216925 [00:26<03:56, 830.10 examples/s]Map:  10%|▉         | 20856/216925 [00:25<03:40, 889.16 examples/s]Map:  10%|▉         | 21604/216925 [00:26<03:43, 875.62 examples/s]Map:   9%|▉         | 20361/216925 [00:25<03:52, 846.09 examples/s]Map:  10%|▉         | 20735/216925 [00:26<03:55, 833.24 examples/s]Map:  10%|▉         | 20951/216925 [00:25<03:37, 902.89 examples/s]Map:  10%|█         | 21700/216925 [00:26<03:38, 894.22 examples/s]Map:   9%|▉         | 20455/216925 [00:25<03:45, 870.84 examples/s]Map:  10%|▉         | 20824/216925 [00:26<03:51, 848.12 examples/s]Map:  10%|█         | 21827/216925 [00:26<03:43, 871.58 examples/s]Map:   9%|▉         | 20586/216925 [00:25<03:46, 867.28 examples/s]Map:  10%|▉         | 21046/216925 [00:25<04:41, 696.11 examples/s]Map:  10%|▉         | 20952/216925 [00:26<03:51, 845.09 examples/s]Map:  10%|█         | 21917/216925 [00:26<03:42, 875.92 examples/s]Map:  10%|▉         | 20676/216925 [00:25<03:44, 873.12 examples/s]Map:  10%|▉         | 21137/216925 [00:25<04:22, 744.78 examples/s]Map:  10%|▉         | 21232/216925 [00:25<04:06, 793.56 examples/s]Map:  10%|▉         | 21046/216925 [00:27<04:48, 678.09 examples/s]Map:  10%|▉         | 20808/216925 [00:25<03:44, 872.40 examples/s]Map:  10%|▉         | 21324/216925 [00:25<03:57, 822.53 examples/s]Map:  10%|▉         | 21134/216925 [00:27<04:30, 723.12 examples/s]Map:  10%|█         | 22045/216925 [00:27<04:31, 718.70 examples/s]Map:  10%|▉         | 20898/216925 [00:25<03:43, 875.86 examples/s]Map:  10%|▉         | 21415/216925 [00:26<03:51, 844.23 examples/s]Map:  10%|▉         | 21224/216925 [00:27<04:15, 764.57 examples/s]Map:  10%|█         | 22132/216925 [00:27<04:19, 751.45 examples/s]Map:  10%|▉         | 20989/216925 [00:26<03:42, 880.78 examples/s]Map:  10%|▉         | 21504/216925 [00:26<03:48, 854.50 examples/s]Map:  10%|▉         | 21316/216925 [00:27<04:03, 804.05 examples/s]Map:  10%|█         | 22224/216925 [00:27<04:06, 790.08 examples/s]Map:  10%|▉         | 21592/216925 [00:26<03:47, 859.04 examples/s]Map:  10%|▉         | 21402/216925 [00:27<03:59, 817.39 examples/s]Map:  10%|█         | 22314/216925 [00:27<03:58, 817.05 examples/s]Map:  10%|▉         | 21085/216925 [00:26<04:38, 702.99 examples/s]Map:  10%|▉         | 21684/216925 [00:26<03:44, 871.23 examples/s]Map:  10%|█         | 22403/216925 [00:27<03:52, 835.44 examples/s]Map:  10%|▉         | 21492/216925 [00:27<03:53, 835.90 examples/s]Map:  10%|▉         | 21181/216925 [00:26<04:17, 760.95 examples/s]Map:  10%|█         | 22492/216925 [00:27<03:49, 848.05 examples/s]Map:  10%|▉         | 21581/216925 [00:27<03:50, 846.31 examples/s]Map:  10%|▉         | 21268/216925 [00:26<04:09, 785.00 examples/s]Map:  10%|█         | 21819/216925 [00:26<03:42, 876.46 examples/s]Map:  10%|▉         | 21361/216925 [00:26<03:57, 821.94 examples/s]Map:  10%|█         | 21909/216925 [00:26<03:41, 880.60 examples/s]Map:  10%|█         | 22621/216925 [00:27<03:49, 845.58 examples/s]Map:  10%|▉         | 21681/216925 [00:27<04:11, 775.70 examples/s]Map:  10%|▉         | 21482/216925 [00:26<04:00, 811.92 examples/s]Map:  10%|█         | 22745/216925 [00:27<03:52, 834.19 examples/s]Map:  10%|█         | 21777/216925 [00:28<04:30, 720.96 examples/s]Map:  10%|█         | 22000/216925 [00:26<04:47, 677.79 examples/s]Map:  10%|▉         | 21572/216925 [00:26<03:54, 832.26 examples/s]Map:  11%|█         | 22837/216925 [00:28<03:47, 853.71 examples/s]Map:  10%|█         | 21861/216925 [00:28<04:20, 747.47 examples/s]Map:  10%|█         | 22090/216925 [00:26<04:27, 727.25 examples/s]Map:  10%|▉         | 21662/216925 [00:26<03:50, 846.32 examples/s]Map:  11%|█         | 22928/216925 [00:28<03:43, 866.22 examples/s]Map:  10%|█         | 21948/216925 [00:28<04:10, 778.08 examples/s]Map:  10%|█         | 22181/216925 [00:26<04:12, 771.70 examples/s]Map:  10%|█         | 21750/216925 [00:27<03:49, 850.56 examples/s]Map:  10%|█         | 22274/216925 [00:27<04:00, 809.49 examples/s]Map:  10%|█         | 21837/216925 [00:27<03:48, 852.90 examples/s]Map:  10%|█         | 22042/216925 [00:28<05:06, 635.62 examples/s]Map:  11%|█         | 23043/216925 [00:28<04:35, 704.51 examples/s]Map:  10%|█         | 22363/216925 [00:27<03:55, 827.35 examples/s]Map:  10%|█         | 21927/216925 [00:27<03:46, 861.72 examples/s]Map:  10%|█         | 22127/216925 [00:28<04:44, 684.58 examples/s]Map:  11%|█         | 23136/216925 [00:28<04:17, 752.24 examples/s]Map:  10%|█         | 22453/216925 [00:27<03:50, 845.17 examples/s]Map:  10%|█         | 22218/216925 [00:28<04:23, 738.68 examples/s]Map:  11%|█         | 23224/216925 [00:28<04:07, 781.99 examples/s]Map:  10%|█         | 22544/216925 [00:27<03:46, 858.76 examples/s]Map:  10%|█         | 22043/216925 [00:27<04:42, 690.65 examples/s]Map:  10%|█         | 22300/216925 [00:28<04:17, 756.56 examples/s]Map:  11%|█         | 23311/216925 [00:28<04:01, 801.06 examples/s]Map:  10%|█         | 22638/216925 [00:27<03:42, 874.43 examples/s]Map:  10%|█         | 22136/216925 [00:27<04:22, 743.11 examples/s]Map:  10%|█         | 22384/216925 [00:28<04:10, 776.18 examples/s]Map:  11%|█         | 23398/216925 [00:28<03:56, 818.73 examples/s]Map:  10%|█         | 22730/216925 [00:27<03:39, 883.94 examples/s]Map:  10%|█         | 22222/216925 [00:27<04:12, 770.43 examples/s]Map:  10%|█         | 22475/216925 [00:29<04:00, 808.25 examples/s]Map:  11%|█         | 23489/216925 [00:28<03:50, 840.39 examples/s]Map:  11%|█         | 22867/216925 [00:27<03:38, 888.61 examples/s]Map:  10%|█         | 22311/216925 [00:27<04:03, 798.87 examples/s]Map:  10%|█         | 22563/216925 [00:29<03:56, 822.92 examples/s]Map:  11%|█         | 23579/216925 [00:28<03:46, 852.71 examples/s]Map:  10%|█         | 22650/216925 [00:29<03:53, 830.75 examples/s]Map:  11%|█         | 22992/216925 [00:27<03:44, 865.44 examples/s]Map:  10%|█         | 22428/216925 [00:27<04:06, 790.18 examples/s]Map:  11%|█         | 23703/216925 [00:29<03:51, 836.43 examples/s]Map:  10%|█         | 22514/216925 [00:28<04:01, 805.88 examples/s]Map:  10%|█         | 22737/216925 [00:29<04:25, 730.56 examples/s]Map:  11%|█         | 23796/216925 [00:29<03:45, 855.18 examples/s]Map:  11%|█         | 23095/216925 [00:28<04:31, 712.92 examples/s]Map:  10%|█         | 22598/216925 [00:28<03:59, 811.96 examples/s]Map:  11%|█         | 23883/216925 [00:29<03:45, 856.21 examples/s]Map:  11%|█         | 22835/216925 [00:29<04:37, 700.33 examples/s]Map:  11%|█         | 23186/216925 [00:28<04:16, 755.18 examples/s]Map:  10%|█         | 22685/216925 [00:28<03:55, 824.63 examples/s]Map:  11%|█         | 22919/216925 [00:29<04:24, 733.42 examples/s]Map:  11%|█         | 23282/216925 [00:28<04:01, 800.39 examples/s]Map:  11%|█         | 22806/216925 [00:28<03:58, 815.12 examples/s]Map:  11%|█         | 24000/216925 [00:29<04:40, 688.38 examples/s]Map:  11%|█         | 23374/216925 [00:28<03:54, 826.42 examples/s]Map:  11%|█         | 22891/216925 [00:28<03:56, 821.06 examples/s]Map:  11%|█         | 24087/216925 [00:29<04:25, 727.41 examples/s]Map:  11%|█         | 23000/216925 [00:29<05:26, 593.25 examples/s]Map:  11%|█         | 23469/216925 [00:28<03:45, 856.05 examples/s]Map:  11%|█         | 22975/216925 [00:28<03:55, 823.75 examples/s]Map:  11%|█         | 24174/216925 [00:29<04:13, 760.52 examples/s]Map:  11%|█         | 23084/216925 [00:29<04:59, 647.80 examples/s]Map:  11%|█         | 23562/216925 [00:28<03:41, 874.63 examples/s]Map:  11%|█         | 24262/216925 [00:29<04:04, 789.33 examples/s]Map:  11%|█         | 23165/216925 [00:30<04:43, 683.29 examples/s]Map:  11%|█         | 23659/216925 [00:28<03:35, 896.52 examples/s]Map:  11%|█         | 24352/216925 [00:29<03:56, 814.88 examples/s]Map:  11%|█         | 23246/216925 [00:30<04:31, 713.55 examples/s]Map:  11%|█         | 23083/216925 [00:28<04:53, 659.82 examples/s]Map:  11%|█         | 23796/216925 [00:28<03:35, 898.06 examples/s]Map:  11%|█▏        | 24439/216925 [00:30<03:53, 825.61 examples/s]Map:  11%|█         | 23329/216925 [00:30<04:21, 740.99 examples/s]Map:  11%|█         | 23169/216925 [00:28<04:35, 703.26 examples/s]Map:  11%|█▏        | 24527/216925 [00:30<03:49, 838.33 examples/s]Map:  11%|█         | 23417/216925 [00:30<04:09, 774.19 examples/s]Map:  11%|█         | 23248/216925 [00:29<04:29, 719.03 examples/s]Map:  11%|█         | 23924/216925 [00:29<03:39, 879.10 examples/s]Map:  11%|█         | 23326/216925 [00:29<04:24, 732.09 examples/s]Map:  11%|█▏        | 24648/216925 [00:30<03:53, 822.43 examples/s]Map:  11%|█         | 23541/216925 [00:30<04:05, 787.20 examples/s]Map:  11%|█         | 23410/216925 [00:29<04:15, 758.40 examples/s]Map:  11%|█▏        | 24734/216925 [00:30<03:51, 830.71 examples/s]Map:  11%|█         | 23630/216925 [00:30<03:58, 811.54 examples/s]Map:  11%|█         | 24042/216925 [00:29<04:27, 719.94 examples/s]Map:  11%|█         | 23494/216925 [00:29<04:08, 778.38 examples/s]Map:  11%|█▏        | 24823/216925 [00:30<03:47, 846.21 examples/s]Map:  11%|█         | 23714/216925 [00:30<03:56, 817.59 examples/s]Map:  11%|█         | 24139/216925 [00:29<04:10, 770.32 examples/s]Map:  11%|█         | 23577/216925 [00:29<04:04, 789.79 examples/s]Map:  11%|█▏        | 24912/216925 [00:30<03:44, 856.69 examples/s]Map:  11%|█         | 24232/216925 [00:29<03:58, 806.39 examples/s]Map:  11%|█         | 23837/216925 [00:30<03:56, 815.26 examples/s]Map:  11%|█         | 23664/216925 [00:29<03:58, 811.24 examples/s]Map:  11%|█         | 24321/216925 [00:29<03:53, 826.16 examples/s]Map:  11%|█         | 23751/216925 [00:29<03:54, 824.75 examples/s]Map:  12%|█▏        | 25000/216925 [00:30<04:45, 671.57 examples/s]Map:  11%|█         | 23962/216925 [00:30<03:56, 817.33 examples/s]Map:  11%|█▏        | 24413/216925 [00:29<03:46, 848.09 examples/s]Map:  11%|█         | 23835/216925 [00:29<03:53, 826.16 examples/s]Map:  12%|█▏        | 25088/216925 [00:30<04:26, 719.02 examples/s]Map:  11%|█▏        | 24510/216925 [00:29<03:39, 878.17 examples/s]Map:  12%|█▏        | 25178/216925 [00:31<04:11, 762.56 examples/s]Map:  11%|█         | 23959/216925 [00:29<03:54, 821.20 examples/s]Map:  11%|█         | 24087/216925 [00:31<04:43, 681.35 examples/s]Map:  11%|█▏        | 24644/216925 [00:29<03:38, 879.80 examples/s]Map:  12%|█▏        | 25267/216925 [00:31<04:01, 792.76 examples/s]Map:  11%|█         | 24172/216925 [00:31<04:29, 714.29 examples/s]Map:  12%|█▏        | 25355/216925 [00:31<03:55, 814.60 examples/s]Map:  11%|█▏        | 24778/216925 [00:30<03:37, 882.27 examples/s]Map:  11%|█         | 24256/216925 [00:31<04:20, 741.03 examples/s]Map:  11%|█         | 24085/216925 [00:30<04:43, 680.69 examples/s]Map:  12%|█▏        | 25444/216925 [00:31<03:49, 834.23 examples/s]Map:  11%|█         | 24338/216925 [00:31<04:14, 757.96 examples/s]Map:  11%|█         | 24163/216925 [00:30<04:35, 698.98 examples/s]Map:  11%|█▏        | 24904/216925 [00:30<03:41, 865.51 examples/s]Map:  12%|█▏        | 25559/216925 [00:31<03:58, 802.94 examples/s]Map:  11%|█         | 24239/216925 [00:30<04:30, 711.41 examples/s]Map:  11%|█▏        | 24459/216925 [00:31<04:10, 769.24 examples/s]Map:  12%|█▏        | 25648/216925 [00:31<03:52, 821.76 examples/s]Map:  11%|█         | 24322/216925 [00:30<04:20, 738.22 examples/s]Map:  12%|█▏        | 25000/216925 [00:30<04:34, 699.71 examples/s]Map:  11%|█▏        | 24543/216925 [00:31<04:05, 783.26 examples/s]Map:  12%|█▏        | 25741/216925 [00:31<03:46, 845.70 examples/s]Map:  11%|█▏        | 24406/216925 [00:30<04:12, 763.34 examples/s]Map:  12%|█▏        | 25091/216925 [00:30<04:18, 741.50 examples/s]Map:  11%|█▏        | 24624/216925 [00:31<04:03, 789.15 examples/s]Map:  12%|█▏        | 25832/216925 [00:31<03:42, 858.28 examples/s]Map:  11%|█▏        | 24496/216925 [00:30<04:02, 794.81 examples/s]Map:  12%|█▏        | 25185/216925 [00:30<04:04, 785.73 examples/s]Map:  11%|█▏        | 24709/216925 [00:31<03:59, 802.14 examples/s]Map:  12%|█▏        | 25924/216925 [00:31<03:38, 873.52 examples/s]Map:  11%|█▏        | 24581/216925 [00:30<03:57, 808.54 examples/s]Map:  12%|█▏        | 25276/216925 [00:30<03:55, 815.19 examples/s]Map:  11%|█▏        | 24794/216925 [00:32<03:56, 812.82 examples/s]Map:  11%|█▏        | 24667/216925 [00:30<03:54, 821.36 examples/s]Map:  12%|█▏        | 25372/216925 [00:30<03:46, 847.38 examples/s]Map:  11%|█▏        | 24881/216925 [00:32<03:52, 826.44 examples/s]Map:  11%|█▏        | 24755/216925 [00:30<03:50, 834.69 examples/s]Map:  12%|█▏        | 26045/216925 [00:32<04:27, 712.27 examples/s]Map:  12%|█▏        | 25467/216925 [00:30<03:40, 870.13 examples/s]Map:  11%|█��        | 24846/216925 [00:31<03:44, 853.81 examples/s]Map:  12%|█▏        | 26131/216925 [00:32<04:15, 745.30 examples/s]Map:  12%|█▏        | 25601/216925 [00:31<03:38, 876.57 examples/s]Map:  12%|█▏        | 25000/216925 [00:32<04:48, 664.68 examples/s]Map:  12%|█▏        | 26216/216925 [00:32<04:08, 768.36 examples/s]Map:  12%|█▏        | 24970/216925 [00:31<03:47, 841.93 examples/s]Map:  12%|█▏        | 25694/216925 [00:31<03:35, 888.37 examples/s]Map:  12%|█▏        | 25086/216925 [00:32<04:30, 708.49 examples/s]Map:  12%|█▏        | 26305/216925 [00:32<03:59, 797.42 examples/s]Map:  12%|█▏        | 26393/216925 [00:32<03:53, 817.69 examples/s]Map:  12%|█▏        | 25820/216925 [00:31<03:40, 867.16 examples/s]Map:  12%|█▏        | 25186/216925 [00:32<04:37, 691.51 examples/s]Map:  12%|█▏        | 25087/216925 [00:31<04:38, 688.86 examples/s]Map:  12%|█▏        | 26484/216925 [00:32<03:46, 839.94 examples/s]Map:  12%|█▏        | 25910/216925 [00:31<03:38, 873.20 examples/s]Map:  12%|█▏        | 25267/216925 [00:32<04:26, 718.13 examples/s]Map:  12%|█▏        | 25171/216925 [00:31<04:25, 721.22 examples/s]Map:  12%|█▏        | 26571/216925 [00:32<03:46, 841.13 examples/s]Map:  12%|█▏        | 25344/216925 [00:32<04:22, 728.81 examples/s]Map:  12%|█▏        | 25423/216925 [00:32<04:18, 741.89 examples/s]Map:  12%|█▏        | 26000/216925 [00:31<04:42, 675.55 examples/s]Map:  12%|█▏        | 25286/216925 [00:31<04:21, 731.60 examples/s]Map:  12%|█▏        | 26697/216925 [00:32<03:47, 837.77 examples/s]Map:  12%|█▏        | 25511/216925 [00:33<04:06, 776.18 examples/s]Map:  12%|█▏        | 26091/216925 [00:31<04:22, 726.86 examples/s]Map:  12%|█▏        | 25367/216925 [00:31<04:16, 747.86 examples/s]Map:  12%|█▏        | 26787/216925 [00:32<03:43, 849.98 examples/s]Map:  12%|█▏        | 26183/216925 [00:31<04:06, 772.72 examples/s]Map:  12%|█▏        | 25457/216925 [00:31<04:04, 783.13 examples/s]Map:  12%|█▏        | 26876/216925 [00:33<03:41, 857.24 examples/s]Map:  12%|█▏        | 25632/216925 [00:33<04:04, 782.28 examples/s]Map:  12%|█▏        | 26274/216925 [00:31<03:56, 804.66 examples/s]Map:  12%|█▏        | 25541/216925 [00:31<04:00, 796.61 examples/s]Map:  12%|█▏        | 25713/216925 [00:33<04:03, 786.40 examples/s]Map:  12%|█▏        | 26362/216925 [00:32<03:51, 821.87 examples/s]Map:  12%|█▏        | 25623/216925 [00:32<03:59, 797.18 examples/s]Map:  12%|█▏        | 27000/216925 [00:33<04:34, 692.15 examples/s]Map:  12%|█▏        | 26451/216925 [00:32<03:47, 837.95 examples/s]Map:  12%|█▏        | 25833/216925 [00:33<04:02, 786.49 examples/s]Map:  12%|█▏        | 25710/216925 [00:32<03:54, 816.30 examples/s]Map:  12%|█▏        | 27086/216925 [00:33<04:20, 727.89 examples/s]Map:  12%|█▏        | 25914/216925 [00:33<04:02, 788.59 examples/s]Map:  12%|█▏        | 25796/216925 [00:32<03:51, 826.79 examples/s]Map:  12%|█▏        | 26581/216925 [00:32<03:45, 845.50 examples/s]Map:  13%|█▎        | 27178/216925 [00:33<04:05, 771.99 examples/s]Map:  12%|█▏        | 25887/216925 [00:32<03:45, 847.12 examples/s]Map:  12%|█▏        | 25994/216925 [00:33<04:03, 785.72 examples/s]Map:  12%|█▏        | 26674/216925 [00:32<03:39, 866.19 examples/s]Map:  13%|█▎        | 27266/216925 [00:33<03:58, 796.12 examples/s]Map:  12%|█▏        | 25976/216925 [00:32<03:43, 855.94 examples/s]Map:  12%|█▏        | 26765/216925 [00:32<03:36, 876.43 examples/s]Map:  13%|█▎        | 27357/216925 [00:33<03:49, 824.36 examples/s]Map:  12%|█▏        | 26111/216925 [00:33<05:09, 616.70 examples/s]Map:  13%|█▎        | 27449/216925 [00:33<03:43, 846.20 examples/s]Map:  12%|█▏        | 26898/216925 [00:32<03:37, 874.00 examples/s]Map:  12%|█▏        | 26091/216925 [00:32<04:32, 699.78 examples/s]Map:  12%|█▏        | 26195/216925 [00:34<04:48, 661.75 examples/s]Map:  13%|█▎        | 27539/216925 [00:33<03:40, 858.38 examples/s]Map:  12%|█▏        | 26991/216925 [00:32<03:34, 885.83 examples/s]Map:  12%|█▏        | 26178/216925 [00:32<04:18, 738.05 examples/s]Map:  12%|█▏        | 26281/216925 [00:34<04:30, 703.72 examples/s]Map:  13%|█▎        | 27629/216925 [00:34<03:37, 868.42 examples/s]Map:  12%|█▏        | 26265/216925 [00:32<04:07, 769.24 examples/s]Map:  12%|█▏        | 26397/216925 [00:34<04:22, 724.55 examples/s]Map:  12%|█▏        | 26350/216925 [00:32<04:01, 788.25 examples/s]Map:  13%|█▎        | 27752/216925 [00:34<03:43, 846.36 examples/s]Map:  13%|█▎        | 27124/216925 [00:33<04:31, 699.57 examples/s]Map:  12%|█▏        | 26480/216925 [00:34<04:14, 748.44 examples/s]Map:  12%|█▏        | 26438/216925 [00:33<03:55, 809.86 examples/s]Map:  13%|█▎        | 27840/216925 [00:34<03:41, 853.50 examples/s]Map:  13%|█▎        | 27214/216925 [00:33<04:15, 741.07 examples/s]Map:  12%|█▏        | 26561/216925 [00:34<04:10, 759.75 examples/s]Map:  12%|█▏        | 26526/216925 [00:33<03:49, 827.88 examples/s]Map:  13%|█▎        | 27308/216925 [00:33<04:01, 785.58 examples/s]Map:  13%|█▎        | 27969/216925 [00:34<03:41, 852.38 examples/s]Map:  12%|█▏        | 26645/216925 [00:34<04:04, 778.07 examples/s]Map:  12%|█▏        | 26617/216925 [00:33<03:43, 850.35 examples/s]Map:  13%|█▎        | 27400/216925 [00:33<03:52, 816.70 examples/s]Map:  12%|█▏        | 26727/216925 [00:34<04:01, 786.67 examples/s]Map:  12%|█▏        | 26707/216925 [00:33<03:41, 859.81 examples/s]Map:  13%|█▎        | 27491/216925 [00:33<03:45, 839.98 examples/s]Map:  13%|█▎        | 28088/216925 [00:34<04:28, 702.79 examples/s]Map:  12%|█▏        | 26813/216925 [00:34<03:55, 805.94 examples/s]Map:  12%|█▏        | 26796/216925 [00:33<03:39, 864.58 examples/s]Map:  13%|█▎        | 27587/216925 [00:33<03:37, 869.08 examples/s]Map:  13%|█▎        | 28180/216925 [00:34<04:13, 745.98 examples/s]Map:  12%|█▏        | 26902/216925 [00:34<03:49, 827.59 examples/s]Map:  12%|█▏        | 26887/216925 [00:33<03:37, 875.09 examples/s]Map:  13%|█▎        | 27678/216925 [00:33<03:35, 876.99 examples/s]Map:  13%|█▎        | 28265/216925 [00:34<04:05, 769.32 examples/s]Map:  12%|█▏        | 26989/216925 [00:35<03:47, 835.98 examples/s]Map:  12%|█▏        | 26978/216925 [00:33<03:34, 883.60 examples/s]Map:  13%|█▎        | 27771/216925 [00:33<03:32, 888.07 examples/s]Map:  13%|█▎        | 28350/216925 [00:34<03:59, 788.70 examples/s]Map:  13%|█▎        | 27864/216925 [00:33<03:30, 896.76 examples/s]Map:  13%|█▎        | 28443/216925 [00:35<03:48, 823.68 examples/s]Map:  12%|█▏        | 27087/216925 [00:35<04:43, 668.74 examples/s]Map:  12%|█▏        | 27087/216925 [00:33<04:29, 704.25 examples/s]Map:  13%|█▎        | 28531/216925 [00:35<03:45, 835.30 examples/s]Map:  13%|█▎        | 27997/216925 [00:33<03:32, 890.97 examples/s]Map:  13%|█▎        | 27171/216925 [00:35<04:27, 709.22 examples/s]Map:  13%|█▎        | 27179/216925 [00:34<04:11, 753.19 examples/s]Map:  13%|█▎        | 28620/216925 [00:35<03:41, 848.97 examples/s]Map:  13%|█▎        | 27256/216925 [00:35<04:15, 742.48 examples/s]Map:  13%|█▎        | 27268/216925 [00:34<04:00, 787.03 examples/s]Map:  13%|█▎        | 28707/216925 [00:35<03:40, 852.63 examples/s]Map:  13%|█▎        | 28089/216925 [00:34<04:25, 711.36 examples/s]Map:  13%|█▎        | 27344/216925 [00:35<04:03, 778.61 examples/s]Map:  13%|█▎        | 27359/216925 [00:34<03:52, 816.32 examples/s]Map:  13%|█▎        | 28797/216925 [00:35<03:38, 862.35 examples/s]Map:  13%|█▎        | 28180/216925 [00:34<04:09, 755.59 examples/s]Map:  13%|█▎        | 27432/216925 [00:35<03:55, 803.08 examples/s]Map:  13%|█▎        | 27448/216925 [00:34<03:47, 833.76 examples/s]Map:  13%|█▎        | 28886/216925 [00:35<03:36, 868.25 examples/s]Map:  13%|█▎        | 28272/216925 [00:34<03:57, 793.38 examples/s]Map:  13%|█▎        | 27521/216925 [00:35<03:49, 824.96 examples/s]Map:  13%|█▎        | 27538/216925 [00:34<03:42, 849.90 examples/s]Map:  13%|█▎        | 28976/216925 [00:35<03:34, 875.29 examples/s]Map:  13%|█▎        | 28363/216925 [00:34<03:49, 821.63 examples/s]Map:  13%|█▎        | 27610/216925 [00:35<03:45, 839.97 examples/s]Map:  13%|█▎        | 27627/216925 [00:34<03:40, 859.29 examples/s]Map:  13%|█▎        | 28455/216925 [00:34<03:43, 845.03 examples/s]Map:  13%|█▎        | 27702/216925 [00:35<03:40, 859.79 examples/s]Map:  13%|█▎        | 27718/216925 [00:34<03:37, 869.20 examples/s]Map:  13%|█▎        | 28544/216925 [00:34<03:40, 855.88 examples/s]Map:  13%|█▎        | 29090/216925 [00:35<04:27, 700.88 examples/s]Map:  13%|█▎        | 27806/216925 [00:34<03:36, 871.53 examples/s]Map:  13%|█▎        | 27833/216925 [00:36<03:39, 861.90 examples/s]Map:  13%|█▎        | 28635/216925 [00:34<03:36, 869.26 examples/s]Map:  13%|█▎        | 29179/216925 [00:36<04:12, 743.03 examples/s]Map:  13%|█▎        | 27935/216925 [00:34<03:38, 863.41 examples/s]Map:  13%|█▎        | 28726/216925 [00:34<03:34, 879.41 examples/s]Map:  13%|█▎        | 27962/216925 [00:36<03:39, 859.33 examples/s]Map:  13%|█▎        | 29267/216925 [00:36<04:02, 773.65 examples/s]Map:  14%|█▎        | 29355/216925 [00:36<03:54, 798.17 examples/s]Map:  13%|█▎        | 28860/216925 [00:35<03:33, 881.34 examples/s]Map:  13%|█▎        | 28043/216925 [00:35<04:30, 698.64 examples/s]Map:  14%|█▎        | 29444/216925 [00:36<03:48, 821.59 examples/s]Map:  13%|█▎        | 28089/216925 [00:36<04:23, 716.41 examples/s]Map:  13%|█▎        | 28951/216925 [00:35<03:31, 886.86 examples/s]Map:  13%|█▎        | 28131/216925 [00:35<04:16, 736.75 examples/s]Map:  14%|█▎        | 29531/216925 [00:36<03:45, 832.84 examples/s]Map:  13%|█▎        | 28183/216925 [00:36<04:07, 762.42 examples/s]Map:  13%|█▎        | 28218/216925 [00:35<04:06, 767.08 examples/s]Map:  14%|█▎        | 29621/216925 [00:36<03:40, 849.25 examples/s]Map:  13%|█▎        | 29044/216925 [00:35<04:26, 704.90 examples/s]Map:  13%|█▎        | 28271/216925 [00:36<03:59, 787.84 examples/s]Map:  13%|█▎        | 28306/216925 [00:35<03:57, 793.56 examples/s]Map:  14%|█▎        | 29710/216925 [00:36<03:38, 857.23 examples/s]Map:  13%|█▎        | 29130/216925 [00:35<04:13, 739.61 examples/s]Map:  13%|█▎        | 28361/216925 [00:36<03:51, 814.38 examples/s]Map:  13%|█▎        | 28395/216925 [00:35<03:50, 818.13 examples/s]Map:  14%|█▎        | 29798/216925 [00:36<03:37, 861.81 examples/s]Map:  13%|█▎        | 28450/216925 [00:36<03:46, 831.46 examples/s]Map:  13%|█▎        | 29223/216925 [00:35<03:59, 782.84 examples/s]Map:  13%|█▎        | 28483/216925 [00:35<03:46, 831.96 examples/s]Map:  13%|█▎        | 28539/216925 [00:36<03:43, 843.68 examples/s]Map:  14%|█▎        | 29312/216925 [00:35<03:52, 807.95 examples/s]Map:  14%|█▍        | 29927/216925 [00:36<03:37, 859.17 examples/s]Map:  13%|█▎        | 28570/216925 [00:35<03:44, 838.43 examples/s]Map:  13%|█▎        | 28632/216925 [00:37<03:37, 865.25 examples/s]Map:  14%|█▎        | 29401/216925 [00:35<03:46, 828.62 examples/s]Map:  13%|█▎        | 28658/216925 [00:35<03:42, 846.99 examples/s]Map:  13%|█▎        | 28725/216925 [00:37<03:33, 880.68 examples/s]Map:  14%|█▎        | 29494/216925 [00:35<03:39, 854.62 examples/s]Map:  14%|█▍        | 30043/216925 [00:37<04:26, 700.32 examples/s]Map:  13%|█▎        | 28749/216925 [00:35<03:37, 863.27 examples/s]Map:  14%|█▎        | 29584/216925 [00:35<03:36, 866.86 examples/s]Map:  13%|█▎        | 28816/216925 [00:37<03:32, 886.45 examples/s]Map:  14%|█▍        | 30132/216925 [00:37<04:11, 741.44 examples/s]Map:  13%|█▎        | 28880/216925 [00:36<03:37, 863.20 examples/s]Map:  14%|█▎        | 29674/216925 [00:36<03:34, 873.65 examples/s]Map:  13%|█▎        | 28908/216925 [00:37<03:30, 891.08 examples/s]Map:  14%|█▍        | 30222/216925 [00:37<04:00, 776.25 examples/s]Map:  13%|█▎        | 28968/216925 [00:36<03:37, 862.92 examples/s]Map:  14%|█▎        | 29768/216925 [00:36<03:30, 890.49 examples/s]Map:  13%|█▎        | 28999/216925 [00:37<03:30, 892.61 examples/s]Map:  14%|█▍        | 30313/216925 [00:37<03:50, 809.86 examples/s]Map:  14%|█▍        | 29859/216925 [00:36<03:29, 893.45 examples/s]Map:  14%|█▍        | 30401/216925 [00:37<03:45, 826.79 examples/s]Map:  14%|█▍        | 29951/216925 [00:36<03:27, 899.63 examples/s]Map:  13%|█▎        | 29090/216925 [00:36<04:25, 707.22 examples/s]Map:  14%|█▍        | 30491/216925 [00:37<03:41, 843.41 examples/s]Map:  13%|█▎        | 29130/216925 [00:37<04:24, 710.78 examples/s]Map:  13%|█▎        | 29183/216925 [00:36<04:09, 753.35 examples/s]Map:  14%|█▍        | 30579/216925 [00:37<03:38, 852.93 examples/s]Map:  13%|█▎        | 29210/216925 [00:37<04:17, 728.80 examples/s]Map:  14%|█▍        | 30045/216925 [00:36<04:32, 684.94 examples/s]Map:  13%|█▎        | 29275/216925 [00:36<03:57, 791.45 examples/s]Map:  14%|█▍        | 30699/216925 [00:37<03:45, 826.95 examples/s]Map:  14%|█▎        | 29317/216925 [00:38<04:21, 717.84 examples/s]Map:  14%|█▍        | 30129/216925 [00:36<04:19, 718.49 examples/s]Map:  14%|█▎        | 29360/216925 [00:36<03:53, 804.16 examples/s]Map:  14%|█▎        | 29394/216925 [00:38<04:17, 728.83 examples/s]Map:  14%|█▍        | 30215/216925 [00:36<04:08, 751.25 examples/s]Map:  14%|█▍        | 30821/216925 [00:38<03:47, 818.54 examples/s]Map:  14%|█▎        | 29481/216925 [00:36<03:53, 801.82 examples/s]Map:  14%|█▎        | 29484/216925 [00:38<04:03, 769.57 examples/s]Map:  14%|█▍        | 30307/216925 [00:36<03:55, 791.75 examples/s]Map:  14%|█▍        | 30909/216925 [00:38<03:43, 832.45 examples/s]Map:  14%|█▎        | 29574/216925 [00:36<03:45, 832.29 examples/s]Map:  14%|█▎        | 29570/216925 [00:38<03:57, 789.97 examples/s]Map:  14%|█▍        | 30401/216925 [00:36<03:44, 829.38 examples/s]Map:  14%|█▍        | 30997/216925 [00:38<03:40, 841.39 examples/s]Map:  14%|█▎        | 29665/216925 [00:37<03:39, 852.44 examples/s]Map:  14%|█▎        | 29658/216925 [00:38<03:50, 811.69 examples/s]Map:  14%|█▍        | 30491/216925 [00:37<03:39, 848.52 examples/s]Map:  14%|█▎        | 29743/216925 [00:38<03:48, 819.67 examples/s]Map:  14%|█▍        | 30582/216925 [00:37<03:35, 863.10 examples/s]Map:  14%|█▎        | 29796/216925 [00:37<03:38, 857.41 examples/s]Map:  14%|█▍        | 31088/216925 [00:38<04:34, 678.19 examples/s]Map:  14%|█▍        | 29829/216925 [00:38<03:46, 827.82 examples/s]Map:  14%|█▍        | 30676/216925 [00:37<03:31, 882.65 examples/s]Map:  14%|█▍        | 29886/216925 [00:37<03:35, 866.56 examples/s]Map:  14%|█▍        | 31181/216925 [00:38<04:12, 735.62 examples/s]Map:  14%|█▍        | 29915/216925 [00:38<03:44, 834.28 examples/s]Map:  14%|█▍        | 30768/216925 [00:37<03:28, 891.50 examples/s]Map:  14%|█▍        | 31270/216925 [00:38<04:00, 772.67 examples/s]Map:  14%|█▍        | 31359/216925 [00:38<03:51, 800.46 examples/s]Map:  14%|█▍        | 30000/216925 [00:37<04:27, 699.80 examples/s]Map:  14%|█▍        | 30903/216925 [00:37<03:28, 890.58 examples/s]Map:  14%|█▍        | 30000/216925 [00:38<04:45, 654.97 examples/s]Map:  14%|█▍        | 31450/216925 [00:38<03:44, 826.49 examples/s]Map:  14%|█▍        | 30089/216925 [00:37<04:13, 738.45 examples/s]Map:  14%|█▍        | 30995/216925 [00:37<03:27, 895.78 examples/s]Map:  14%|█▍        | 30084/216925 [00:39<04:27, 699.41 examples/s]Map:  15%|█▍        | 31542/216925 [00:38<03:38, 849.20 examples/s]Map:  14%|█▍        | 30180/216925 [00:37<04:00, 777.37 examples/s]Map:  14%|█▍        | 30172/216925 [00:39<04:11, 743.36 examples/s]Map:  15%|█▍        | 31632/216925 [00:39<03:35, 858.03 examples/s]Map:  14%|█▍        | 30272/216925 [00:37<03:50, 808.70 examples/s]Map:  14%|█▍        | 31093/216925 [00:37<04:20, 714.18 examples/s]Map:  14%|█▍        | 30255/216925 [00:39<04:03, 765.11 examples/s]Map:  15%|█▍        | 31723/216925 [00:39<03:32, 870.28 examples/s]Map:  14%|█▍        | 30357/216925 [00:37<03:48, 817.77 examples/s]Map:  14%|█▍        | 31183/216925 [00:37<04:05, 757.03 examples/s]Map:  14%|█▍        | 30343/216925 [00:39<03:55, 791.57 examples/s]Map:  15%|█▍        | 31848/216925 [00:39<03:37, 850.16 examples/s]Map:  14%|█▍        | 30479/216925 [00:38<03:50, 810.58 examples/s]Map:  14%|█▍        | 31307/216925 [00:38<03:59, 774.09 examples/s]Map:  14%|█▍        | 30458/216925 [00:39<03:59, 778.65 examples/s]Map:  15%|█▍        | 31936/216925 [00:39<03:35, 856.64 examples/s]Map:  14%|█▍        | 30572/216925 [00:38<03:42, 837.82 examples/s]Map:  14%|█▍        | 31396/216925 [00:38<03:52, 797.70 examples/s]Map:  14%|█▍        | 30542/216925 [00:39<03:55, 792.57 examples/s]Map:  14%|█▍        | 30664/216925 [00:38<03:37, 855.94 examples/s]Map:  15%|█▍        | 31488/216925 [00:38<03:44, 825.52 examples/s]Map:  14%|█▍        | 30631/216925 [00:39<03:47, 818.69 examples/s]Map:  15%|█▍        | 32042/216925 [00:39<04:25, 695.54 examples/s]Map:  14%|█▍        | 30754/216925 [00:38<03:35, 865.23 examples/s]Map:  14%|█▍        | 30717/216925 [00:39<03:44, 828.18 examples/s]Map:  15%|█▍        | 31620/216925 [00:38<03:39, 842.59 examples/s]Map:  15%|█▍        | 32133/216925 [00:39<04:08, 743.59 examples/s]Map:  14%|█▍        | 30846/216925 [00:38<03:32, 877.73 examples/s]Map:  14%|█▍        | 30803/216925 [00:39<03:43, 833.73 examples/s]Map:  15%|█▍        | 31714/216925 [00:38<03:34, 863.83 examples/s]Map:  15%|█▍        | 32220/216925 [00:39<03:59, 771.63 examples/s]Map:  14%|█▍        | 30936/216925 [00:38<03:31, 880.74 examples/s]Map:  14%|█▍        | 30889/216925 [00:39<03:42, 837.18 examples/s]Map:  15%|█▍        | 31805/216925 [00:38<03:31, 873.68 examples/s]Map:  15%|█▍        | 32309/216925 [00:39<03:50, 799.32 examples/s]Map:  14%|█▍        | 30975/216925 [00:40<03:41, 840.51 examples/s]Map:  15%|█▍        | 31897/216925 [00:38<03:29, 883.98 examples/s]Map:  15%|█▍        | 32399/216925 [00:40<03:43, 825.38 examples/s]Map:  14%|█▍        | 31044/216925 [00:38<04:22, 707.96 examples/s]Map:  15%|█▍        | 31989/216925 [00:38<03:27, 892.91 examples/s]Map:  15%|█▍        | 32486/216925 [00:40<03:40, 834.85 examples/s]Map:  14%|█▍        | 31133/216925 [00:38<04:07, 749.88 examples/s]Map:  14%|█▍        | 31089/216925 [00:40<04:34, 676.61 examples/s]Map:  15%|█▌        | 32573/216925 [00:40<03:39, 839.22 examples/s]Map:  14%|█▍        | 31224/216925 [00:39<03:56, 786.63 examples/s]Map:  14%|█▍        | 31175/216925 [00:40<04:18, 717.32 examples/s]Map:  15%|█▍        | 32089/216925 [00:39<04:21, 706.41 examples/s]Map:  15%|█▌        | 32664/216925 [00:40<03:34, 857.04 examples/s]Map:  14%|█▍        | 31312/216925 [00:39<03:49, 808.12 examples/s]Map:  14%|█▍        | 31262/216925 [00:40<04:06, 752.33 examples/s]Map:  15%|█▍        | 32178/216925 [00:39<04:07, 747.48 examples/s]Map:  15%|█▌        | 32754/216925 [00:40<03:32, 866.48 examples/s]Map:  14%|█▍        | 31402/216925 [00:39<03:43, 830.55 examples/s]Map:  14%|█▍        | 31346/216925 [00:40<03:59, 774.60 examples/s]Map:  15%|█▍        | 32268/216925 [00:39<03:55, 783.72 examples/s]Map:  15%|█▌        | 32846/216925 [00:40<03:29, 878.94 examples/s]Map:  15%|█▍        | 31492/216925 [00:39<03:39, 846.06 examples/s]Map:  15%|█▍        | 32354/216925 [00:39<03:50, 799.74 examples/s]Map:  15%|█▍        | 31459/216925 [00:40<04:02, 765.87 examples/s]Map:  15%|█▌        | 32969/216925 [00:40<03:36, 851.52 examples/s]Map:  15%|█▍        | 31611/216925 [00:39<03:45, 823.15 examples/s]Map:  15%|█▍        | 32441/216925 [00:39<03:46, 816.17 examples/s]Map:  15%|█▍        | 31547/216925 [00:40<03:53, 793.60 examples/s]Map:  15%|█▍        | 31696/216925 [00:39<03:44, 826.46 examples/s]Map:  15%|█▍        | 32533/216925 [00:39<03:38, 842.72 examples/s]Map:  15%|█▍        | 31639/216925 [00:40<03:45, 822.16 examples/s]Map:  15%|█▌        | 32624/216925 [00:39<03:34, 860.21 examples/s]Map:  15%|█▌        | 33092/216925 [00:40<04:19, 707.05 examples/s]Map:  15%|█▍        | 31724/216925 [00:41<03:44, 826.71 examples/s]Map:  15%|█▍        | 31820/216925 [00:39<03:45, 822.26 examples/s]Map:  15%|█▌        | 32714/216925 [00:39<03:33, 863.04 examples/s]Map:  15%|█▌        | 33180/216925 [00:40<04:07, 743.25 examples/s]Map:  15%|█▍        | 31813/216925 [00:41<03:39, 842.91 examples/s]Map:  15%|█▍        | 31946/216925 [00:39<03:44, 823.70 examples/s]Map:  15%|█▌        | 32802/216925 [00:39<03:32, 864.79 examples/s]Map:  15%|█▌        | 33270/216925 [00:41<03:55, 778.97 examples/s]Map:  15%|█▍        | 31903/216925 [00:41<03:36, 855.20 examples/s]Map:  15%|█▌        | 32892/216925 [00:39<03:30, 872.34 examples/s]Map:  15%|█▌        | 33360/216925 [00:41<03:47, 806.14 examples/s]Map:  15%|█▍        | 31990/216925 [00:41<03:35, 858.40 examples/s]Map:  15%|█▍        | 32041/216925 [00:40<04:29, 685.06 examples/s]Map:  15%|█▌        | 32984/216925 [00:40<03:28, 882.56 examples/s]Map:  15%|█▌        | 33450/216925 [00:41<03:41, 828.58 examples/s]Map:  15%|█▍        | 32132/216925 [00:40<04:12, 731.92 examples/s]Map:  15%|█▌        | 33543/216925 [00:41<03:35, 852.79 examples/s]Map:  15%|█▍        | 32087/216925 [00:41<04:33, 676.57 examples/s]Map:  15%|█▍        | 32220/216925 [00:40<04:01, 763.96 examples/s]Map:  16%|█▌        | 33634/216925 [00:41<03:31, 865.63 examples/s]Map:  15%|█▌        | 33092/216925 [00:40<04:22, 699.55 examples/s]Map:  15%|█▍        | 32176/216925 [00:41<04:14, 725.00 examples/s]Map:  15%|█▍        | 32303/216925 [00:40<03:57, 777.95 examples/s]Map:  16%|█▌        | 33723/216925 [00:41<03:30, 868.82 examples/s]Map:  15%|█▌        | 33181/216925 [00:40<04:07, 742.20 examples/s]Map:  15%|█▍        | 32262/216925 [00:41<04:03, 757.29 examples/s]Map:  15%|█▍        | 32390/216925 [00:40<03:51, 797.90 examples/s]Map:  15%|█▌        | 33268/216925 [00:40<03:57, 773.60 examples/s]Map:  15%|█▍        | 32347/216925 [00:41<03:56, 780.02 examples/s]Map:  16%|█▌        | 33855/216925 [00:41<03:30, 870.13 examples/s]Map:  15%|█▍        | 32481/216925 [00:40<03:43, 826.26 examples/s]Map:  15%|█▌        | 33359/216925 [00:40<03:47, 807.04 examples/s]Map:  15%|█▍        | 32436/216925 [00:41<03:48, 808.86 examples/s]Map:  16%|█▌        | 33946/216925 [00:41<03:28, 879.57 examples/s]Map:  15%|█▌        | 32603/216925 [00:40<03:46, 814.36 examples/s]Map:  15%|█▍        | 32526/216925 [00:42<03:41, 832.50 examples/s]Map:  15%|█▌        | 33482/216925 [00:40<03:46, 808.58 examples/s]Map:  15%|█▌        | 32695/216925 [00:40<03:40, 837.28 examples/s]Map:  15%|█▌        | 33568/216925 [00:40<03:43, 820.38 examples/s]Map:  16%|█▌        | 34043/216925 [00:42<04:24, 691.63 examples/s]Map:  15%|█▌        | 32655/216925 [00:42<03:39, 840.19 examples/s]Map:  15%|█▌        | 32782/216925 [00:40<03:38, 842.33 examples/s]Map:  16%|█▌        | 33653/216925 [00:40<03:41, 825.62 examples/s]Map:  16%|█▌        | 34137/216925 [00:42<04:04, 746.71 examples/s]Map:  15%|█▌        | 32784/216925 [00:42<03:38, 842.60 examples/s]Map:  15%|█▌        | 32875/216925 [00:41<03:33, 861.80 examples/s]Map:  16%|█▌        | 33742/216925 [00:41<03:38, 839.36 examples/s]Map:  16%|█▌        | 34224/216925 [00:42<03:56, 774.09 examples/s]Map:  15%|█▌        | 32873/216925 [00:42<03:35, 852.56 examples/s]Map:  15%|█▌        | 32965/216925 [00:41<03:31, 870.73 examples/s]Map:  16%|█▌        | 33835/216925 [00:41<03:32, 862.33 examples/s]Map:  16%|█▌        | 34316/216925 [00:42<03:45, 808.26 examples/s]Map:  15%|█▌        | 32962/216925 [00:42<03:34, 858.58 examples/s]Map:  16%|█▌        | 34406/216925 [00:42<03:39, 831.53 examples/s]Map:  16%|█▌        | 33968/216925 [00:41<03:30, 867.37 examples/s]Map:  16%|█▌        | 34493/216925 [00:42<03:37, 839.83 examples/s]Map:  15%|█▌        | 33086/216925 [00:41<04:22, 700.58 examples/s]Map:  15%|█▌        | 33176/216925 [00:41<04:06, 744.36 examples/s]Map:  15%|█▌        | 33085/216925 [00:42<04:30, 678.77 examples/s]Map:  16%|█▌        | 34624/216925 [00:42<03:34, 848.21 examples/s]Map:  16%|█▌        | 34088/216925 [00:41<04:19, 703.89 examples/s]Map:  15%|█▌        | 33263/216925 [00:41<03:57, 773.38 examples/s]Map:  16%|█▌        | 34171/216925 [00:41<04:10, 729.04 examples/s]Map:  15%|█▌        | 33187/216925 [00:42<04:31, 677.54 examples/s]Map:  16%|█▌        | 34749/216925 [00:42<03:36, 840.67 examples/s]Map:  15%|█▌        | 33356/216925 [00:41<03:46, 809.03 examples/s]Map:  15%|█▌        | 33269/216925 [00:43<04:19, 708.00 examples/s]Map:  16%|█▌        | 34259/216925 [00:41<03:59, 761.47 examples/s]Map:  16%|█▌        | 34840/216925 [00:42<03:32, 855.25 examples/s]Map:  15%|█▌        | 33445/216925 [00:41<03:41, 828.20 examples/s]Map:  16%|█▌        | 34348/216925 [00:41<03:50, 792.77 examples/s]Map:  15%|█▌        | 33353/216925 [00:43<04:08, 737.74 examples/s]Map:  16%|█▌        | 34930/216925 [00:43<03:30, 863.38 examples/s]Map:  15%|█▌        | 33577/216925 [00:41<03:37, 843.35 examples/s]Map:  15%|█▌        | 33433/216925 [00:43<04:03, 752.23 examples/s]Map:  16%|█▌        | 34442/216925 [00:41<03:40, 828.66 examples/s]Map:  15%|█▌        | 33515/216925 [00:43<03:58, 767.57 examples/s]Map:  16%|█▌        | 33698/216925 [00:42<03:41, 828.06 examples/s]Map:  16%|█▌        | 34565/216925 [00:42<03:41, 822.42 examples/s]Map:  16%|█▌        | 35040/216925 [00:43<04:28, 676.38 examples/s]Map:  15%|█▌        | 33603/216925 [00:43<03:50, 794.05 examples/s]Map:  16%|█▌        | 33787/216925 [00:42<03:38, 839.90 examples/s]Map:  16%|█▌        | 34660/216925 [00:42<03:34, 851.16 examples/s]Map:  16%|█▌        | 35130/216925 [00:43<04:11, 724.06 examples/s]Map:  16%|█▌        | 33687/216925 [00:43<03:48, 803.44 examples/s]Map:  16%|█▌        | 33876/216925 [00:42<03:35, 851.04 examples/s]Map:  16%|█▌        | 34748/216925 [00:42<03:32, 856.32 examples/s]Map:  16%|█▌        | 35218/216925 [00:43<03:58, 760.67 examples/s]Map:  16%|█▌        | 33771/216925 [00:43<03:46, 809.95 examples/s]Map:  16%|█▌        | 33965/216925 [00:42<03:32, 859.32 examples/s]Map:  16%|█▌        | 34840/216925 [00:42<03:29, 869.85 examples/s]Map:  16%|█▋        | 35306/216925 [00:43<03:50, 787.00 examples/s]Map:  16%|█▌        | 33853/216925 [00:43<03:46, 808.97 examples/s]Map:  16%|█▌        | 34932/216925 [00:42<03:26, 881.78 examples/s]Map:  16%|█▋        | 35395/216925 [00:43<03:44, 809.89 examples/s]Map:  16%|█▌        | 33935/216925 [00:43<03:45, 811.83 examples/s]Map:  16%|█▋        | 35485/216925 [00:43<03:38, 831.82 examples/s]Map:  16%|█▌        | 34084/216925 [00:42<04:22, 696.24 examples/s]Map:  16%|█▋        | 35577/216925 [00:43<03:31, 855.56 examples/s]Map:  16%|█▌        | 34176/216925 [00:42<04:05, 745.00 examples/s]Map:  16%|█▌        | 35043/216925 [00:42<04:19, 701.44 examples/s]Map:  16%|█▌        | 34040/216925 [00:44<04:49, 631.58 examples/s]Map:  16%|█▋        | 35668/216925 [00:44<03:28, 867.36 examples/s]Map:  16%|█▌        | 34267/216925 [00:42<03:53, 781.80 examples/s]Map:  16%|█▌        | 35135/216925 [00:42<04:02, 751.01 examples/s]Map:  16%|█▌        | 34122/216925 [00:44<04:31, 673.16 examples/s]Map:  16%|█▌        | 34357/216925 [00:42<03:45, 811.32 examples/s]Map:  16%|█▌        | 35230/216925 [00:42<03:47, 797.33 examples/s]Map:  17%|█▋        | 35801/216925 [00:44<03:28, 869.28 examples/s]Map:  16%|█▌        | 34206/216925 [00:44<04:16, 711.39 examples/s]Map:  16%|█▌        | 34446/216925 [00:43<03:40, 828.23 examples/s]Map:  16%|█▋        | 35320/216925 [00:43<03:40, 822.26 examples/s]Map:  17%|█▋        | 35890/216925 [00:44<03:27, 872.40 examples/s]Map:  16%|█▌        | 34292/216925 [00:44<04:05, 744.94 examples/s]Map:  16%|█▌        | 34538/216925 [00:43<03:34, 852.00 examples/s]Map:  16%|█▋        | 35413/216925 [00:43<03:33, 848.55 examples/s]Map:  17%|█▋        | 35981/216925 [00:44<03:25, 880.44 examples/s]Map:  16%|█▌        | 34371/216925 [00:44<04:02, 752.74 examples/s]Map:  16%|█▌        | 34629/216925 [00:43<03:30, 866.42 examples/s]Map:  16%|█▋        | 35506/216925 [00:43<03:28, 869.16 examples/s]Map:  16%|█▌        | 34453/216925 [00:44<03:57, 768.88 examples/s]Map:  16%|█▌        | 34754/216925 [00:43<03:34, 851.07 examples/s]Map:  16%|█▋        | 35632/216925 [00:43<03:32, 851.94 examples/s]Map:  17%|█▋        | 36079/216925 [00:44<04:25, 682.19 examples/s]Map:  16%|█▌        | 34567/216925 [00:44<03:58, 763.72 examples/s]Map:  16%|█▌        | 34843/216925 [00:43<03:32, 857.18 examples/s]Map:  16%|█▋        | 35720/216925 [00:43<03:30, 858.83 examples/s]Map:  17%|█▋        | 36168/216925 [00:44<04:08, 728.00 examples/s]Map:  16%|█▌        | 34649/216925 [00:44<03:54, 776.15 examples/s]Map:  16%|█▌        | 34932/216925 [00:43<03:31, 861.57 examples/s]Map:  17%|█▋        | 35812/216925 [00:43<03:27, 873.38 examples/s]Map:  17%|█▋        | 36257/216925 [00:44<03:55, 766.35 examples/s]Map:  16%|█▌        | 34735/216925 [00:44<03:48, 795.72 examples/s]Map:  17%|█▋        | 35902/216925 [00:43<03:25, 879.62 examples/s]Map:  17%|█▋        | 36347/216925 [00:44<03:46, 798.96 examples/s]Map:  16%|█▌        | 34820/216925 [00:45<03:45, 806.13 examples/s]Map:  17%|█▋        | 35997/216925 [00:43<03:21, 896.91 examples/s]Map:  17%|█▋        | 36435/216925 [00:44<03:40, 819.29 examples/s]Map:  16%|█▌        | 35043/216925 [00:43<04:19, 701.45 examples/s]Map:  16%|█▌        | 34906/216925 [00:45<03:41, 821.18 examples/s]Map:  17%|█▋        | 36522/216925 [00:45<03:37, 830.04 examples/s]Map:  16%|█▌        | 35139/216925 [00:43<03:59, 759.58 examples/s]Map:  16%|█▌        | 34994/216925 [00:45<03:37, 836.64 examples/s]Map:  17%|█▋        | 36091/216925 [00:43<04:16, 704.18 examples/s]Map:  17%|█▋        | 36613/216925 [00:45<03:32, 849.57 examples/s]Map:  16%|█▌        | 35225/216925 [00:44<03:52, 782.91 examples/s]Map:  17%|█▋        | 36186/216925 [00:44<03:57, 760.96 examples/s]Map:  17%|█▋        | 36701/216925 [00:45<03:30, 857.82 examples/s]Map:  16%|█▋        | 35319/216925 [00:44<03:40, 821.83 examples/s]Map:  16%|█▌        | 35090/216925 [00:45<04:32, 668.45 examples/s]Map:  17%|█▋        | 36279/216925 [00:44<03:45, 801.75 examples/s]Map:  17%|█▋        | 36791/216925 [00:45<03:27, 866.40 examples/s]Map:  16%|█▋        | 35410/216925 [00:44<03:35, 841.68 examples/s]Map:  16%|█▌        | 35175/216925 [00:45<04:16, 708.87 examples/s]Map:  17%|█▋        | 36372/216925 [00:44<03:37, 831.69 examples/s]Map:  17%|█▋        | 36879/216925 [00:45<03:27, 867.65 examples/s]Map:  16%|█▋        | 35504/216925 [00:44<03:29, 866.50 examples/s]Map:  16%|█▋        | 35257/216925 [00:45<04:07, 733.48 examples/s]Map:  17%|█▋        | 36469/216925 [00:44<03:27, 867.79 examples/s]Map:  17%|█▋        | 36968/216925 [00:45<03:25, 874.07 examples/s]Map:  16%|█▋        | 35594/216925 [00:44<03:27, 875.20 examples/s]Map:  16%|█▋        | 35341/216925 [00:45<03:58, 760.49 examples/s]Map:  16%|█▋        | 35686/216925 [00:44<03:24, 884.55 examples/s]Map:  17%|█▋        | 36602/216925 [00:44<03:26, 871.41 examples/s]Map:  16%|█▋        | 35425/216925 [00:45<03:52, 779.49 examples/s]Map:  17%|█▋        | 37085/216925 [00:45<04:19, 692.13 examples/s]Map:  17%|█▋        | 36692/216925 [00:44<03:26, 873.77 examples/s]Map:  17%|█▋        | 35813/216925 [00:44<03:28, 867.52 examples/s]Map:  16%|█▋        | 35507/216925 [00:46<03:50, 786.94 examples/s]Map:  17%|█▋        | 37168/216925 [00:45<04:09, 720.87 examples/s]Map:  17%|█▋        | 36821/216925 [00:44<03:28, 865.73 examples/s]Map:  17%|█▋        | 35945/216925 [00:44<03:28, 867.89 examples/s]Map:  16%|█▋        | 35629/216925 [00:46<03:48, 794.38 examples/s]Map:  17%|█▋        | 37253/216925 [00:46<03:59, 751.76 examples/s]Map:  17%|█▋        | 36918/216925 [00:44<03:22, 888.70 examples/s]Map:  16%|█▋        | 35716/216925 [00:46<03:43, 811.29 examples/s]Map:  17%|█▋        | 37344/216925 [00:46<03:46, 792.31 examples/s]Map:  17%|█▋        | 36043/216925 [00:45<04:13, 712.26 examples/s]Map:  17%|█▋        | 35801/216925 [00:46<03:41, 817.42 examples/s]Map:  17%|█▋        | 37435/216925 [00:46<03:38, 822.38 examples/s]Map:  17%|█▋        | 36136/216925 [00:45<03:58, 757.79 examples/s]Map:  17%|█▋        | 35888/216925 [00:46<03:38, 828.72 examples/s]Map:  17%|█▋        | 37045/216925 [00:45<04:05, 731.31 examples/s]Map:  17%|█▋        | 37521/216925 [00:46<03:36, 829.76 examples/s]Map:  17%|█▋        | 36229/216925 [00:45<03:46, 796.77 examples/s]Map:  17%|█▋        | 35975/216925 [00:46<03:36, 837.15 examples/s]Map:  17%|█▋        | 37140/216925 [00:45<03:51, 778.13 examples/s]Map:  17%|█▋        | 37610/216925 [00:46<03:32, 844.05 examples/s]Map:  17%|█▋        | 36322/216925 [00:45<03:38, 826.89 examples/s]Map:  17%|█▋        | 37231/216925 [00:45<03:42, 806.85 examples/s]Map:  17%|█▋        | 37701/216925 [00:46<03:28, 858.92 examples/s]Map:  17%|█▋        | 36412/216925 [00:45<03:33, 845.00 examples/s]Map:  17%|█▋        | 37323/216925 [00:45<03:35, 833.01 examples/s]Map:  17%|█▋        | 37792/216925 [00:46<03:25, 870.86 examples/s]Map:  17%|█▋        | 36084/216925 [00:46<04:30, 667.72 examples/s]Map:  17%|█▋        | 37418/216925 [00:45<03:28, 861.27 examples/s]Map:  17%|█▋        | 36171/216925 [00:46<04:14, 710.68 examples/s]Map:  17%|█▋        | 36546/216925 [00:45<03:30, 856.38 examples/s]Map:  17%|█▋        | 37921/216925 [00:46<03:27, 864.75 examples/s]Map:  17%|█▋        | 37514/216925 [00:45<03:22, 884.49 examples/s]Map:  17%|█▋        | 36255/216925 [00:46<04:04, 739.56 examples/s]Map:  17%|█▋        | 36639/216925 [00:45<03:26, 871.19 examples/s]Map:  17%|█▋        | 36345/216925 [00:47<03:51, 779.44 examples/s]Map:  17%|█▋        | 36729/216925 [00:45<03:25, 875.82 examples/s]Map:  17%|█▋        | 37646/216925 [00:45<03:23, 879.31 examples/s]Map:  18%|█▊        | 38044/216925 [00:47<04:11, 712.12 examples/s]Map:  17%|█▋        | 36437/216925 [00:47<03:41, 815.19 examples/s]Map:  17%|█▋        | 36823/216925 [00:45<03:22, 890.04 examples/s]Map:  17%|█▋        | 37738/216925 [00:45<03:21, 887.09 examples/s]Map:  18%|█▊        | 38137/216925 [00:47<03:55, 759.71 examples/s]Map:  17%|█▋        | 36558/216925 [00:47<03:42, 810.04 examples/s]Map:  17%|█▋        | 36943/216925 [00:46<03:31, 852.90 examples/s]Map:  17%|█▋        | 37861/216925 [00:46<03:27, 862.82 examples/s]Map:  18%|█▊        | 38260/216925 [00:47<03:50, 775.05 examples/s]Map:  17%|█▋        | 36645/216925 [00:47<03:39, 821.24 examples/s]Map:  17%|█▋        | 37954/216925 [00:46<03:23, 877.45 examples/s]Map:  18%|█▊        | 38351/216925 [00:47<03:41, 805.72 examples/s]Map:  17%|█▋        | 36732/216925 [00:47<03:36, 833.27 examples/s]Map:  17%|█▋        | 37040/216925 [00:46<04:17, 697.29 examples/s]Map:  18%|█▊        | 38439/216925 [00:47<03:37, 821.29 examples/s]Map:  17%|█▋        | 36820/216925 [00:47<03:33, 843.95 examples/s]Map:  17%|█▋        | 37134/216925 [00:46<03:59, 749.19 examples/s]Map:  18%|█▊        | 38527/216925 [00:47<03:34, 833.35 examples/s]Map:  18%|█▊        | 38084/216925 [00:46<04:11, 711.27 examples/s]Map:  17%|█▋        | 36908/216925 [00:47<03:31, 850.05 examples/s]Map:  17%|█▋        | 37225/216925 [00:46<03:48, 785.76 examples/s]Map:  18%|█▊        | 38176/216925 [00:46<03:56, 754.44 examples/s]Map:  17%|█▋        | 36997/216925 [00:47<03:29, 859.05 examples/s]Map:  18%|█▊        | 38657/216925 [00:47<03:31, 841.74 examples/s]Map:  17%|█▋        | 37314/216925 [00:46<03:41, 812.00 examples/s]Map:  18%|█▊        | 38267/216925 [00:46<03:46, 788.40 examples/s]Map:  18%|█▊        | 38751/216925 [00:47<03:26, 864.81 examples/s]Map:  17%|█▋        | 37405/216925 [00:46<03:34, 836.03 examples/s]Map:  18%|█▊        | 38363/216925 [00:46<03:35, 829.25 examples/s]Map:  17%|█▋        | 37087/216925 [00:48<04:24, 679.17 examples/s]Map:  18%|█▊        | 38840/216925 [00:47<03:24, 869.64 examples/s]Map:  17%|█▋        | 37493/216925 [00:46<03:32, 844.95 examples/s]Map:  17%|█▋        | 37179/216925 [00:48<04:04, 735.44 examples/s]Map:  18%|█▊        | 38930/216925 [00:48<03:22, 877.19 examples/s]Map:  18%|█▊        | 38496/216925 [00:46<03:30, 846.73 examples/s]Map:  17%|█▋        | 37622/216925 [00:46<03:31, 847.67 examples/s]Map:  17%|█▋        | 37270/216925 [00:48<03:50, 778.82 examples/s]Map:  18%|█▊        | 38589/216925 [00:46<03:26, 864.76 examples/s]Map:  17%|█▋        | 37751/216925 [00:47<03:31, 847.05 examples/s]Map:  18%|█▊        | 38685/216925 [00:47<03:21, 885.76 examples/s]Map:  18%|█▊        | 39043/216925 [00:48<04:10, 709.88 examples/s]Map:  17%|█▋        | 37393/216925 [00:48<03:47, 790.68 examples/s]Map:  17%|█▋        | 37845/216925 [00:47<03:26, 867.98 examples/s]Map:  18%|█▊        | 39131/216925 [00:48<03:57, 748.66 examples/s]Map:  17%|█▋        | 37482/216925 [00:48<03:40, 814.83 examples/s]Map:  18%|█▊        | 38819/216925 [00:47<03:21, 886.01 examples/s]Map:  17%|█▋        | 37935/216925 [00:47<03:24, 874.68 examples/s]Map:  18%|█▊        | 39223/216925 [00:48<03:45, 788.85 examples/s]Map:  17%|█▋        | 37567/216925 [00:48<03:38, 820.89 examples/s]Map:  18%|█▊        | 38951/216925 [00:47<03:22, 880.35 examples/s]Map:  17%|█▋        | 37655/216925 [00:48<03:34, 835.12 examples/s]Map:  18%|█▊        | 39345/216925 [00:48<03:43, 794.14 examples/s]Map:  18%|█▊        | 38043/216925 [00:47<04:14, 701.76 examples/s]Map:  17%|█▋        | 37745/216925 [00:48<03:30, 851.05 examples/s]Map:  18%|█▊        | 39432/216925 [00:48<03:38, 810.54 examples/s]Map:  18%|█▊        | 39043/216925 [00:47<04:07, 718.37 examples/s]Map:  18%|█▊        | 38128/216925 [00:47<04:03, 734.61 examples/s]Map:  17%|█▋        | 37837/216925 [00:48<03:26, 866.03 examples/s]Map:  18%|█▊        | 39520/216925 [00:48<03:34, 827.60 examples/s]Map:  18%|█▊        | 39134/216925 [00:47<03:54, 758.62 examples/s]Map:  18%|█▊        | 38222/216925 [00:47<03:48, 782.61 examples/s]Map:  17%|█▋        | 37927/216925 [00:49<03:25, 871.90 examples/s]Map:  18%|█▊        | 39610/216925 [00:48<03:29, 844.77 examples/s]Map:  18%|█▊        | 39229/216925 [00:47<03:41, 802.07 examples/s]Map:  18%|█▊        | 38311/216925 [00:47<03:40, 808.56 examples/s]Map:  18%|█▊        | 39699/216925 [00:49<03:27, 855.79 examples/s]Map:  18%|█▊        | 39321/216925 [00:47<03:33, 830.09 examples/s]Map:  18%|█▊        | 38044/216925 [00:49<04:18, 691.23 examples/s]Map:  18%|█▊        | 39793/216925 [00:49<03:21, 877.05 examples/s]Map:  18%|█▊        | 38439/216925 [00:47<03:37, 821.72 examples/s]Map:  18%|█▊        | 39411/216925 [00:47<03:29, 845.68 examples/s]Map:  18%|█▊        | 38137/216925 [00:49<04:00, 744.61 examples/s]Map:  18%|█▊        | 39882/216925 [00:49<03:21, 878.46 examples/s]Map:  18%|█▊        | 38530/216925 [00:48<03:31, 842.06 examples/s]Map:  18%|█▊        | 39501/216925 [00:48<03:26, 857.97 examples/s]Map:  18%|█▊        | 38227/216925 [00:49<03:48, 781.45 examples/s]Map:  18%|█▊        | 38617/216925 [00:48<03:30, 848.81 examples/s]Map:  18%|█▊        | 39592/216925 [00:48<03:23, 871.74 examples/s]Map:  18%|█▊        | 38315/216925 [00:49<03:41, 805.58 examples/s]Map:  18%|█▊        | 38707/216925 [00:48<03:27, 859.78 examples/s]Map:  18%|█▊        | 40000/216925 [00:49<04:12, 701.72 examples/s]Map:  18%|█▊        | 39683/216925 [00:48<03:21, 879.99 examples/s]Map:  18%|█▊        | 38402/216925 [00:49<03:37, 821.07 examples/s]Map:  18%|█▊        | 38796/216925 [00:48<03:25, 866.72 examples/s]Map:  18%|█▊        | 40093/216925 [00:49<03:55, 751.78 examples/s]Map:  18%|█▊        | 39778/216925 [00:48<03:17, 897.83 examples/s]Map:  18%|█▊        | 38494/216925 [00:49<03:30, 846.84 examples/s]Map:  18%|█▊        | 38886/216925 [00:48<03:23, 874.85 examples/s]Map:  19%|█▊        | 40181/216925 [00:49<03:46, 781.98 examples/s]Map:  18%|█▊        | 39873/216925 [00:48<03:14, 910.00 examples/s]Map:  18%|█▊        | 38585/216925 [00:49<03:26, 862.49 examples/s]Map:  18%|█▊        | 38981/216925 [00:48<03:19, 892.12 examples/s]Map:  19%|█▊        | 40268/216925 [00:49<03:39, 804.27 examples/s]Map:  18%|█▊        | 38676/216925 [00:49<03:23, 875.01 examples/s]Map:  18%|█▊        | 39999/216925 [00:48<03:21, 875.91 examples/s]Map:  19%|█▊        | 40395/216925 [00:49<03:36, 815.07 examples/s]Map:  18%|█▊        | 38769/216925 [00:50<03:20, 889.90 examples/s]Map:  18%|█▊        | 39089/216925 [00:48<04:18, 689.09 examples/s]Map:  19%|█▊        | 40487/216925 [00:50<03:30, 837.26 examples/s]Map:  18%|█▊        | 38862/216925 [00:50<03:18, 897.87 examples/s]Map:  18%|█▊        | 40091/216925 [00:48<04:12, 699.14 examples/s]Map:  18%|█▊        | 39178/216925 [00:48<04:02, 733.58 examples/s]Map:  19%|█▊        | 40579/216925 [00:50<03:25, 858.23 examples/s]Map:  19%|█▊        | 40184/216925 [00:48<03:55, 751.03 examples/s]Map:  18%|█▊        | 38953/216925 [00:50<03:18, 895.93 examples/s]Map:  19%|█▊        | 40671/216925 [00:50<03:22, 872.41 examples/s]Map:  18%|█▊        | 39304/216925 [00:49<03:52, 765.61 examples/s]Map:  19%|█▊        | 40274/216925 [00:49<03:44, 787.13 examples/s]Map:  18%|█▊        | 39395/216925 [00:49<03:42, 798.52 examples/s]Map:  18%|█▊        | 39046/216925 [00:50<04:12, 705.58 examples/s]Map:  19%|█▊        | 40365/216925 [00:49<03:36, 816.64 examples/s]Map:  19%|█▉        | 40802/216925 [00:50<03:23, 867.45 examples/s]Map:  18%|█▊        | 39486/216925 [00:49<03:35, 821.98 examples/s]Map:  18%|█▊        | 39138/216925 [00:50<03:54, 756.73 examples/s]Map:  19%|█▊        | 40455/216925 [00:49<03:30, 837.37 examples/s]Map:  19%|█▉        | 40933/216925 [00:50<03:22, 867.65 examples/s]Map:  18%|█▊        | 39582/216925 [00:49<03:27, 856.71 examples/s]Map:  18%|█▊        | 39226/216925 [00:50<03:45, 787.03 examples/s]Map:  19%|█▊        | 40546/216925 [00:49<03:26, 855.45 examples/s]Map:  18%|█▊        | 39673/216925 [00:49<03:23, 869.54 examples/s]Map:  18%|█▊        | 39313/216925 [00:50<03:40, 806.23 examples/s]Map:  19%|█▊        | 40639/216925 [00:49<03:21, 873.92 examples/s]Map:  18%|█▊        | 39767/216925 [00:49<03:20, 885.50 examples/s]Map:  19%|█▉        | 41044/216925 [00:50<04:03, 721.91 examples/s]Map:  18%|█▊        | 39399/216925 [00:50<03:37, 816.39 examples/s]Map:  19%|█▉        | 40730/216925 [00:49<03:19, 882.91 examples/s]Map:  18%|█▊        | 39860/216925 [00:49<03:17, 895.25 examples/s]Map:  18%|█▊        | 39485/216925 [00:50<03:34, 827.93 examples/s]Map:  19%|█▉        | 41137/216925 [00:50<03:50, 763.91 examples/s]Map:  19%|█▉        | 40827/216925 [00:49<03:14, 905.65 examples/s]Map:  19%|█▉        | 41227/216925 [00:50<03:41, 794.20 examples/s]Map:  18%|█▊        | 39573/216925 [00:51<03:31, 838.89 examples/s]Map:  19%|█▉        | 40921/216925 [00:49<03:12, 914.05 examples/s]Map:  18%|█▊        | 39990/216925 [00:49<03:21, 878.25 examples/s]Map:  19%|█▉        | 41321/216925 [00:51<03:32, 827.33 examples/s]Map:  18%|█▊        | 39663/216925 [00:51<03:28, 851.92 examples/s]Map:  19%|█▉        | 41041/216925 [00:49<04:12, 697.36 examples/s]Map:  18%|█▊        | 40081/216925 [00:49<04:16, 688.49 examples/s]Map:  19%|█▉        | 41443/216925 [00:51<03:34, 820.01 examples/s]Map:  18%|█▊        | 39787/216925 [00:51<03:31, 837.81 examples/s]Map:  19%|█▉        | 41137/216925 [00:50<03:52, 755.19 examples/s]Map:  19%|█��        | 40170/216925 [00:50<04:01, 731.21 examples/s]Map:  19%|█▉        | 41532/216925 [00:51<03:29, 836.18 examples/s]Map:  18%|█▊        | 39905/216925 [00:51<03:37, 813.93 examples/s]Map:  19%|█▉        | 41228/216925 [00:50<03:41, 792.12 examples/s]Map:  19%|█▊        | 40258/216925 [00:50<03:50, 765.52 examples/s]Map:  19%|█▉        | 41620/216925 [00:51<03:27, 844.19 examples/s]Map:  18%|█▊        | 39988/216925 [00:51<03:37, 813.46 examples/s]Map:  19%|█▉        | 41321/216925 [00:50<03:32, 825.96 examples/s]Map:  19%|█▊        | 40350/216925 [00:50<03:40, 802.30 examples/s]Map:  19%|█▉        | 41714/216925 [00:51<03:22, 865.31 examples/s]Map:  19%|█▉        | 41416/216925 [00:50<03:24, 856.45 examples/s]Map:  19%|█▊        | 40438/216925 [00:50<03:34, 822.44 examples/s]Map:  19%|█▉        | 41847/216925 [00:51<03:21, 869.77 examples/s]Map:  18%|█▊        | 40076/216925 [00:51<04:39, 633.75 examples/s]Map:  19%|█▉        | 41513/216925 [00:50<03:18, 883.80 examples/s]Map:  19%|█▊        | 40529/216925 [00:50<03:28, 844.14 examples/s]Map:  19%|█▉        | 41938/216925 [00:51<03:19, 877.63 examples/s]Map:  19%|█▊        | 40160/216925 [00:51<04:20, 677.32 examples/s]Map:  19%|█▊        | 40619/216925 [00:50<03:25, 856.04 examples/s]Map:  19%|█▉        | 41651/216925 [00:50<03:16, 892.63 examples/s]Map:  19%|█▊        | 40237/216925 [00:51<04:13, 697.42 examples/s]Map:  19%|█▉        | 40709/216925 [00:50<03:23, 865.42 examples/s]Map:  19%|█▉        | 41743/216925 [00:50<03:15, 897.64 examples/s]Map:  19%|█▉        | 42043/216925 [00:51<04:03, 718.37 examples/s]Map:  19%|█▊        | 40321/216925 [00:52<04:01, 730.55 examples/s]Map:  19%|█▉        | 41838/216925 [00:50<03:12, 907.80 examples/s]Map:  19%|█▉        | 40841/216925 [00:50<03:22, 868.22 examples/s]Map:  19%|█▉        | 42135/216925 [00:52<03:48, 763.95 examples/s]Map:  19%|█▊        | 40404/216925 [00:52<03:54, 752.79 examples/s]Map:  19%|█▉        | 41930/216925 [00:50<03:12, 909.09 examples/s]Map:  19%|█▉        | 40931/216925 [00:50<03:21, 873.03 examples/s]Map:  19%|█▉        | 42227/216925 [00:52<03:38, 798.90 examples/s]Map:  19%|█▊        | 40513/216925 [00:52<03:58, 740.57 examples/s]Map:  20%|█▉        | 42318/216925 [00:52<03:31, 826.51 examples/s]Map:  19%|█▊        | 40592/216925 [00:52<03:55, 750.06 examples/s]Map:  20%|█▉        | 42410/216925 [00:52<03:25, 849.82 examples/s]Map:  19%|█▉        | 41040/216925 [00:51<04:10, 702.58 examples/s]Map:  19%|█▉        | 42045/216925 [00:51<04:02, 721.32 examples/s]Map:  19%|█▉        | 40675/216925 [00:52<03:49, 768.41 examples/s]Map:  19%|█▉        | 41124/216925 [00:51<04:00, 730.57 examples/s]Map:  19%|█▉        | 42128/216925 [00:51<03:55, 742.45 examples/s]Map:  20%|█▉        | 42529/216925 [00:52<03:32, 821.99 examples/s]Map:  19%|█▉        | 40759/216925 [00:52<03:44, 784.73 examples/s]Map:  19%|█▉        | 41208/216925 [00:51<03:52, 755.06 examples/s]Map:  19%|█▉        | 42216/216925 [00:51<03:45, 773.24 examples/s]Map:  20%|█▉        | 42617/216925 [00:52<03:28, 834.13 examples/s]Map:  19%|█▉        | 41301/216925 [00:51<03:40, 795.37 examples/s]Map:  20%|█▉        | 42309/216925 [00:51<03:35, 811.62 examples/s]Map:  19%|█▉        | 40879/216925 [00:52<03:43, 788.26 examples/s]Map:  20%|█▉        | 42706/216925 [00:52<03:25, 847.58 examples/s]Map:  19%|█▉        | 41391/216925 [00:51<03:33, 821.05 examples/s]Map:  20%|█▉        | 42398/216925 [00:51<03:29, 831.33 examples/s]Map:  19%|█▉        | 40960/216925 [00:52<03:42, 790.70 examples/s]Map:  20%|█▉        | 42796/216925 [00:52<03:22, 860.52 examples/s]Map:  19%|█▉        | 41481/216925 [00:51<03:28, 841.61 examples/s]Map:  20%|█▉        | 42488/216925 [00:51<03:26, 846.58 examples/s]Map:  20%|█▉        | 42885/216925 [00:52<03:20, 866.69 examples/s]Map:  19%|█▉        | 41570/216925 [00:51<03:25, 852.60 examples/s]Map:  20%|█▉        | 42577/216925 [00:51<03:23, 857.05 examples/s]Map:  20%|█▉        | 42976/216925 [00:53<03:18, 874.96 examples/s]Map:  19%|█▉        | 41062/216925 [00:53<05:07, 571.12 examples/s]Map:  19%|█▉        | 41661/216925 [00:51<03:22, 866.23 examples/s]Map:  20%|█▉        | 42667/216925 [00:51<03:20, 867.82 examples/s]Map:  19%|█▉        | 41144/216925 [00:53<04:43, 620.21 examples/s]Map:  19%|█▉        | 41754/216925 [00:51<03:18, 881.63 examples/s]Map:  20%|█▉        | 42760/216925 [00:51<03:17, 883.38 examples/s]Map:  20%|█▉        | 43093/216925 [00:53<04:04, 710.99 examples/s]Map:  19%|█▉        | 41225/216925 [00:53<04:25, 661.88 examples/s]Map:  19%|█▉        | 41846/216925 [00:52<03:17, 888.05 examples/s]Map:  20%|█▉        | 42858/216925 [00:52<03:11, 909.63 examples/s]Map:  20%|█▉        | 43183/216925 [00:53<03:50, 753.62 examples/s]Map:  19%|█▉        | 41308/216925 [00:53<04:10, 700.51 examples/s]Map:  19%|█▉        | 41938/216925 [00:52<03:15, 896.57 examples/s]Map:  20%|█▉        | 42994/216925 [00:52<03:12, 902.93 examples/s]Map:  20%|█▉        | 43271/216925 [00:53<03:41, 783.61 examples/s]Map:  19%|█▉        | 41391/216925 [00:53<03:59, 731.87 examples/s]Map:  20%|█▉        | 43364/216925 [00:53<03:31, 821.51 examples/s]Map:  19%|█▉        | 41474/216925 [00:53<03:52, 754.71 examples/s]Map:  19%|█▉        | 42041/216925 [00:52<04:09, 701.86 examples/s]Map:  20%|█▉        | 43091/216925 [00:52<04:01, 719.73 examples/s]Map:  20%|██        | 43457/216925 [00:53<03:24, 847.36 examples/s]Map:  19%|█▉        | 41554/216925 [00:53<03:50, 762.29 examples/s]Map:  19%|█▉        | 42130/216925 [00:52<03:54, 745.08 examples/s]Map:  20%|█▉        | 43183/216925 [00:52<03:47, 764.70 examples/s]Map:  19%|█▉        | 41638/216925 [00:53<03:44, 781.22 examples/s]Map:  20%|██        | 43580/216925 [00:53<03:27, 834.78 examples/s]Map:  19%|█▉        | 42213/216925 [00:52<03:48, 765.52 examples/s]Map:  20%|██        | 43669/216925 [00:53<03:24, 846.13 examples/s]Map:  20%|█▉        | 43310/216925 [00:52<03:40, 785.62 examples/s]Map:  19%|█▉        | 42298/216925 [00:52<03:42, 785.89 examples/s]Map:  19%|█▉        | 41758/216925 [00:54<03:43, 783.57 examples/s]Map:  20%|██        | 43759/216925 [00:53<03:21, 858.18 examples/s]Map:  20%|██        | 43401/216925 [00:52<03:33, 812.70 examples/s]Map:  20%|█▉        | 42388/216925 [00:52<03:34, 814.74 examples/s]Map:  19%|█▉        | 41840/216925 [00:54<03:40, 792.63 examples/s]Map:  20%|██        | 43852/216925 [00:54<03:17, 874.90 examples/s]Map:  20%|██        | 43494/216925 [00:52<03:26, 840.33 examples/s]Map:  20%|█▉        | 42479/216925 [00:52<03:28, 837.25 examples/s]Map:  19%|█▉        | 41923/216925 [00:54<03:38, 801.01 examples/s]Map:  20%|██        | 43941/216925 [00:54<03:17, 875.66 examples/s]Map:  20%|██        | 43588/216925 [00:52<03:20, 863.25 examples/s]Map:  20%|█▉        | 42568/216925 [00:52<03:25, 848.78 examples/s]Map:  20%|██        | 43677/216925 [00:53<03:19, 867.37 examples/s]Map:  20%|█▉        | 42655/216925 [00:53<03:24, 851.99 examples/s]Map:  19%|█▉        | 42038/216925 [00:54<04:31, 643.79 examples/s]Map:  20%|██        | 43768/216925 [00:53<03:17, 878.02 examples/s]Map:  20%|██        | 44044/216925 [00:54<04:07, 697.44 examples/s]Map:  20%|█▉        | 42784/216925 [00:53<03:24, 852.05 examples/s]Map:  19%|█▉        | 42121/216925 [00:54<04:15, 683.75 examples/s]Map:  20%|██        | 44134/216925 [00:54<03:52, 744.16 examples/s]Map:  20%|██        | 43900/216925 [00:53<03:17, 875.82 examples/s]Map:  20%|█▉        | 42876/216925 [00:53<03:21, 865.64 examples/s]Map:  19%|█▉        | 42206/216925 [00:54<04:02, 721.69 examples/s]Map:  20%|██        | 44227/216925 [00:54<03:38, 788.71 examples/s]Map:  20%|██        | 43990/216925 [00:53<03:16, 879.35 examples/s]Map:  20%|█▉        | 42967/216925 [00:53<03:18, 875.26 examples/s]Map:  19%|█▉        | 42293/216925 [00:54<03:50, 756.59 examples/s]Map:  20%|██        | 44316/216925 [00:54<03:32, 813.53 examples/s]Map:  20%|█▉        | 42379/216925 [00:54<03:43, 780.93 examples/s]Map:  20%|██        | 44087/216925 [00:53<04:07, 699.27 examples/s]Map:  20%|██        | 44445/216925 [00:54<03:28, 825.92 examples/s]Map:  20%|█▉        | 42464/216925 [00:54<03:38, 797.07 examples/s]Map:  20%|█▉        | 43088/216925 [00:53<04:03, 714.53 examples/s]Map:  20%|██        | 44178/216925 [00:53<03:51, 746.57 examples/s]Map:  21%|██        | 44536/216925 [00:54<03:24, 844.68 examples/s]Map:  20%|█▉        | 43175/216925 [00:53<03:52, 748.90 examples/s]Map:  20%|█▉        | 42589/216925 [00:55<03:35, 809.48 examples/s]Map:  20%|██        | 44268/216925 [00:53<03:40, 782.26 examples/s]Map:  21%|██        | 44625/216925 [00:55<03:21, 854.39 examples/s]Map:  20%|█▉        | 43261/216925 [00:53<03:44, 772.08 examples/s]Map:  20%|██        | 44352/216925 [00:53<03:37, 793.57 examples/s]Map:  20%|█▉        | 42707/216925 [00:55<03:38, 798.71 examples/s]Map:  21%|██        | 44746/216925 [00:55<03:26, 833.93 examples/s]Map:  20%|█▉        | 43384/216925 [00:54<03:40, 786.32 examples/s]Map:  20%|██        | 44442/216925 [00:54<03:30, 819.32 examples/s]Map:  20%|█▉        | 42792/216925 [00:55<03:34, 810.29 examples/s]Map:  21%|██        | 44836/216925 [00:55<03:23, 847.02 examples/s]Map:  20%|██        | 43471/216925 [00:54<03:35, 805.56 examples/s]Map:  21%|██        | 44534/216925 [00:54<03:24, 843.95 examples/s]Map:  20%|█▉        | 42877/216925 [00:55<03:32, 818.59 examples/s]Map:  21%|██        | 44928/216925 [00:55<03:18, 865.55 examples/s]Map:  20%|██        | 43560/216925 [00:54<03:29, 827.09 examples/s]Map:  21%|██        | 44630/216925 [00:54<03:16, 874.95 examples/s]Map:  20%|█▉        | 42969/216925 [00:55<03:26, 841.35 examples/s]Map:  20%|██        | 43651/216925 [00:54<03:24, 848.21 examples/s]Map:  21%|██        | 44720/216925 [00:54<03:15, 879.71 examples/s]Map:  21%|██        | 45042/216925 [00:55<04:05, 699.67 examples/s]Map:  20%|██        | 43781/216925 [00:54<03:23, 849.91 examples/s]Map:  20%|█▉        | 43090/216925 [00:55<04:12, 689.19 examples/s]Map:  21%|██        | 44856/216925 [00:54<03:14, 885.89 examples/s]Map:  21%|██        | 45129/216925 [00:55<03:53, 736.08 examples/s]Map:  20%|██        | 43870/216925 [00:54<03:21, 857.98 examples/s]Map:  20%|█▉        | 43180/216925 [00:55<03:56, 735.28 examples/s]Map:  21%|██        | 44949/216925 [00:54<03:12, 892.10 examples/s]Map:  21%|██        | 45221/216925 [00:55<03:40, 778.20 examples/s]Map:  20%|██        | 43957/216925 [00:54<03:21, 859.25 examples/s]Map:  20%|█▉        | 43272/216925 [00:56<03:43, 775.74 examples/s]Map:  21%|██        | 45311/216925 [00:55<03:32, 807.22 examples/s]Map:  20%|█▉        | 43361/216925 [00:56<03:36, 803.42 examples/s]Map:  21%|██        | 45041/216925 [00:54<04:04, 703.20 examples/s]Map:  21%|██        | 45404/216925 [00:56<03:24, 837.30 examples/s]Map:  20%|██        | 44044/216925 [00:54<04:10, 691.19 examples/s]Map:  20%|██        | 43452/216925 [00:56<03:28, 830.49 examples/s]Map:  21%|██        | 45133/216925 [00:54<03:48, 752.22 examples/s]Map:  21%|██        | 45494/216925 [00:56<03:21, 851.49 examples/s]Map:  20%|██        | 44134/216925 [00:54<03:53, 740.57 examples/s]Map:  20%|██        | 43544/216925 [00:56<03:23, 852.29 examples/s]Map:  21%|██        | 45225/216925 [00:55<03:37, 791.00 examples/s]Map:  21%|██        | 45583/216925 [00:56<03:19, 859.70 examples/s]Map:  20%|██        | 44230/216925 [00:55<03:37, 795.59 examples/s]Map:  20%|██        | 43633/216925 [00:56<03:21, 859.18 examples/s]Map:  21%|██        | 45319/216925 [00:55<03:27, 827.42 examples/s]Map:  21%|██        | 45674/216925 [00:56<03:16, 872.78 examples/s]Map:  20%|██        | 44321/216925 [00:55<03:29, 823.86 examples/s]Map:  20%|██        | 43721/216925 [00:56<03:20, 863.41 examples/s]Map:  21%|██        | 45406/216925 [00:55<03:25, 835.76 examples/s]Map:  21%|██        | 45800/216925 [00:56<03:19, 856.00 examples/s]Map:  20%|██        | 44442/216925 [00:55<03:32, 811.92 examples/s]Map:  20%|██        | 43847/216925 [00:56<03:23, 851.05 examples/s]Map:  21%|██        | 45534/216925 [00:55<03:24, 836.88 examples/s]Map:  21%|██        | 44537/216925 [00:55<03:23, 846.60 examples/s]Map:  21%|██        | 45928/216925 [00:56<03:20, 853.23 examples/s]Map:  20%|██        | 43938/216925 [00:56<03:20, 863.99 examples/s]Map:  21%|██        | 45626/216925 [00:55<03:19, 856.51 examples/s]Map:  21%|██        | 44627/216925 [00:55<03:20, 857.85 examples/s]Map:  21%|██        | 45716/216925 [00:55<03:17, 864.82 examples/s]Map:  21%|██        | 44715/216925 [00:55<03:20, 859.83 examples/s]Map:  21%|██        | 46042/216925 [00:56<04:03, 702.35 examples/s]Map:  21%|██        | 45809/216925 [00:55<03:14, 879.33 examples/s]Map:  20%|██        | 44043/216925 [00:57<04:09, 694.27 examples/s]Map:  21%|██        | 44804/216925 [00:55<03:19, 864.34 examples/s]Map:  21%|██▏       | 46133/216925 [00:56<03:49, 744.38 examples/s]Map:  21%|██        | 45899/216925 [00:55<03:13, 881.92 examples/s]Map:  20%|██        | 44136/216925 [00:57<03:52, 743.90 examples/s]Map:  21%|██▏       | 46227/216925 [00:57<03:36, 787.37 examples/s]Map:  20%|██        | 44217/216925 [00:57<03:47, 758.55 examples/s]Map:  21%|██        | 44936/216925 [00:55<03:18, 866.87 examples/s]Map:  21%|██▏       | 46314/216925 [00:57<03:32, 804.48 examples/s]Map:  20%|██        | 44302/216925 [00:57<03:41, 778.92 examples/s]Map:  21%|██        | 46000/216925 [00:55<04:06, 693.76 examples/s]Map:  21%|██▏       | 46404/216925 [00:57<03:26, 826.85 examples/s]Map:  20%|██        | 44384/216925 [00:57<03:39, 787.51 examples/s]Map:  21%|██        | 46092/216925 [00:56<03:48, 746.91 examples/s]Map:  21%|██        | 45043/216925 [00:56<04:02, 708.09 examples/s]Map:  21%|██▏       | 46494/216925 [00:57<03:21, 844.68 examples/s]Map:  20%|██        | 44466/216925 [00:57<03:37, 793.30 examples/s]Map:  21%|██▏       | 46182/216925 [00:56<03:37, 784.39 examples/s]Map:  21%|██        | 45131/216925 [00:56<03:50, 744.32 examples/s]Map:  21%|██▏       | 46274/216925 [00:56<03:28, 818.20 examples/s]Map:  21%|██        | 45220/216925 [00:56<03:40, 777.36 examples/s]Map:  21%|██▏       | 46621/216925 [00:57<03:22, 841.08 examples/s]Map:  21%|██        | 44590/216925 [00:57<03:34, 801.91 examples/s]Map:  21%|██▏       | 46366/216925 [00:56<03:21, 844.73 examples/s]Map:  21%|██        | 45307/216925 [00:56<03:34, 799.25 examples/s]Map:  22%|██▏       | 46710/216925 [00:57<03:19, 852.58 examples/s]Map:  21%|██        | 44672/216925 [00:57<03:34, 804.48 examples/s]Map:  21%|██▏       | 46459/216925 [00:56<03:16, 865.90 examples/s]Map:  21%|██        | 45395/216925 [00:56<03:29, 819.70 examples/s]Map:  22%|██▏       | 46799/216925 [00:57<03:18, 858.77 examples/s]Map:  21%|██        | 44785/216925 [00:57<03:40, 780.21 examples/s]Map:  21%|██▏       | 46583/216925 [00:56<03:20, 849.97 examples/s]Map:  21%|██        | 45517/216925 [00:56<03:30, 813.73 examples/s]Map:  22%|██▏       | 46921/216925 [00:57<03:22, 837.97 examples/s]Map:  21%|██        | 44888/216925 [00:58<03:50, 744.95 examples/s]Map:  22%|██▏       | 46707/216925 [00:56<03:22, 838.82 examples/s]Map:  21%|██        | 45636/216925 [00:56<03:32, 805.93 examples/s]Map:  21%|██        | 44964/216925 [00:58<03:51, 743.67 examples/s]Map:  22%|██▏       | 46796/216925 [00:56<03:20, 849.45 examples/s]Map:  21%|██        | 45727/216925 [00:56<03:26, 827.40 examples/s]Map:  22%|██▏       | 47046/216925 [00:58<04:09, 680.78 examples/s]Map:  22%|██▏       | 46885/216925 [00:56<03:17, 859.61 examples/s]Map:  21%|██        | 45819/216925 [00:57<03:21, 848.04 examples/s]Map:  22%|██▏       | 47136/216925 [00:58<03:54, 725.22 examples/s]Map:  21%|██        | 45080/216925 [00:58<04:37, 619.82 examples/s]Map:  22%|██▏       | 46976/216925 [00:57<03:14, 871.93 examples/s]Map:  21%|██        | 45908/216925 [00:57<03:19, 856.86 examples/s]Map:  22%|██▏       | 47225/216925 [00:58<03:43, 760.18 examples/s]Map:  21%|██        | 45164/216925 [00:58<04:18, 664.12 examples/s]Map:  22%|██▏       | 47315/216925 [00:58<03:34, 792.41 examples/s]Map:  21%|██        | 45247/216925 [00:58<04:05, 699.76 examples/s]Map:  21%|██        | 46000/216925 [00:57<04:11, 680.94 examples/s]Map:  22%|██▏       | 47096/216925 [00:57<04:00, 707.51 examples/s]Map:  22%|██▏       | 47404/216925 [00:58<03:27, 816.01 examples/s]Map:  21%|██        | 45325/216925 [00:58<03:59, 717.51 examples/s]Map:  21%|██        | 46087/216925 [00:57<03:56, 722.42 examples/s]Map:  22%|██▏       | 47187/216925 [00:57<03:45, 752.00 examples/s]Map:  22%|██▏       | 47493/216925 [00:58<03:22, 835.53 examples/s]Map:  21%|██        | 45410/216925 [00:58<03:48, 749.45 examples/s]Map:  21%|██▏       | 46177/216925 [00:57<03:43, 763.69 examples/s]Map:  22%|██▏       | 47281/216925 [00:57<03:33, 795.85 examples/s]Map:  22%|██▏       | 47585/216925 [00:58<03:17, 856.03 examples/s]Map:  21%|██        | 45491/216925 [00:58<03:44, 762.96 examples/s]Map:  21%|██▏       | 46265/216925 [00:57<03:35, 792.60 examples/s]Map:  22%|██▏       | 47374/216925 [00:57<03:24, 827.47 examples/s]Map:  22%|██▏       | 47674/216925 [00:58<03:16, 862.87 examples/s]Map:  21%|██        | 45573/216925 [00:59<03:40, 776.01 examples/s]Map:  21%|██▏       | 46356/216925 [00:57<03:27, 820.36 examples/s]Map:  22%|██▏       | 47470/216925 [00:57<03:16, 860.34 examples/s]Map:  22%|██▏       | 47762/216925 [00:58<03:15, 863.98 examples/s]Map:  21%|██        | 45656/216925 [00:59<03:37, 789.02 examples/s]Map:  21%|██▏       | 46442/216925 [00:57<03:25, 829.83 examples/s]Map:  22%|██▏       | 47561/216925 [00:57<03:14, 869.88 examples/s]Map:  22%|██▏       | 47854/216925 [00:59<03:12, 877.99 examples/s]Map:  21%|██        | 45738/216925 [00:59<03:35, 794.52 examples/s]Map:  21%|██▏       | 46537/216925 [00:57<03:17, 860.93 examples/s]Map:  22%|██▏       | 47654/216925 [00:57<03:11, 884.55 examples/s]Map:  22%|██▏       | 47947/216925 [00:59<03:09, 891.48 examples/s]Map:  21%|██        | 45850/216925 [00:59<03:41, 771.50 examples/s]Map:  22%|██▏       | 46665/216925 [00:58<03:19, 852.20 examples/s]Map:  22%|██▏       | 47777/216925 [00:58<03:17, 857.09 examples/s]Map:  22%|██▏       | 48045/216925 [00:59<04:00, 701.75 examples/s]Map:  21%|██        | 45932/216925 [00:59<03:38, 783.76 examples/s]Map:  22%|██▏       | 46759/216925 [00:58<03:14, 873.85 examples/s]Map:  22%|██▏       | 47870/216925 [00:58<03:13, 874.09 examples/s]Map:  22%|██▏       | 48139/216925 [00:59<03:42, 758.25 examples/s]Map:  22%|██▏       | 46850/216925 [00:58<03:13, 880.67 examples/s]Map:  22%|██▏       | 47967/216925 [00:58<03:08, 898.32 examples/s]Map:  22%|██▏       | 48229/216925 [00:59<03:32, 792.21 examples/s]Map:  22%|██▏       | 46941/216925 [00:58<03:11, 887.09 examples/s]Map:  21%|██        | 46041/216925 [00:59<04:58, 571.67 examples/s]Map:  22%|██▏       | 48324/216925 [00:59<03:22, 832.99 examples/s]Map:  22%|██▏       | 48091/216925 [00:58<03:52, 725.72 examples/s]Map:  21%|██▏       | 46125/216925 [00:59<04:33, 623.56 examples/s]Map:  22%|���█▏       | 48416/216925 [00:59<03:17, 852.94 examples/s]Map:  22%|██▏       | 47043/216925 [00:58<04:00, 704.96 examples/s]Map:  22%|██▏       | 48182/216925 [00:58<03:40, 765.13 examples/s]Map:  21%|██▏       | 46206/216925 [00:59<04:16, 664.82 examples/s]Map:  22%|██▏       | 47134/216925 [00:58<03:45, 751.62 examples/s]Map:  22%|██▏       | 48548/216925 [00:59<03:15, 859.78 examples/s]Map:  22%|██▏       | 48270/216925 [00:58<03:33, 791.09 examples/s]Map:  21%|██▏       | 46288/216925 [01:00<04:03, 701.94 examples/s]Map:  22%|██▏       | 47225/216925 [00:58<03:34, 789.78 examples/s]Map:  22%|██▏       | 48638/216925 [01:00<03:13, 868.38 examples/s]Map:  22%|██▏       | 48362/216925 [00:58<03:25, 822.16 examples/s]Map:  21%|██▏       | 46369/216925 [01:00<03:53, 729.29 examples/s]Map:  22%|██▏       | 47312/216925 [00:58<03:30, 807.04 examples/s]Map:  22%|██▏       | 48730/216925 [01:00<03:10, 881.17 examples/s]Map:  22%|██▏       | 48455/216925 [00:58<03:18, 848.58 examples/s]Map:  21%|██▏       | 46456/216925 [01:00<03:42, 764.89 examples/s]Map:  22%|██▏       | 47401/216925 [00:58<03:24, 827.76 examples/s]Map:  23%|██▎       | 48821/216925 [01:00<03:09, 887.94 examples/s]Map:  22%|██▏       | 48546/216925 [00:59<03:14, 863.78 examples/s]Map:  21%|██▏       | 46541/216925 [01:00<03:36, 787.66 examples/s]Map:  22%|██▏       | 47487/216925 [00:59<03:23, 833.06 examples/s]Map:  23%|██▎       | 48911/216925 [01:00<03:09, 887.10 examples/s]Map:  22%|██▏       | 48642/216925 [00:59<03:09, 889.57 examples/s]Map:  21%|██▏       | 46625/216925 [01:00<03:32, 800.97 examples/s]Map:  22%|██▏       | 47577/216925 [00:59<03:19, 850.33 examples/s]Map:  22%|██▏       | 46713/216925 [01:00<03:27, 821.43 examples/s]Map:  22%|██▏       | 48768/216925 [00:59<03:13, 866.98 examples/s]Map:  22%|██▏       | 47701/216925 [00:59<03:22, 836.51 examples/s]Map:  23%|██▎       | 49041/216925 [01:00<04:00, 699.14 examples/s]Map:  22%|██▏       | 46836/216925 [01:00<03:28, 816.44 examples/s]Map:  23%|██▎       | 48895/216925 [00:59<03:15, 857.43 examples/s]Map:  22%|██▏       | 47793/216925 [00:59<03:17, 855.55 examples/s]Map:  23%|██▎       | 49130/216925 [01:00<03:46, 740.87 examples/s]Map:  22%|██▏       | 46924/216925 [01:00<03:24, 829.95 examples/s]Map:  23%|██▎       | 48983/216925 [00:59<03:14, 861.42 examples/s]Map:  22%|██▏       | 47883/216925 [00:59<03:16, 862.37 examples/s]Map:  23%|██▎       | 49219/216925 [01:00<03:36, 773.93 examples/s]Map:  22%|██▏       | 47971/216925 [00:59<03:15, 862.40 examples/s]Map:  23%|██▎       | 49305/216925 [01:00<03:31, 792.60 examples/s]Map:  23%|██▎       | 49089/216925 [00:59<04:00, 697.21 examples/s]Map:  22%|██▏       | 47042/216925 [01:01<04:14, 668.42 examples/s]Map:  23%|██▎       | 49395/216925 [01:00<03:24, 817.82 examples/s]Map:  23%|██▎       | 49185/216925 [00:59<03:42, 754.57 examples/s]Map:  22%|██▏       | 47129/216925 [01:01<03:58, 711.22 examples/s]Map:  23%|██▎       | 49486/216925 [01:01<03:19, 838.42 examples/s]Map:  22%|██▏       | 48090/216925 [00:59<04:00, 702.35 examples/s]Map:  23%|██▎       | 49275/216925 [00:59<03:32, 787.58 examples/s]Map:  22%|██▏       | 47215/216925 [01:01<03:47, 745.07 examples/s]Map:  23%|██▎       | 49575/216925 [01:01<03:17, 848.34 examples/s]Map:  22%|██▏       | 48183/216925 [00:59<03:44, 751.72 examples/s]Map:  23%|██▎       | 49363/216925 [01:00<03:26, 810.49 examples/s]Map:  22%|██▏       | 47303/216925 [01:01<03:38, 777.27 examples/s]Map:  23%|██▎       | 49665/216925 [01:01<03:14, 861.22 examples/s]Map:  22%|██▏       | 48272/216925 [01:00<03:35, 784.04 examples/s]Map:  23%|██▎       | 49455/216925 [01:00<03:19, 838.09 examples/s]Map:  22%|██▏       | 47391/216925 [01:01<03:31, 803.29 examples/s]Map:  22%|██▏       | 48364/216925 [01:00<03:26, 815.48 examples/s]Map:  23%|██▎       | 49546/216925 [01:00<03:16, 853.94 examples/s]Map:  22%|██▏       | 47477/216925 [01:01<03:27, 815.16 examples/s]Map:  22%|██▏       | 48458/216925 [01:00<03:19, 845.69 examples/s]Map:  23%|██▎       | 49757/216925 [01:01<04:28, 622.31 examples/s]Map:  23%|██▎       | 49638/216925 [01:00<03:12, 869.72 examples/s]Map:  22%|██▏       | 47599/216925 [01:01<03:29, 809.02 examples/s]Map:  23%|██▎       | 49846/216925 [01:01<04:05, 681.91 examples/s]Map:  22%|██▏       | 48589/216925 [01:00<03:17, 853.84 examples/s]Map:  22%|██▏       | 47683/216925 [01:01<03:28, 812.59 examples/s]Map:  23%|██▎       | 49932/216925 [01:01<03:51, 722.71 examples/s]Map:  22%|██▏       | 48713/216925 [01:00<03:20, 839.43 examples/s]Map:  23%|██▎       | 49760/216925 [01:00<04:25, 630.06 examples/s]Map:  22%|██▏       | 47806/216925 [01:01<03:28, 812.14 examples/s]Map:  22%|██▏       | 48805/216925 [01:00<03:16, 854.76 examples/s]Map:  23%|██▎       | 49851/216925 [01:00<04:02, 687.65 examples/s]Map:  23%|██▎       | 50044/216925 [01:01<04:28, 620.54 examples/s]Map:  22%|██▏       | 47892/216925 [01:02<03:25, 822.47 examples/s]Map:  23%|██▎       | 48897/216925 [01:00<03:13, 869.74 examples/s]Map:  23%|██▎       | 49941/216925 [01:00<03:47, 735.29 examples/s]Map:  23%|██▎       | 50134/216925 [01:02<04:05, 679.03 examples/s]Map:  22%|██▏       | 47976/216925 [01:02<03:24, 825.80 examples/s]Map:  23%|██▎       | 48986/216925 [01:00<03:12, 871.80 examples/s]Map:  23%|██▎       | 50221/216925 [01:02<03:51, 720.00 examples/s]Map:  23%|██▎       | 50309/216925 [01:02<03:40, 757.34 examples/s]Map:  23%|██▎       | 50044/216925 [01:01<04:23, 632.98 examples/s]Map:  22%|██▏       | 48084/216925 [01:02<04:18, 653.25 examples/s]Map:  23%|██▎       | 49090/216925 [01:01<03:57, 706.61 examples/s]Map:  23%|██▎       | 50400/216925 [01:02<03:29, 796.22 examples/s]Map:  23%|██▎       | 50138/216925 [01:01<03:59, 696.79 examples/s]Map:  22%|██▏       | 48170/216925 [01:02<04:01, 697.56 examples/s]Map:  23%|██▎       | 49184/216925 [01:01<03:41, 757.52 examples/s]Map:  23%|██▎       | 50494/216925 [01:02<03:19, 833.26 examples/s]Map:  23%|██▎       | 50230/216925 [01:01<03:43, 747.01 examples/s]Map:  22%|██▏       | 48252/216925 [01:02<03:53, 723.79 examples/s]Map:  23%|██▎       | 49275/216925 [01:01<03:31, 792.93 examples/s]Map:  23%|██▎       | 50585/216925 [01:02<03:15, 852.15 examples/s]Map:  23%|██▎       | 50322/216925 [01:01<03:31, 787.66 examples/s]Map:  22%|██▏       | 48333/216925 [01:02<03:46, 744.96 examples/s]Map:  23%|██▎       | 49366/216925 [01:01<03:24, 821.24 examples/s]Map:  23%|██▎       | 50674/216925 [01:02<03:13, 860.58 examples/s]Map:  23%|██▎       | 50412/216925 [01:01<03:24, 814.49 examples/s]Map:  22%|██▏       | 48414/216925 [01:02<03:41, 760.80 examples/s]Map:  23%|██▎       | 49456/216925 [01:01<03:19, 840.98 examples/s]Map:  23%|██▎       | 50763/216925 [01:02<03:12, 864.74 examples/s]Map:  23%|██▎       | 50502/216925 [01:01<03:19, 835.20 examples/s]Map:  22%|██▏       | 48502/216925 [01:02<03:32, 791.50 examples/s]Map:  23%|██▎       | 49547/216925 [01:01<03:15, 858.24 examples/s]Map:  23%|██▎       | 50856/216925 [01:02<03:08, 880.32 examples/s]Map:  23%|██▎       | 50589/216925 [01:01<03:17, 841.44 examples/s]Map:  22%|██▏       | 48584/216925 [01:03<03:31, 797.81 examples/s]Map:  23%|██▎       | 49636/216925 [01:01<03:13, 864.42 examples/s]Map:  23%|██▎       | 50676/216925 [01:01<03:15, 848.31 examples/s]Map:  24%|██▎       | 50983/216925 [01:03<03:12, 863.23 examples/s]Map:  22%|██▏       | 48704/216925 [01:03<03:31, 797.02 examples/s]Map:  23%|██▎       | 50797/216925 [01:01<03:21, 826.40 examples/s]Map:  22%|██▏       | 48785/216925 [01:03<03:30, 798.28 examples/s]Map:  23%|██▎       | 49757/216925 [01:01<04:24, 632.72 examples/s]Map:  23%|██▎       | 50882/216925 [01:02<03:19, 830.85 examples/s]Map:  24%|██▎       | 51085/216925 [01:03<04:00, 689.67 examples/s]Map:  23%|██▎       | 48866/216925 [01:03<03:30, 799.38 examples/s]Map:  23%|██▎       | 49839/216925 [01:02<04:08, 671.16 examples/s]Map:  23%|██▎       | 50971/216925 [01:02<03:16, 845.54 examples/s]Map:  24%|██▎       | 51174/216925 [01:03<03:46, 733.26 examples/s]Map:  23%|██▎       | 48953/216925 [01:03<03:26, 814.70 examples/s]Map:  23%|██▎       | 49929/216925 [01:02<03:50, 723.98 examples/s]Map:  24%|██▎       | 51262/216925 [01:03<03:36, 766.30 examples/s]Map:  24%|██▎       | 51353/216925 [01:03<03:27, 798.98 examples/s]Map:  24%|██▎       | 51089/216925 [01:02<04:04, 678.86 examples/s]Map:  23%|██▎       | 49041/216925 [01:03<04:22, 640.66 examples/s]Map:  23%|██▎       | 50042/216925 [01:02<04:24, 630.84 examples/s]Map:  24%|██▎       | 51442/216925 [01:03<03:21, 821.59 examples/s]Map:  24%|██▎       | 51177/216925 [01:02<03:49, 721.47 examples/s]Map:  23%|██▎       | 49124/216925 [01:03<04:05, 682.64 examples/s]Map:  23%|██▎       | 50130/216925 [01:02<04:04, 683.05 examples/s]Map:  24%|██▍       | 51531/216925 [01:03<03:17, 837.98 examples/s]Map:  24%|██▎       | 51268/216925 [01:02<03:36, 764.69 examples/s]Map:  23%|██▎       | 49204/216925 [01:03<03:56, 710.00 examples/s]Map:  23%|██▎       | 50222/216925 [01:02<03:46, 737.27 examples/s]Map:  24%|██▍       | 51620/216925 [01:03<03:14, 850.91 examples/s]Map:  24%|██▎       | 51356/216925 [01:02<03:28, 792.27 examples/s]Map:  23%|██▎       | 49283/216925 [01:03<03:50, 727.93 examples/s]Map:  23%|██▎       | 50313/216925 [01:02<03:34, 778.42 examples/s]Map:  24%|██▎       | 51444/216925 [01:02<03:23, 813.27 examples/s]Map:  23%|██▎       | 49363/216925 [01:04<03:45, 743.64 examples/s]Map:  24%|██▍       | 51746/216925 [01:03<03:15, 843.82 examples/s]Map:  23%|██▎       | 50405/216925 [01:02<03:24, 813.60 examples/s]Map:  24%|██▍       | 51532/216925 [01:02<03:19, 829.85 examples/s]Map:  23%|██▎       | 49443/216925 [01:04<03:41, 755.95 examples/s]Map:  24%|██▍       | 51837/216925 [01:04<03:12, 859.47 examples/s]Map:  23%|██▎       | 50492/216925 [01:02<03:21, 825.27 examples/s]Map:  24%|██▍       | 51623/216925 [01:02<03:14, 849.44 examples/s]Map:  23%|██▎       | 49522/216925 [01:04<03:39, 763.03 examples/s]Map:  23%|██▎       | 50580/216925 [01:03<03:18, 837.20 examples/s]Map:  24%|██▍       | 51965/216925 [01:04<03:13, 852.42 examples/s]Map:  24%|██▍       | 51710/216925 [01:03<03:14, 850.41 examples/s]Map:  23%|██▎       | 49628/216925 [01:04<03:47, 736.95 examples/s]Map:  23%|██▎       | 50704/216925 [01:03<03:20, 828.97 examples/s]Map:  24%|██▍       | 51839/216925 [01:03<03:13, 851.41 examples/s]Map:  23%|██▎       | 49708/216925 [01:04<03:42, 750.93 examples/s]Map:  23%|██▎       | 50792/216925 [01:03<03:18, 839.05 examples/s]Map:  24%|██▍       | 52089/216925 [01:04<03:56, 696.33 examples/s]Map:  24%|██▍       | 51925/216925 [01:03<03:16, 839.83 examples/s]Map:  23%|██▎       | 50881/216925 [01:03<03:15, 850.13 examples/s]Map:  24%|██▍       | 52179/216925 [01:04<03:43, 737.83 examples/s]Map:  23%|██▎       | 50971/216925 [01:03<03:12, 862.65 examples/s]Map:  24%|██▍       | 52267/216925 [01:04<03:34, 767.47 examples/s]Map:  23%|██▎       | 49792/216925 [01:04<05:22, 518.44 examples/s]Map:  24%|██▍       | 52043/216925 [01:03<04:02, 681.20 examples/s]Map:  24%|██▍       | 52359/216925 [01:04<03:24, 802.94 examples/s]Map:  23%|██▎       | 49871/216925 [01:04<04:51, 573.92 examples/s]Map:  24%|██▍       | 52135/216925 [01:03<03:45, 730.81 examples/s]Map:  24%|██▍       | 52450/216925 [01:04<03:18, 827.43 examples/s]Map:  24%|██▎       | 51088/216925 [01:03<03:58, 695.81 examples/s]Map:  23%|██▎       | 49953/216925 [01:05<04:25, 627.81 examples/s]Map:  24%|██▍       | 52228/216925 [01:03<03:31, 777.09 examples/s]Map:  24%|██▍       | 52541/216925 [01:04<03:14, 846.23 examples/s]Map:  24%|██▎       | 51178/216925 [01:03<03:43, 740.29 examples/s]Map:  24%|██▍       | 52319/216925 [01:03<03:23, 809.57 examples/s]Map:  24%|██▍       | 52629/216925 [01:05<03:12, 852.93 examples/s]Map:  24%|██▎       | 51274/216925 [01:03<03:29, 791.15 examples/s]Map:  23%|██▎       | 50030/216925 [01:05<05:39, 491.25 examples/s]Map:  24%|██▍       | 52413/216925 [01:03<03:15, 841.74 examples/s]Map:  24%|██▍       | 52717/216925 [01:05<03:10, 859.92 examples/s]Map:  24%|██▎       | 51365/216925 [01:04<03:21, 821.09 examples/s]Map:  23%|██▎       | 50099/216925 [01:05<05:14, 529.64 examples/s]Map:  24%|██▍       | 52504/216925 [01:04<03:11, 857.58 examples/s]Map:  24%|██▍       | 52848/216925 [01:05<03:10, 861.44 examples/s]Map:  23%|██▎       | 50183/216925 [01:05<04:39, 597.12 examples/s]Map:  24%|██▎       | 51497/216925 [01:04<03:17, 838.21 examples/s]Map:  24%|██▍       | 52595/216925 [01:04<03:08, 869.71 examples/s]Map:  24%|██▍       | 52939/216925 [01:05<03:08, 871.73 examples/s]Map:  23%|██▎       | 50266/216925 [01:05<04:15, 651.58 examples/s]Map:  24%|██▍       | 51586/216925 [01:04<03:14, 850.43 examples/s]Map:  24%|██▍       | 52720/216925 [01:04<03:12, 852.32 examples/s]Map:  23%|██▎       | 50351/216925 [01:05<03:57, 701.93 examples/s]Map:  24%|██▍       | 51706/216925 [01:04<03:19, 830.08 examples/s]Map:  23%|██▎       | 50433/216925 [01:05<03:48, 729.29 examples/s]Map:  24%|██▍       | 52852/216925 [01:04<03:11, 858.66 examples/s]Map:  24%|██▍       | 53042/216925 [01:05<04:02, 677.03 examples/s]Map:  24%|██▍       | 51795/216925 [01:04<03:15, 843.24 examples/s]Map:  23%|██▎       | 50516/216925 [01:05<03:40, 754.45 examples/s]Map:  24%|██▍       | 52942/216925 [01:04<03:09, 867.51 examples/s]Map:  24%|██▍       | 53137/216925 [01:05<03:42, 735.86 examples/s]Map:  24%|██▍       | 51884/216925 [01:04<03:13, 853.69 examples/s]Map:  23%|██▎       | 50600/216925 [01:05<03:34, 776.79 examples/s]Map:  25%|██▍       | 53226/216925 [01:05<03:32, 770.50 examples/s]Map:  24%|██▍       | 51973/216925 [01:04<03:11, 860.71 examples/s]Map:  23%|██▎       | 50684/216925 [01:06<03:29, 793.82 examples/s]Map:  25%|██▍       | 53320/216925 [01:05<03:22, 809.20 examples/s]Map:  24%|██▍       | 53041/216925 [01:04<03:56, 692.58 examples/s]Map:  23%|██▎       | 50769/216925 [01:06<03:25, 808.64 examples/s]Map:  25%|██▍       | 53406/216925 [01:06<03:19, 820.66 examples/s]Map:  24%|██▍       | 53130/216925 [01:04<03:42, 734.86 examples/s]Map:  24%|██▍       | 52093/216925 [01:04<03:52, 709.34 examples/s]Map:  23%|██▎       | 50857/216925 [01:06<03:20, 827.48 examples/s]Map:  25%|██▍       | 53496/216925 [01:06<03:14, 838.56 examples/s]Map:  25%|██▍       | 53222/216925 [01:04<03:30, 778.43 examples/s]Map:  24%|██▍       | 52185/216925 [01:05<03:38, 754.37 examples/s]Map:  23%|██▎       | 50945/216925 [01:06<03:17, 839.83 examples/s]Map:  25%|██▍       | 53315/216925 [01:05<03:20, 816.08 examples/s]Map:  25%|██▍       | 53628/216925 [01:06<03:12, 849.54 examples/s]Map:  24%|██▍       | 52275/216925 [01:05<03:28, 788.51 examples/s]Map:  25%|██▍       | 53408/216925 [01:05<03:13, 843.87 examples/s]Map:  25%|██▍       | 53719/216925 [01:06<03:09, 863.09 examples/s]Map:  24%|██▍       | 52368/216925 [01:05<03:20, 821.62 examples/s]Map:  24%|██▎       | 51042/216925 [01:06<04:10, 661.37 examples/s]Map:  25%|██▍       | 53499/216925 [01:05<03:10, 857.40 examples/s]Map:  25%|██▍       | 53808/216925 [01:06<03:08, 867.50 examples/s]Map:  24%|██▎       | 51125/216925 [01:06<03:57, 697.99 examples/s]Map:  25%|██▍       | 53592/216925 [01:05<03:07, 872.41 examples/s]Map:  24%|██▍       | 52490/216925 [01:05<03:21, 814.90 examples/s]Map:  25%|██▍       | 53899/216925 [01:06<03:06, 874.93 examples/s]Map:  24%|██▎       | 51211/216925 [01:06<03:44, 737.67 examples/s]Map:  25%|██▍       | 53685/216925 [01:05<03:04, 886.10 examples/s]Map:  24%|██▍       | 52609/216925 [01:05<03:24, 802.68 examples/s]Map:  24%|██▎       | 51297/216925 [01:06<03:35, 766.99 examples/s]Map:  25%|██▍       | 53808/216925 [01:05<03:10, 856.51 examples/s]Map:  25%|██▍       | 54000/216925 [01:06<04:02, 670.65 examples/s]Map:  24%|██▎       | 51381/216925 [01:07<03:30, 785.40 examples/s]Map:  24%|██▍       | 52737/216925 [01:05<03:21, 816.07 examples/s]Map:  25%|██▍       | 53900/216925 [01:05<03:06, 872.28 examples/s]Map:  25%|██▍       | 54091/216925 [01:06<03:45, 723.57 examples/s]Map:  24%|██▎       | 51467/216925 [01:07<03:25, 804.88 examples/s]Map:  24%|██▍       | 52828/216925 [01:05<03:16, 835.64 examples/s]Map:  25%|██▍       | 54185/216925 [01:07<03:30, 774.14 examples/s]Map:  24%|██▍       | 51554/216925 [01:07<03:21, 819.89 examples/s]Map:  24%|██▍       | 52919/216925 [01:05<03:12, 851.26 examples/s]Map:  25%|██▍       | 54000/216925 [01:05<03:55, 691.74 examples/s]Map:  25%|██▌       | 54269/216925 [01:07<03:25, 790.45 examples/s]Map:  24%|██▍       | 51645/216925 [01:07<03:16, 842.02 examples/s]Map:  25%|██▍       | 54089/216925 [01:06<03:41, 735.96 examples/s]Map:  25%|██▌       | 54361/216925 [01:07<03:17, 821.31 examples/s]Map:  24%|██▍       | 53044/216925 [01:06<03:49, 713.32 examples/s]Map:  24%|██▍       | 51775/216925 [01:07<03:14, 848.34 examples/s]Map:  25%|██▍       | 54185/216925 [01:06<03:26, 788.86 examples/s]Map:  25%|██▌       | 54450/216925 [01:07<03:14, 836.08 examples/s]Map:  24%|██▍       | 53136/216925 [01:06<03:36, 757.53 examples/s]Map:  24%|██▍       | 51867/216925 [01:07<03:11, 862.81 examples/s]Map:  25%|██▌       | 54274/216925 [01:06<03:20, 813.13 examples/s]Map:  25%|██▌       | 54539/216925 [01:07<03:11, 848.48 examples/s]Map:  25%|██▍       | 53226/216925 [01:06<03:27, 790.57 examples/s]Map:  24%|██▍       | 51956/216925 [01:07<03:10, 867.98 examples/s]Map:  25%|██▌       | 54366/216925 [01:06<03:13, 838.17 examples/s]Map:  25%|██▌       | 54628/216925 [01:07<03:09, 854.38 examples/s]Map:  25%|██▍       | 53318/216925 [01:06<03:19, 820.30 examples/s]Map:  25%|██▌       | 54455/216925 [01:06<03:11, 848.94 examples/s]Map:  25%|██▌       | 54717/216925 [01:07<03:08, 862.11 examples/s]Map:  25%|██▍       | 53411/216925 [01:06<03:12, 847.45 examples/s]Map:  25%|██▌       | 54545/216925 [01:06<03:08, 862.90 examples/s]Map:  25%|██▌       | 54807/216925 [01:07<03:06, 871.54 examples/s]Map:  24%|██▍       | 52088/216925 [01:07<03:53, 707.15 examples/s]Map:  25%|██▌       | 54634/216925 [01:06<03:06, 869.22 examples/s]Map:  25%|██▍       | 53541/216925 [01:06<03:11, 851.53 examples/s]Map:  24%|██▍       | 52179/216925 [01:08<03:39, 749.31 examples/s]Map:  25%|██▌       | 54942/216925 [01:07<03:04, 878.19 examples/s]Map:  25%|██▌       | 54727/216925 [01:06<03:03, 883.53 examples/s]Map:  24%|██▍       | 52272/216925 [01:08<03:28, 790.91 examples/s]Map:  25%|██▍       | 53663/216925 [01:06<03:14, 838.02 examples/s]Map:  24%|██▍       | 52363/216925 [01:08<03:20, 819.66 examples/s]Map:  25%|██▌       | 54858/216925 [01:06<03:05, 875.43 examples/s]Map:  25%|██▍       | 53753/216925 [01:06<03:11, 850.87 examples/s]Map:  25%|██▌       | 55045/216925 [01:08<03:52, 697.31 examples/s]Map:  24%|██▍       | 52453/216925 [01:08<03:15, 839.20 examples/s]Map:  25%|██▌       | 54951/216925 [01:07<03:02, 888.66 examples/s]Map:  25%|██▍       | 53847/216925 [01:07<03:07, 870.01 examples/s]Map:  25%|██▌       | 55135/216925 [01:08<03:38, 741.46 examples/s]Map:  24%|██▍       | 52544/216925 [01:08<03:12, 855.71 examples/s]Map:  25%|██▍       | 53937/216925 [01:07<03:06, 875.37 examples/s]Map:  25%|██▌       | 55222/216925 [01:08<03:29, 771.48 examples/s]Map:  24%|██▍       | 52636/216925 [01:08<03:08, 871.59 examples/s]Map:  25%|██▌       | 55044/216925 [01:07<03:51, 698.62 examples/s]Map:  25%|██▌       | 55309/216925 [01:08<03:23, 795.31 examples/s]Map:  24%|██▍       | 52727/216925 [01:08<03:06, 878.97 examples/s]Map:  25%|██▌       | 55136/216925 [01:07<03:36, 748.18 examples/s]Map:  25%|██▍       | 54043/216925 [01:07<03:48, 713.29 examples/s]Map:  26%|██▌       | 55399/216925 [01:08<03:17, 819.29 examples/s]Map:  24%|██▍       | 52817/216925 [01:08<03:06, 882.16 examples/s]Map:  25%|██▌       | 55226/216925 [01:07<03:26, 782.41 examples/s]Map:  25%|██▍       | 54138/216925 [01:07<03:32, 766.00 examples/s]Map:  26%|██▌       | 55484/216925 [01:08<03:15, 824.79 examples/s]Map:  25%|██▌       | 55315/216925 [01:07<03:19, 808.48 examples/s]Map:  24%|██▍       | 52948/216925 [01:08<03:07, 873.57 examples/s]Map:  25%|██▍       | 54228/216925 [01:07<03:23, 798.00 examples/s]Map:  26%|██▌       | 55573/216925 [01:08<03:11, 841.59 examples/s]Map:  26%|██▌       | 55409/216925 [01:07<03:11, 842.25 examples/s]Map:  25%|██▌       | 54319/216925 [01:07<03:17, 824.62 examples/s]Map:  26%|██▌       | 55663/216925 [01:08<03:08, 857.59 examples/s]Map:  26%|██▌       | 55501/216925 [01:07<03:07, 860.86 examples/s]Map:  25%|██▌       | 54409/216925 [01:07<03:12, 842.53 examples/s]Map:  26%|██▌       | 55751/216925 [01:08<03:06, 862.73 examples/s]Map:  24%|██▍       | 53044/216925 [01:09<03:53, 701.05 examples/s]Map:  26%|██▌       | 55592/216925 [01:07<03:04, 874.48 examples/s]Map:  25%|██▌       | 54497/216925 [01:07<03:11, 850.07 examples/s]Map:  24%|██▍       | 53135/216925 [01:09<03:39, 746.88 examples/s]Map:  26%|██▌       | 55880/216925 [01:09<03:07, 859.59 examples/s]Map:  26%|██▌       | 55683/216925 [01:07<03:02, 882.74 examples/s]Map:  25%|██▌       | 54585/216925 [01:07<03:09, 856.11 examples/s]Map:  25%|██▍       | 53226/216925 [01:09<03:28, 784.04 examples/s]Map:  25%|██▍       | 53315/216925 [01:09<03:21, 810.88 examples/s]Map:  26%|██▌       | 55811/216925 [01:08<03:05, 868.61 examples/s]Map:  25%|██▌       | 54704/216925 [01:08<03:16, 826.61 examples/s]Map:  26%|██▌       | 56000/216925 [01:09<04:00, 667.81 examples/s]Map:  26%|██▌       | 55900/216925 [01:08<03:04, 871.65 examples/s]Map:  25%|██▍       | 53436/216925 [01:09<03:22, 806.72 examples/s]Map:  25%|██▌       | 54793/216925 [01:08<03:12, 841.14 examples/s]Map:  26%|██▌       | 56087/216925 [01:09<03:46, 709.15 examples/s]Map:  26%|██▌       | 55989/216925 [01:08<03:03, 875.48 examples/s]Map:  25%|██▍       | 53525/216925 [01:09<03:18, 825.15 examples/s]Map:  25%|██▌       | 54884/216925 [01:08<03:09, 855.43 examples/s]Map:  26%|██▌       | 56172/216925 [01:09<03:37, 740.61 examples/s]Map:  25%|██▍       | 53610/216925 [01:09<03:17, 828.89 examples/s]Map:  25%|██▌       | 54972/216925 [01:08<03:08, 858.40 examples/s]Map:  26%|██▌       | 56257/216925 [01:09<03:29, 766.31 examples/s]Map:  26%|██▌       | 56089/216925 [01:08<03:51, 694.12 examples/s]Map:  25%|██▍       | 53695/216925 [01:09<03:16, 832.42 examples/s]Map:  26%|██▌       | 56339/216925 [01:09<03:26, 778.16 examples/s]Map:  26%|██▌       | 56181/216925 [01:08<03:35, 745.11 examples/s]Map:  25%|██▍       | 53782/216925 [01:09<03:14, 839.29 examples/s]Map:  25%|██▌       | 55085/216925 [01:08<03:56, 685.14 examples/s]Map:  26%|██▌       | 56424/216925 [01:09<03:21, 795.44 examples/s]Map:  26%|██▌       | 56274/216925 [01:08<03:23, 790.37 examples/s]Map:  25%|██▌       | 55172/216925 [01:08<03:43, 725.21 examples/s]Map:  25%|██▍       | 53906/216925 [01:10<03:15, 832.54 examples/s]Map:  26%|██▌       | 56507/216925 [01:09<03:19, 803.04 examples/s]Map:  26%|██▌       | 56369/216925 [01:08<03:13, 829.94 examples/s]Map:  25%|██▌       | 55263/216925 [01:08<03:30, 767.23 examples/s]Map:  25%|██▍       | 53993/216925 [01:10<03:13, 842.07 examples/s]Map:  26%|██▌       | 56590/216925 [01:10<03:18, 809.14 examples/s]Map:  26%|██▌       | 56463/216925 [01:08<03:07, 857.35 examples/s]Map:  26%|██▌       | 55352/216925 [01:08<03:22, 796.29 examples/s]Map:  26%|██▌       | 56674/216925 [01:10<03:16, 814.98 examples/s]Map:  26%|██▌       | 56557/216925 [01:08<03:02, 877.89 examples/s]Map:  26%|██▌       | 55442/216925 [01:09<03:16, 821.02 examples/s]Map:  25%|██▍       | 54082/216925 [01:10<04:05, 663.13 examples/s]Map:  26%|██▌       | 56759/216925 [01:10<03:15, 820.04 examples/s]Map:  26%|██▌       | 55529/216925 [01:09<03:13, 832.09 examples/s]Map:  26%|██▌       | 56693/216925 [01:09<03:00, 885.93 examples/s]Map:  25%|██▍       | 54167/216925 [01:10<03:50, 704.87 examples/s]Map:  26%|██▌       | 56846/216925 [01:10<03:12, 830.38 examples/s]Map:  26%|██▌       | 55619/216925 [01:09<03:10, 848.65 examples/s]Map:  25%|██▌       | 54251/216925 [01:10<03:40, 736.21 examples/s]Map:  26%|██▌       | 56931/216925 [01:10<03:11, 834.48 examples/s]Map:  26%|██▌       | 56823/216925 [01:09<03:03, 873.16 examples/s]Map:  26%|██▌       | 55739/216925 [01:09<03:14, 827.28 examples/s]Map:  25%|██▌       | 54363/216925 [01:10<03:40, 736.33 examples/s]Map:  26%|██▋       | 56946/216925 [01:09<03:07, 852.32 examples/s]Map:  26%|██▌       | 55831/216925 [01:09<03:10, 846.83 examples/s]Map:  26%|██▋       | 57042/216925 [01:10<04:09, 640.69 examples/s]Map:  25%|██▌       | 54450/216925 [01:10<03:32, 764.95 examples/s]Map:  26%|██▌       | 55922/216925 [01:09<03:07, 859.96 examples/s]Map:  26%|██▋       | 57124/216925 [01:10<03:54, 680.67 examples/s]Map:  25%|██▌       | 54535/216925 [01:10<03:27, 784.01 examples/s]Map:  26%|██▋       | 57046/216925 [01:09<03:46, 705.75 examples/s]Map:  26%|██▋       | 57209/216925 [01:10<03:41, 719.84 examples/s]Map:  25%|██▌       | 54620/216925 [01:11<03:23, 798.50 examples/s]Map:  26%|██▋       | 57138/216925 [01:09<03:33, 750.17 examples/s]Map:  26%|██▋       | 57295/216925 [01:11<03:31, 753.52 examples/s]Map:  25%|██▌       | 54705/216925 [01:11<03:19, 811.59 examples/s]Map:  26%|██▌       | 56043/216925 [01:09<03:50, 696.51 examples/s]Map:  26%|██▋       | 57231/216925 [01:09<03:22, 790.19 examples/s]Map:  26%|██▋       | 57384/216925 [01:11<03:22, 787.49 examples/s]Map:  25%|██▌       | 54790/216925 [01:11<03:18, 818.47 examples/s]Map:  26%|██▌       | 56137/216925 [01:09<03:34, 749.16 examples/s]Map:  26%|██▋       | 57326/216925 [01:09<03:12, 828.67 examples/s]Map:  26%|██▋       | 57472/216925 [01:11<03:16, 810.66 examples/s]Map:  25%|██▌       | 54878/216925 [01:11<03:14, 834.59 examples/s]Map:  26%|██▌       | 56228/216925 [01:10<03:24, 786.66 examples/s]Map:  26%|██▋       | 57422/216925 [01:10<03:05, 859.11 examples/s]Map:  27%|██▋       | 57560/216925 [01:11<03:12, 827.77 examples/s]Map:  26%|██▌       | 56319/216925 [01:10<03:16, 815.93 examples/s]Map:  27%|██▋       | 57515/216925 [01:10<03:02, 874.61 examples/s]Map:  25%|██▌       | 54998/216925 [01:11<03:17, 818.54 examples/s]Map:  27%|██▋       | 57650/216925 [01:11<03:08, 843.00 examples/s]Map:  26%|██▌       | 56407/216925 [01:10<03:12, 831.99 examples/s]Map:  27%|██▋       | 57648/216925 [01:10<03:02, 873.17 examples/s]Map:  27%|██▋       | 57737/216925 [01:11<03:07, 848.87 examples/s]Map:  26%|██▌       | 56499/216925 [01:10<03:07, 855.77 examples/s]Map:  25%|██▌       | 55085/216925 [01:11<04:08, 651.20 examples/s]Map:  27%|██▋       | 57738/216925 [01:10<03:01, 877.16 examples/s]Map:  27%|██▋       | 57825/216925 [01:11<03:06, 855.04 examples/s]Map:  26%|██▌       | 56589/216925 [01:10<03:05, 866.29 examples/s]Map:  25%|██▌       | 55169/216925 [01:11<03:53, 691.38 examples/s]Map:  27%|██▋       | 57831/216925 [01:10<02:59, 888.11 examples/s]Map:  27%|██▋       | 57913/216925 [01:11<03:04, 861.30 examples/s]Map:  25%|██▌       | 55249/216925 [01:11<03:46, 714.66 examples/s]Map:  26%|██▌       | 56714/216925 [01:10<03:09, 844.67 examples/s]Map:  27%|██▋       | 57954/216925 [01:10<03:04, 861.54 examples/s]Map:  26%|██▌       | 55328/216925 [01:12<03:40, 733.09 examples/s]Map:  27%|██▋       | 58000/216925 [01:11<04:04, 649.87 examples/s]Map:  26%|██▌       | 56835/216925 [01:10<03:13, 829.21 examples/s]Map:  26%|██▌       | 55414/216925 [01:12<03:30, 765.59 examples/s]Map:  27%|██▋       | 58084/216925 [01:12<03:49, 693.57 examples/s]Map:  26%|██▌       | 56927/216925 [01:10<03:08, 850.54 examples/s]Map:  26%|██▌       | 55499/216925 [01:12<03:25, 786.67 examples/s]Map:  27%|██▋       | 58084/216925 [01:10<03:48, 695.90 examples/s]Map:  27%|██▋       | 58171/216925 [01:12<03:36, 732.12 examples/s]Map:  26%|██▌       | 55588/216925 [01:12<03:18, 811.62 examples/s]Map:  27%|██▋       | 58176/216925 [01:11<03:34, 740.25 examples/s]Map:  27%|██▋       | 58258/216925 [01:12<03:26, 766.67 examples/s]Map:  26%|██▋       | 57043/216925 [01:11<03:46, 705.56 examples/s]Map:  26%|██▌       | 55676/216925 [01:12<03:15, 826.53 examples/s]Map:  27%|██▋       | 58267/216925 [01:11<03:24, 777.40 examples/s]Map:  27%|██▋       | 58346/216925 [01:12<03:19, 795.35 examples/s]Map:  26%|██▋       | 57130/216925 [01:11<03:35, 741.51 examples/s]Map:  27%|██▋       | 58357/216925 [01:11<03:17, 803.85 examples/s]Map:  27%|██▋       | 58437/216925 [01:12<03:11, 826.53 examples/s]Map:  26%|██▌       | 55803/216925 [01:12<03:14, 829.59 examples/s]Map:  26%|██▋       | 57219/216925 [01:11<03:25, 776.07 examples/s]Map:  27%|██▋       | 58451/216925 [01:11<03:09, 836.35 examples/s]Map:  27%|██▋       | 58526/216925 [01:12<03:08, 842.43 examples/s]Map:  26%|██▌       | 55890/216925 [01:12<03:12, 836.80 examples/s]Map:  26%|██▋       | 57304/216925 [01:11<03:21, 792.28 examples/s]Map:  27%|██▋       | 58542/216925 [01:11<03:05, 853.35 examples/s]Map:  27%|██▋       | 58616/216925 [01:12<03:04, 857.54 examples/s]Map:  26%|██▌       | 55979/216925 [01:12<03:09, 849.04 examples/s]Map:  26%|██▋       | 57392/216925 [01:11<03:16, 812.40 examples/s]Map:  26%|██▋       | 57480/216925 [01:11<03:12, 828.69 examples/s]Map:  27%|██▋       | 58675/216925 [01:11<03:03, 862.51 examples/s]Map:  27%|██▋       | 58747/216925 [01:12<03:03, 860.40 examples/s]Map:  26%|██▌       | 56088/216925 [01:13<03:55, 682.54 examples/s]Map:  27%|██▋       | 57571/216925 [01:11<03:07, 848.90 examples/s]Map:  27%|██▋       | 58835/216925 [01:12<03:02, 863.94 examples/s]Map:  27%|██▋       | 58808/216925 [01:11<03:02, 867.08 examples/s]Map:  26%|██▌       | 56174/216925 [01:13<03:43, 719.44 examples/s]Map:  27%|██▋       | 58929/216925 [01:13<02:58, 883.98 examples/s]Map:  27%|██▋       | 57699/216925 [01:11<03:07, 849.71 examples/s]Map:  27%|██▋       | 58899/216925 [01:11<03:00, 873.18 examples/s]Map:  26%|██▌       | 56252/216925 [01:13<03:39, 731.53 examples/s]Map:  27%|██▋       | 57824/216925 [01:11<03:09, 839.05 examples/s]Map:  26%|██▌       | 56342/216925 [01:13<03:27, 773.77 examples/s]Map:  27%|██▋       | 59043/216925 [01:13<03:49, 689.21 examples/s]Map:  27%|██▋       | 59000/216925 [01:12<03:49, 687.95 examples/s]Map:  27%|██▋       | 57918/216925 [01:12<03:04, 862.03 examples/s]Map:  26%|██▌       | 56429/216925 [01:13<03:21, 797.84 examples/s]Map:  27%|██▋       | 59132/216925 [01:13<03:35, 733.05 examples/s]Map:  27%|██▋       | 59093/216925 [01:12<03:33, 738.12 examples/s]Map:  26%|██▌       | 56515/216925 [01:13<03:17, 811.28 examples/s]Map:  27%|██▋       | 59220/216925 [01:13<03:25, 765.71 examples/s]Map:  27%|██▋       | 59185/216925 [01:12<03:22, 779.64 examples/s]Map:  26%|██▌       | 56608/216925 [01:13<03:10, 841.81 examples/s]Map:  27%|██▋       | 58043/216925 [01:12<03:43, 711.29 examples/s]Map:  27%|██▋       | 59308/216925 [01:13<03:19, 791.90 examples/s]Map:  27%|██▋       | 59274/216925 [01:12<03:15, 805.73 examples/s]Map:  26%|██▌       | 56702/216925 [01:13<03:04, 867.70 examples/s]Map:  27%|██▋       | 58128/216925 [01:12<03:34, 739.24 examples/s]Map:  27%|██▋       | 59393/216925 [01:13<03:15, 805.09 examples/s]Map:  27%|██▋       | 59362/216925 [01:12<03:11, 823.41 examples/s]Map:  27%|██▋       | 58217/216925 [01:12<03:25, 773.21 examples/s]Map:  26%|██▌       | 56830/216925 [01:13<03:06, 857.76 examples/s]Map:  27%|██▋       | 59484/216925 [01:13<03:09, 830.76 examples/s]Map:  27%|██▋       | 59451/216925 [01:12<03:07, 839.23 examples/s]Map:  27%|██▋       | 58304/216925 [01:12<03:19, 795.65 examples/s]Map:  26%|██▌       | 56921/216925 [01:13<03:04, 868.21 examples/s]Map:  27%|██▋       | 59572/216925 [01:13<03:06, 843.07 examples/s]Map:  27%|██▋       | 59544/216925 [01:12<03:02, 862.26 examples/s]Map:  27%|██▋       | 58395/216925 [01:12<03:12, 823.47 examples/s]Map:  28%|██▊       | 59660/216925 [01:13<03:04, 851.00 examples/s]Map:  27%|██▋       | 59634/216925 [01:12<03:00, 869.20 examples/s]Map:  27%|██▋       | 58484/216925 [01:12<03:09, 836.60 examples/s]Map:  28%|██▊       | 59747/216925 [01:14<03:03, 855.39 examples/s]Map:  26%|██▋       | 57042/216925 [01:14<03:48, 699.01 examples/s]Map:  28%|██▊       | 59725/216925 [01:12<02:59, 876.27 examples/s]Map:  27%|██▋       | 58573/216925 [01:12<03:06, 850.04 examples/s]Map:  28%|██▊       | 59838/216925 [01:14<03:00, 868.61 examples/s]Map:  26%|██▋       | 57136/216925 [01:14<03:33, 749.91 examples/s]Map:  28%|██▊       | 59815/216925 [01:12<02:58, 880.84 examples/s]Map:  27%|██▋       | 58664/216925 [01:13<03:03, 863.54 examples/s]Map:  26%|██▋       | 57227/216925 [01:14<03:23, 785.59 examples/s]Map:  28%|██▊       | 59908/216925 [01:13<02:56, 889.32 examples/s]Map:  28%|██▊       | 59964/216925 [01:14<03:03, 854.16 examples/s]Map:  27%|██▋       | 58789/216925 [01:13<03:06, 848.37 examples/s]Map:  26%|██▋       | 57356/216925 [01:14<03:18, 805.69 examples/s]Map:  27%|██▋       | 58878/216925 [01:13<03:04, 856.47 examples/s]Map:  28%|██▊       | 60000/216925 [01:13<03:52, 675.59 examples/s]Map:  26%|██▋       | 57443/216925 [01:14<03:15, 817.82 examples/s]Map:  28%|██▊       | 60093/216925 [01:14<03:43, 701.59 examples/s]Map:  27%|██▋       | 58971/216925 [01:13<03:00, 872.83 examples/s]Map:  28%|██▊       | 60094/216925 [01:13<03:33, 734.99 examples/s]Map:  27%|██▋       | 57532/216925 [01:14<03:11, 834.05 examples/s]Map:  28%|██▊       | 60183/216925 [01:14<03:31, 742.71 examples/s]Map:  28%|██▊       | 60189/216925 [01:13<03:19, 787.29 examples/s]Map:  28%|██▊       | 60271/216925 [01:14<03:22, 773.89 examples/s]Map:  27%|██▋       | 57658/216925 [01:14<03:10, 833.89 examples/s]Map:  28%|██▊       | 60278/216925 [01:13<03:12, 811.92 examples/s]Map:  27%|██▋       | 59087/216925 [01:13<03:45, 699.91 examples/s]Map:  28%|██▊       | 60362/216925 [01:14<03:14, 805.55 examples/s]Map:  28%|██▊       | 60372/216925 [01:13<03:05, 843.72 examples/s]Map:  27%|██▋       | 59174/216925 [01:13<03:34, 736.05 examples/s]Map:  27%|██▋       | 57776/216925 [01:15<03:15, 814.25 examples/s]Map:  28%|██▊       | 60448/216925 [01:14<03:11, 818.25 examples/s]Map:  28%|██▊       | 60461/216925 [01:13<03:03, 852.79 examples/s]Map:  27%|██▋       | 59265/216925 [01:13<03:22, 777.86 examples/s]Map:  27%|██▋       | 57859/216925 [01:15<03:15, 814.43 examples/s]Map:  28%|██▊       | 60534/216925 [01:15<03:09, 825.43 examples/s]Map:  28%|██▊       | 60551/216925 [01:13<03:01, 860.56 examples/s]Map:  27%|██▋       | 59355/216925 [01:13<03:15, 805.38 examples/s]Map:  28%|██▊       | 60623/216925 [01:15<03:05, 841.42 examples/s]Map:  27%|██▋       | 57978/216925 [01:15<03:17, 804.23 examples/s]Map:  28%|██▊       | 60641/216925 [01:14<02:59, 869.34 examples/s]Map:  27%|██▋       | 59446/216925 [01:14<03:09, 831.23 examples/s]Map:  28%|██▊       | 60710/216925 [01:15<03:04, 844.54 examples/s]Map:  27%|██▋       | 59537/216925 [01:14<03:05, 850.61 examples/s]Map:  28%|██▊       | 60774/216925 [01:14<02:59, 870.61 examples/s]Map:  28%|██▊       | 60803/216925 [01:15<03:00, 865.13 examples/s]Map:  27%|██▋       | 59625/216925 [01:14<03:04, 853.39 examples/s]Map:  27%|██▋       | 58080/216925 [01:15<04:05, 647.47 examples/s]Map:  28%|██▊       | 60893/216925 [01:15<02:58, 873.12 examples/s]Map:  28%|██▊       | 60869/216925 [01:14<02:55, 888.72 examples/s]Map:  28%|██▊       | 59714/216925 [01:14<03:02, 859.14 examples/s]Map:  27%|██▋       | 58161/216925 [01:15<03:53, 679.74 examples/s]Map:  28%|██▊       | 60984/216925 [01:15<02:56, 882.13 examples/s]Map:  28%|██▊       | 59839/216925 [01:14<03:06, 844.43 examples/s]Map:  27%|██▋       | 58263/216925 [01:15<03:54, 675.33 examples/s]Map:  28%|██▊       | 61000/216925 [01:14<03:40, 706.05 examples/s]Map:  28%|██▊       | 59927/216925 [01:14<03:04, 851.27 examples/s]Map:  27%|██▋       | 58335/216925 [01:15<03:52, 682.76 examples/s]Map:  28%|██▊       | 61093/216925 [01:15<03:47, 684.27 examples/s]Map:  28%|██▊       | 61091/216925 [01:14<03:27, 749.69 examples/s]Map:  27%|██▋       | 58421/216925 [01:16<03:39, 723.66 examples/s]Map:  28%|██▊       | 61183/216925 [01:15<03:32, 732.76 examples/s]Map:  28%|██▊       | 61181/216925 [01:14<03:18, 782.64 examples/s]Map:  27%|██▋       | 58500/216925 [01:16<03:34, 738.63 examples/s]Map:  28%|██▊       | 61274/216925 [01:15<03:20, 776.07 examples/s]Map:  28%|██▊       | 60041/216925 [01:14<03:46, 693.93 examples/s]Map:  28%|██▊       | 61274/216925 [01:14<03:10, 817.66 examples/s]Map:  27%|██▋       | 58583/216925 [01:16<03:28, 759.47 examples/s]Map:  28%|██▊       | 61360/216925 [01:16<03:15, 795.85 examples/s]Map:  28%|██▊       | 60129/216925 [01:14<03:33, 734.31 examples/s]Map:  28%|██▊       | 61400/216925 [01:14<03:09, 821.78 examples/s]Map:  27%|██▋       | 58669/216925 [01:16<03:21, 786.33 examples/s]Map:  28%|██▊       | 60221/216925 [01:14<03:21, 777.64 examples/s]Map:  28%|██▊       | 61485/216925 [01:16<03:13, 804.22 examples/s]Map:  28%|██▊       | 61490/216925 [01:15<03:05, 839.37 examples/s]Map:  27%|██▋       | 58753/216925 [01:16<03:17, 799.18 examples/s]Map:  28%|██▊       | 60311/216925 [01:15<03:14, 806.95 examples/s]Map:  28%|██▊       | 61575/216925 [01:16<03:07, 826.90 examples/s]Map:  28%|██▊       | 61583/216925 [01:15<03:00, 860.91 examples/s]Map:  27%|██▋       | 58835/216925 [01:16<03:17, 801.54 examples/s]Map:  28%|██▊       | 60400/216925 [01:15<03:09, 825.24 examples/s]Map:  28%|██▊       | 61668/216925 [01:16<03:02, 851.97 examples/s]Map:  28%|██▊       | 61672/216925 [01:15<02:59, 865.96 examples/s]Map:  27%|██▋       | 58919/216925 [01:16<03:15, 806.94 examples/s]Map:  28%|██▊       | 60488/216925 [01:15<03:06, 839.40 examples/s]Map:  28%|██▊       | 61759/216925 [01:16<02:59, 863.60 examples/s]Map:  28%|██▊       | 61762/216925 [01:15<02:58, 868.62 examples/s]Map:  28%|██▊       | 60576/216925 [01:15<03:04, 848.84 examples/s]Map:  29%|██▊       | 61854/216925 [01:15<02:56, 880.99 examples/s]Map:  29%|██▊       | 61891/216925 [01:16<02:58, 867.25 examples/s]Map:  28%|██▊       | 60671/216925 [01:15<02:58, 873.31 examples/s]Map:  27%|██▋       | 59040/216925 [01:16<04:04, 646.02 examples/s]Map:  29%|██▊       | 61943/216925 [01:15<02:56, 879.22 examples/s]Map:  29%|██▊       | 61980/216925 [01:16<02:57, 870.71 examples/s]Map:  28%|██▊       | 60763/216925 [01:15<02:57, 882.16 examples/s]Map:  27%|██▋       | 59122/216925 [01:16<03:51, 682.59 examples/s]Map:  28%|██▊       | 60853/216925 [01:15<02:56, 882.26 examples/s]Map:  27%|██▋       | 59208/216925 [01:17<03:38, 722.12 examples/s]Map:  29%|██▊       | 62037/216925 [01:15<03:53, 663.45 examples/s]Map:  29%|██▊       | 62079/216925 [01:17<03:49, 674.98 examples/s]Map:  27%|██▋       | 59294/216925 [01:17<03:29, 753.68 examples/s]Map:  28%|██▊       | 60974/216925 [01:15<03:03, 849.88 examples/s]Map:  29%|██▊       | 62133/216925 [01:15<03:31, 730.55 examples/s]Map:  29%|██▊       | 62165/216925 [01:17<03:36, 714.01 examples/s]Map:  27%|██▋       | 59382/216925 [01:17<03:20, 785.54 examples/s]Map:  29%|██▊       | 62222/216925 [01:15<03:21, 769.20 examples/s]Map:  29%|██▊       | 62252/216925 [01:17<03:26, 748.85 examples/s]Map:  27%|██▋       | 59470/216925 [01:17<03:14, 809.47 examples/s]Map:  28%|██▊       | 61085/216925 [01:16<03:44, 693.70 examples/s]Map:  29%|██▊       | 62316/216925 [01:16<03:10, 811.89 examples/s]Map:  29%|██▊       | 62340/216925 [01:17<03:18, 779.77 examples/s]Map:  27%|██▋       | 59557/216925 [01:17<03:11, 822.99 examples/s]Map:  28%|██▊       | 61173/216925 [01:16<03:32, 733.40 examples/s]Map:  29%|██▉       | 62404/216925 [01:16<03:06, 829.32 examples/s]Map:  29%|██▉       | 62431/216925 [01:17<03:10, 812.12 examples/s]Map:  28%|██▊       | 61260/216925 [01:16<03:23, 765.63 examples/s]Map:  28%|██▊       | 59683/216925 [01:17<03:10, 824.91 examples/s]Map:  29%|██▉       | 62491/216925 [01:16<03:04, 838.74 examples/s]Map:  29%|██▉       | 62560/216925 [01:17<03:06, 826.58 examples/s]Map:  28%|██▊       | 61349/216925 [01:16<03:15, 795.54 examples/s]Map:  28%|██▊       | 59768/216925 [01:17<03:10, 826.93 examples/s]Map:  29%|██▉       | 62584/216925 [01:16<02:59, 860.86 examples/s]Map:  29%|██▉       | 62649/216925 [01:17<03:03, 838.80 examples/s]Map:  28%|██▊       | 61441/216925 [01:16<03:08, 826.87 examples/s]Map:  28%|██▊       | 59855/216925 [01:17<03:07, 836.37 examples/s]Map:  29%|██▉       | 62677/216925 [01:16<02:55, 878.03 examples/s]Map:  29%|██▉       | 62737/216925 [01:17<03:02, 847.17 examples/s]Map:  28%|██▊       | 61529/216925 [01:16<03:04, 840.82 examples/s]Map:  29%|██▉       | 62769/216925 [01:16<02:54, 884.24 examples/s]Map:  28%|██▊       | 59978/216925 [01:17<03:09, 826.14 examples/s]Map:  29%|██▉       | 62824/216925 [01:17<03:01, 850.08 examples/s]Map:  29%|██▉       | 62859/216925 [01:16<02:53, 886.88 examples/s]Map:  28%|██▊       | 61659/216925 [01:16<03:03, 846.87 examples/s]Map:  29%|██▉       | 62952/216925 [01:16<02:51, 897.58 examples/s]Map:  29%|██▉       | 62951/216925 [01:18<03:01, 847.54 examples/s]Map:  28%|██▊       | 61750/216925 [01:16<03:00, 860.58 examples/s]Map:  28%|██▊       | 60086/216925 [01:18<03:53, 670.36 examples/s]Map:  29%|██▊       | 61840/216925 [01:16<02:58, 867.81 examples/s]Map:  28%|██▊       | 60174/216925 [01:18<03:39, 714.46 examples/s]Map:  29%|██▉       | 63043/216925 [01:17<03:40, 698.09 examples/s]Map:  29%|██▊       | 61971/216925 [01:17<02:58, 867.05 examples/s]Map:  29%|██▉       | 63079/216925 [01:18<03:46, 679.73 examples/s]Map:  29%|██▉       | 63130/216925 [01:17<03:28, 737.59 examples/s]Map:  28%|██▊       | 60292/216925 [01:18<03:33, 734.25 examples/s]Map:  29%|██▉       | 63167/216925 [01:18<03:33, 719.99 examples/s]Map:  29%|██▉       | 63220/216925 [01:17<03:17, 778.94 examples/s]Map:  28%|██▊       | 60377/216925 [01:18<03:26, 758.26 examples/s]Map:  29%|██▉       | 63248/216925 [01:18<03:28, 737.60 examples/s]Map:  29%|██▉       | 63312/216925 [01:17<03:08, 815.10 examples/s]Map:  29%|██▊       | 62086/216925 [01:17<03:39, 705.36 examples/s]Map:  28%|██▊       | 60462/216925 [01:18<03:20, 779.06 examples/s]Map:  29%|██▉       | 63334/216925 [01:18<03:20, 766.47 examples/s]Map:  29%|██▉       | 63405/216925 [01:17<03:01, 843.67 examples/s]Map:  29%|██▊       | 62177/216925 [01:17<03:26, 748.67 examples/s]Map:  28%|██▊       | 60545/216925 [01:18<03:17, 790.29 examples/s]Map:  29%|██▉       | 63420/216925 [01:18<03:14, 788.67 examples/s]Map:  29%|██▉       | 63500/216925 [01:17<02:56, 868.75 examples/s]Map:  29%|██▊       | 62266/216925 [01:17<03:18, 779.58 examples/s]Map:  28%|██▊       | 60632/216925 [01:18<03:13, 809.43 examples/s]Map:  29%|██▉       | 63511/216925 [01:18<03:07, 818.67 examples/s]Map:  29%|██▊       | 62357/216925 [01:17<03:11, 807.99 examples/s]Map:  28%|██▊       | 60717/216925 [01:18<03:10, 819.02 examples/s]Map:  29%|██▉       | 63630/216925 [01:17<02:57, 865.37 examples/s]Map:  29%|██▉       | 62445/216925 [01:17<03:07, 824.96 examples/s]Map:  28%|██▊       | 60805/216925 [01:19<03:07, 834.16 examples/s]Map:  29%|██▉       | 63637/216925 [01:18<03:06, 823.82 examples/s]Map:  29%|██▉       | 63719/216925 [01:17<02:56, 869.09 examples/s]Map:  29%|██▉       | 62532/216925 [01:17<03:04, 835.00 examples/s]Map:  28%|██▊       | 60892/216925 [01:19<03:05, 840.63 examples/s]Map:  29%|██▉       | 63722/216925 [01:19<03:04, 828.43 examples/s]Map:  29%|██▉       | 63808/216925 [01:17<02:55, 873.26 examples/s]Map:  29%|██▉       | 62622/216925 [01:17<03:01, 851.29 examples/s]Map:  28%|██▊       | 60980/216925 [01:19<03:03, 851.68 examples/s]Map:  29%|██▉       | 63808/216925 [01:19<03:03, 835.86 examples/s]Map:  29%|██▉       | 63937/216925 [01:18<02:57, 864.15 examples/s]Map:  29%|██▉       | 62714/216925 [01:18<02:58, 865.76 examples/s]Map:  29%|██▉       | 63893/216925 [01:19<03:02, 838.07 examples/s]Map:  29%|██▉       | 62804/216925 [01:18<02:56, 871.93 examples/s]Map:  29%|██▉       | 63981/216925 [01:19<03:00, 845.68 examples/s]Map:  28%|██▊       | 61084/216925 [01:19<03:53, 666.39 examples/s]Map:  29%|██▉       | 62896/216925 [01:18<02:54, 883.00 examples/s]Map:  30%|██▉       | 64042/216925 [01:18<03:40, 694.92 examples/s]Map:  28%|██▊       | 61169/216925 [01:19<03:40, 707.10 examples/s]Map:  29%|██▉       | 62986/216925 [01:18<02:54, 882.34 examples/s]Map:  30%|██▉       | 64133/216925 [01:18<03:26, 739.00 examples/s]Map:  28%|██▊       | 61249/216925 [01:19<03:33, 728.70 examples/s]Map:  30%|██▉       | 64083/216925 [01:19<03:51, 659.27 examples/s]Map:  30%|██▉       | 64220/216925 [01:18<03:19, 767.13 examples/s]Map:  28%|██▊       | 61334/216925 [01:19<03:24, 759.12 examples/s]Map:  30%|██▉       | 64172/216925 [01:19<03:35, 709.67 examples/s]Map:  30%|██▉       | 64309/216925 [01:18<03:11, 796.69 examples/s]Map:  29%|██▉       | 63088/216925 [01:18<03:41, 694.90 examples/s]Map:  28%|██▊       | 61419/216925 [01:19<03:19, 779.54 examples/s]Map:  30%|██▉       | 64258/216925 [01:19<03:25, 744.09 examples/s]Map:  30%|██▉       | 64403/216925 [01:18<03:03, 832.19 examples/s]Map:  29%|██▉       | 63182/216925 [01:18<03:24, 751.87 examples/s]Map:  28%|██▊       | 61507/216925 [01:20<03:13, 803.79 examples/s]Map:  30%|██▉       | 64349/216925 [01:19<03:14, 784.13 examples/s]Map:  30%|██▉       | 64495/216925 [01:18<02:58, 854.07 examples/s]Map:  29%|██▉       | 63271/216925 [01:18<03:16, 783.84 examples/s]Map:  30%|██▉       | 64437/216925 [01:19<03:09, 806.81 examples/s]Map:  28%|██▊       | 61623/216925 [01:20<03:17, 787.46 examples/s]Map:  30%|██▉       | 64588/216925 [01:18<02:54, 872.34 examples/s]Map:  29%|██▉       | 63361/216925 [01:18<03:08, 812.57 examples/s]Map:  30%|██▉       | 64521/216925 [01:20<03:07, 811.83 examples/s]Map:  30%|██▉       | 64681/216925 [01:18<02:52, 883.04 examples/s]Map:  29%|██▉       | 63452/216925 [01:18<03:04, 830.16 examples/s]Map:  28%|██▊       | 61710/216925 [01:20<03:38, 711.96 examples/s]Map:  30%|██▉       | 64608/216925 [01:20<03:04, 826.78 examples/s]Map:  29%|██▉       | 63544/216925 [01:19<02:59, 853.93 examples/s]Map:  28%|██▊       | 61791/216925 [01:20<03:31, 733.35 examples/s]Map:  30%|██▉       | 64816/216925 [01:19<02:51, 887.31 examples/s]Map:  30%|██▉       | 64737/216925 [01:20<03:02, 835.03 examples/s]Map:  29%|██▉       | 63632/216925 [01:19<02:58, 859.91 examples/s]Map:  29%|██▊       | 61870/216925 [01:20<03:27, 745.77 examples/s]Map:  30%|██▉       | 64908/216925 [01:19<02:49, 895.12 examples/s]Map:  30%|██▉       | 64823/216925 [01:20<03:01, 836.95 examples/s]Map:  29%|██▉       | 63722/216925 [01:19<02:56, 866.13 examples/s]Map:  29%|██▊       | 61956/216925 [01:20<03:20, 773.94 examples/s]Map:  30%|██▉       | 64911/216925 [01:20<02:59, 845.74 examples/s]Map:  29%|██▉       | 63813/216925 [01:19<02:54, 875.99 examples/s]Map:  30%|██▉       | 65000/216925 [01:19<03:33, 710.09 examples/s]Map:  30%|██▉       | 64997/216925 [01:20<02:59, 845.61 examples/s]Map:  30%|███       | 65087/216925 [01:19<03:23, 746.96 examples/s]Map:  29%|██▉       | 63941/216925 [01:19<02:57, 862.94 examples/s]Map:  29%|██▊       | 62076/216925 [01:20<04:06, 629.16 examples/s]Map:  30%|███       | 65181/216925 [01:19<03:11, 792.78 examples/s]Map:  29%|██▊       | 62162/216925 [01:20<03:48, 678.24 examples/s]Map:  30%|███       | 65087/216925 [01:20<03:49, 662.70 examples/s]Map:  30%|███       | 65272/216925 [01:19<03:04, 821.21 examples/s]Map:  30%|██▉       | 64042/216925 [01:19<03:36, 706.05 examples/s]Map:  29%|██▊       | 62250/216925 [01:21<03:33, 725.26 examples/s]Map:  30%|███       | 65177/216925 [01:20<03:31, 717.61 examples/s]Map:  30%|███       | 65365/216925 [01:19<02:58, 849.29 examples/s]Map:  30%|██▉       | 64136/216925 [01:19<03:21, 757.22 examples/s]Map:  29%|██▊       | 62338/216925 [01:21<03:22, 762.66 examples/s]Map:  30%|███       | 65265/216925 [01:21<03:20, 757.27 examples/s]Map:  30%|███       | 65455/216925 [01:19<02:55, 861.71 examples/s]Map:  30%|██▉       | 64223/216925 [01:19<03:14, 783.47 examples/s]Map:  29%|██▉       | 62423/216925 [01:21<03:16, 785.11 examples/s]Map:  30%|███       | 65352/216925 [01:21<03:13, 784.65 examples/s]Map:  30%|███       | 65546/216925 [01:20<02:54, 867.31 examples/s]Map:  30%|██▉       | 64313/216925 [01:20<03:08, 811.71 examples/s]Map:  29%|██▉       | 62513/216925 [01:21<03:09, 814.00 examples/s]Map:  30%|███       | 65443/216925 [01:21<03:05, 815.04 examples/s]Map:  30%|███       | 65637/216925 [01:20<02:52, 876.79 examples/s]Map:  30%|██▉       | 64401/216925 [01:20<03:04, 826.36 examples/s]Map:  29%|██▉       | 62601/216925 [01:21<03:05, 830.48 examples/s]Map:  30%|███       | 65532/216925 [01:21<03:02, 830.88 examples/s]Map:  30%|███       | 65727/216925 [01:20<02:51, 881.57 examples/s]Map:  30%|██▉       | 64490/216925 [01:20<03:01, 838.97 examples/s]Map:  29%|██▉       | 62689/216925 [01:21<03:03, 840.90 examples/s]Map:  30%|███       | 65622/216925 [01:21<02:58, 849.36 examples/s]Map:  30%|███       | 65819/216925 [01:20<02:49, 892.19 examples/s]Map:  30%|██▉       | 64580/216925 [01:20<02:58, 853.81 examples/s]Map:  29%|██▉       | 62778/216925 [01:21<03:00, 853.17 examples/s]Map:  30%|███       | 65713/216925 [01:21<02:54, 864.19 examples/s]Map:  30%|███       | 65910/216925 [01:20<02:48, 894.30 examples/s]Map:  30%|██▉       | 64673/216925 [01:20<02:54, 871.63 examples/s]Map:  29%|██▉       | 62866/216925 [01:21<02:59, 858.29 examples/s]Map:  30%|███       | 65802/216925 [01:21<02:54, 866.46 examples/s]Map:  30%|██▉       | 64765/216925 [01:20<02:52, 880.70 examples/s]Map:  29%|██▉       | 62998/216925 [01:21<02:58, 860.77 examples/s]Map:  30%|███       | 66000/216925 [01:20<03:38, 690.62 examples/s]Map:  30%|███       | 65933/216925 [01:21<02:54, 864.90 examples/s]Map:  30%|██▉       | 64856/216925 [01:20<02:51, 886.38 examples/s]Map:  30%|███       | 66087/216925 [01:20<03:26, 732.15 examples/s]Map:  30%|██▉       | 64989/216925 [01:20<02:51, 883.43 examples/s]Map:  29%|██▉       | 63086/216925 [01:22<03:45, 682.71 examples/s]Map:  31%|███       | 66180/216925 [01:20<03:12, 781.94 examples/s]Map:  30%|███       | 66042/216925 [01:22<03:37, 694.28 examples/s]Map:  29%|██▉       | 63175/216925 [01:22<03:31, 727.24 examples/s]Map:  31%|███       | 66268/216925 [01:20<03:06, 806.51 examples/s]Map:  30%|███       | 66137/216925 [01:22<03:21, 748.97 examples/s]Map:  30%|███       | 65088/216925 [01:20<03:34, 709.11 examples/s]Map:  29%|██▉       | 63262/216925 [01:22<03:22, 759.17 examples/s]Map:  31%|███       | 66360/216925 [01:21<03:00, 835.30 examples/s]Map:  31%|███       | 66230/216925 [01:22<03:10, 789.28 examples/s]Map:  30%|███       | 65176/216925 [01:21<03:23, 747.17 examples/s]Map:  29%|██▉       | 63354/216925 [01:22<03:12, 798.05 examples/s]Map:  31%|███       | 66452/216925 [01:21<02:56, 853.04 examples/s]Map:  31%|███       | 66322/216925 [01:22<03:03, 820.48 examples/s]Map:  30%|███       | 65269/216925 [01:21<03:11, 790.13 examples/s]Map:  29%|██▉       | 63440/216925 [01:22<03:09, 810.72 examples/s]Map:  31%|███       | 66542/216925 [01:21<02:53, 865.39 examples/s]Map:  31%|███       | 66412/216925 [01:22<02:58, 841.46 examples/s]Map:  30%|██���       | 65365/216925 [01:21<03:02, 830.31 examples/s]Map:  29%|██▉       | 63528/216925 [01:22<03:05, 828.46 examples/s]Map:  31%|███       | 66632/216925 [01:21<02:52, 872.53 examples/s]Map:  30%|███       | 65455/216925 [01:21<02:59, 845.04 examples/s]Map:  31%|███       | 66545/216925 [01:22<02:56, 851.84 examples/s]Map:  29%|██▉       | 63616/216925 [01:22<03:01, 842.46 examples/s]Map:  31%|███       | 66726/216925 [01:21<02:49, 888.13 examples/s]Map:  30%|███       | 65547/216925 [01:21<02:55, 861.69 examples/s]Map:  31%|███       | 66635/216925 [01:22<02:54, 862.64 examples/s]Map:  29%|██▉       | 63706/216925 [01:22<02:58, 857.03 examples/s]Map:  31%|███       | 66861/216925 [01:21<02:48, 890.70 examples/s]Map:  30%|███       | 65637/216925 [01:21<02:54, 866.61 examples/s]Map:  29%|██▉       | 63793/216925 [01:22<02:58, 857.40 examples/s]Map:  31%|███       | 66761/216925 [01:22<02:56, 852.90 examples/s]Map:  31%|███       | 66952/216925 [01:21<02:47, 894.36 examples/s]Map:  30%|███       | 65727/216925 [01:21<02:52, 874.22 examples/s]Map:  29%|██▉       | 63881/216925 [01:23<02:57, 861.32 examples/s]Map:  31%|███       | 66852/216925 [01:22<02:53, 865.74 examples/s]Map:  30%|███       | 65861/216925 [01:21<02:51, 879.30 examples/s]Map:  31%|███       | 66940/216925 [01:23<02:53, 866.62 examples/s]Map:  31%|███       | 67084/216925 [01:21<03:29, 714.03 examples/s]Map:  30%|██▉       | 64000/216925 [01:23<03:48, 668.53 examples/s]Map:  30%|███       | 65990/216925 [01:21<02:53, 870.17 examples/s]Map:  31%|███       | 67177/216925 [01:22<03:17, 759.39 examples/s]Map:  30%|██▉       | 64088/216925 [01:23<03:33, 715.70 examples/s]Map:  31%|███       | 67043/216925 [01:23<03:39, 684.18 examples/s]Map:  31%|███       | 67268/216925 [01:22<03:08, 792.78 examples/s]Map:  30%|██▉       | 64179/216925 [01:23<03:20, 762.24 examples/s]Map:  31%|███       | 67133/216925 [01:23<03:24, 732.11 examples/s]Map:  30%|███       | 66088/216925 [01:22<03:31, 713.71 examples/s]Map:  31%|███       | 67359/216925 [01:22<03:02, 818.78 examples/s]Map:  31%|███       | 67224/216925 [01:23<03:13, 772.92 examples/s]Map:  31%|███       | 66181/216925 [01:22<03:18, 760.17 examples/s]Map:  30%|██▉       | 64295/216925 [01:23<03:20, 763.06 examples/s]Map:  31%|███       | 67450/216925 [01:22<02:57, 840.27 examples/s]Map:  31%|███       | 67313/216925 [01:23<03:06, 801.91 examples/s]Map:  31%|███       | 66273/216925 [01:22<03:09, 796.44 examples/s]Map:  31%|███       | 67544/216925 [01:22<02:53, 863.28 examples/s]Map:  30%|██▉       | 64403/216925 [01:23<03:24, 746.07 examples/s]Map:  31%|███       | 67405/216925 [01:23<03:00, 829.09 examples/s]Map:  31%|███       | 66360/216925 [01:22<03:04, 815.00 examples/s]Map:  31%|███       | 67640/216925 [01:22<02:48, 888.41 examples/s]Map:  30%|██▉       | 64493/216925 [01:23<03:15, 781.24 examples/s]Map:  31%|███       | 67497/216925 [01:23<02:55, 852.58 examples/s]Map:  31%|███       | 66449/216925 [01:22<03:00, 834.06 examples/s]Map:  30%|██▉       | 64579/216925 [01:23<03:10, 800.23 examples/s]Map:  31%|███       | 67585/216925 [01:23<02:54, 857.59 examples/s]Map:  31%|███       | 67776/216925 [01:22<02:47, 891.34 examples/s]Map:  31%|███       | 66542/216925 [01:22<02:55, 857.10 examples/s]Map:  30%|██▉       | 64667/216925 [01:24<03:05, 821.11 examples/s]Map:  31%|███       | 67674/216925 [01:23<02:52, 864.91 examples/s]Map:  31%|███▏      | 67871/216925 [01:22<02:45, 902.24 examples/s]Map:  31%|███       | 66630/216925 [01:22<02:54, 859.53 examples/s]Map:  30%|██▉       | 64756/216925 [01:24<03:01, 838.68 examples/s]Map:  31%|███▏      | 67964/216925 [01:22<02:44, 907.84 examples/s]Map:  31%|███       | 66718/216925 [01:22<02:54, 862.14 examples/s]Map:  31%|███▏      | 67810/216925 [01:24<02:50, 873.48 examples/s]Map:  30%|██▉       | 64842/216925 [01:24<03:00, 843.83 examples/s]Map:  31%|███       | 66808/216925 [01:23<02:52, 868.43 examples/s]Map:  31%|███▏      | 67899/216925 [01:24<02:49, 877.22 examples/s]Map:  30%|██▉       | 64966/216925 [01:24<03:01, 835.50 examples/s]Map:  31%|███▏      | 68091/216925 [01:23<03:25, 724.99 examples/s]Map:  31%|███▏      | 67993/216925 [01:24<02:47, 890.67 examples/s]Map:  31%|███       | 66939/216925 [01:23<02:53, 865.94 examples/s]Map:  31%|███▏      | 68182/216925 [01:23<03:14, 764.83 examples/s]Map:  31%|███▏      | 68277/216925 [01:23<03:04, 806.42 examples/s]Map:  31%|███▏      | 68091/216925 [01:24<03:29, 709.23 examples/s]Map:  30%|███       | 65087/216925 [01:24<03:38, 695.16 examples/s]Map:  31%|███       | 67044/216925 [01:23<03:31, 708.18 examples/s]Map:  32%|███▏      | 68369/216925 [01:23<02:58, 834.11 examples/s]Map:  31%|███▏      | 68185/216925 [01:24<03:15, 761.05 examples/s]Map:  30%|███       | 65179/216925 [01:24<03:24, 742.28 examples/s]Map:  31%|███       | 67136/216925 [01:23<03:18, 754.42 examples/s]Map:  32%|███▏      | 68459/216925 [01:23<02:55, 847.87 examples/s]Map:  31%|███▏      | 68272/216925 [01:24<03:08, 786.77 examples/s]Map:  30%|███       | 65266/216925 [01:24<03:17, 768.65 examples/s]Map:  31%|███       | 67221/216925 [01:23<03:12, 777.43 examples/s]Map:  32%|███▏      | 68553/216925 [01:23<02:50, 871.77 examples/s]Map:  32%|███▏      | 68357/216925 [01:24<03:05, 801.77 examples/s]Map:  30%|███       | 65357/216925 [01:24<03:09, 801.72 examples/s]Map:  31%|███       | 67310/216925 [01:23<03:06, 803.47 examples/s]Map:  32%|███▏      | 68645/216925 [01:23<02:47, 884.31 examples/s]Map:  32%|███▏      | 68446/216925 [01:24<03:00, 824.25 examples/s]Map:  30%|███       | 65443/216925 [01:25<03:05, 814.98 examples/s]Map:  31%|███       | 67400/216925 [01:23<03:00, 826.62 examples/s]Map:  32%|███▏      | 68737/216925 [01:23<02:46, 891.72 examples/s]Map:  32%|███▏      | 68539/216925 [01:25<02:53, 853.08 examples/s]Map:  30%|███       | 65530/216925 [01:25<03:02, 828.62 examples/s]Map:  31%|███       | 67489/216925 [01:23<02:57, 841.53 examples/s]Map:  32%|███▏      | 68828/216925 [01:23<02:45, 896.25 examples/s]Map:  32%|███▏      | 68630/216925 [01:25<02:51, 865.33 examples/s]Map:  30%|███       | 65616/216925 [01:25<03:01, 835.83 examples/s]Map:  31%|███       | 67580/216925 [01:23<02:53, 858.51 examples/s]Map:  32%|███▏      | 68922/216925 [01:24<02:43, 907.02 examples/s]Map:  30%|███       | 65707/216925 [01:25<02:56, 854.61 examples/s]Map:  31%|███       | 67668/216925 [01:24<02:52, 862.78 examples/s]Map:  32%|███▏      | 68758/216925 [01:25<02:52, 857.67 examples/s]Map:  32%|███▏      | 68849/216925 [01:25<02:50, 868.67 examples/s]Map:  30%|███       | 65838/216925 [01:25<02:55, 858.65 examples/s]Map:  31%|███▏      | 67799/216925 [01:24<02:52, 862.97 examples/s]Map:  32%|███▏      | 69042/216925 [01:24<03:25, 718.12 examples/s]Map:  30%|███       | 65926/216925 [01:25<02:55, 862.52 examples/s]Map:  32%|███▏      | 68979/216925 [01:25<02:51, 865.07 examples/s]Map:  32%|███▏      | 69130/216925 [01:24<03:15, 755.08 examples/s]Map:  31%|███▏      | 67928/216925 [01:24<02:53, 857.06 examples/s]Map:  32%|███▏      | 69219/216925 [01:24<03:07, 787.76 examples/s]Map:  30%|███       | 66042/216925 [01:25<03:33, 706.40 examples/s]Map:  32%|███▏      | 69312/216925 [01:24<02:58, 824.71 examples/s]Map:  32%|███▏      | 69089/216925 [01:25<03:29, 704.89 examples/s]Map:  31%|███▏      | 68043/216925 [01:24<03:29, 710.69 examples/s]Map:  30%|███       | 66132/216925 [01:25<03:21, 748.57 examples/s]Map:  32%|███▏      | 69407/216925 [01:24<02:52, 856.07 examples/s]Map:  32%|███▏      | 69178/216925 [01:25<03:18, 743.49 examples/s]Map:  31%|███▏      | 68138/216925 [01:24<03:15, 759.44 examples/s]Map:  31%|███       | 66223/216925 [01:26<03:11, 786.83 examples/s]Map:  32%|███▏      | 69501/216925 [01:24<02:47, 878.70 examples/s]Map:  32%|███▏      | 69265/216925 [01:25<03:11, 771.47 examples/s]Map:  31%|███▏      | 68227/216925 [01:24<03:08, 789.17 examples/s]Map:  31%|███       | 66310/216925 [01:26<03:06, 807.50 examples/s]Map:  32%|███▏      | 69356/216925 [01:26<03:03, 803.23 examples/s]Map:  31%|███▏      | 68319/216925 [01:24<03:01, 818.62 examples/s]Map:  32%|███▏      | 69638/216925 [01:24<02:45, 888.81 examples/s]Map:  31%|███       | 66400/216925 [01:26<03:01, 829.46 examples/s]Map:  32%|███▏      | 69447/216925 [01:26<02:58, 827.51 examples/s]Map:  32%|███▏      | 68408/216925 [01:25<02:57, 834.48 examples/s]Map:  32%|███▏      | 69732/216925 [01:25<02:43, 900.62 examples/s]Map:  31%|███       | 66490/216925 [01:26<02:57, 845.83 examples/s]Map:  32%|███▏      | 69539/216925 [01:26<02:53, 848.57 examples/s]Map:  32%|███▏      | 68502/216925 [01:25<02:52, 860.72 examples/s]Map:  31%|███       | 66578/216925 [01:26<02:56, 852.48 examples/s]Map:  32%|███▏      | 69872/216925 [01:25<02:41, 909.09 examples/s]Map:  32%|███▏      | 69627/216925 [01:26<02:52, 855.91 examples/s]Map:  32%|███▏      | 68591/216925 [01:25<02:51, 866.10 examples/s]Map:  31%|███       | 66669/216925 [01:26<02:53, 866.95 examples/s]Map:  32%|███▏      | 69997/216925 [01:25<02:46, 880.74 examples/s]Map:  32%|███▏      | 69752/216925 [01:26<02:54, 843.54 examples/s]Map:  32%|███▏      | 68713/216925 [01:25<02:56, 840.89 examples/s]Map:  31%|███       | 66794/216925 [01:26<02:57, 848.08 examples/s]Map:  32%|███▏      | 69846/216925 [01:26<02:50, 864.61 examples/s]Map:  31%|███       | 66882/216925 [01:26<02:55, 855.59 examples/s]Map:  32%|███▏      | 68845/216925 [01:25<02:53, 852.13 examples/s]Map:  32%|███▏      | 70087/216925 [01:25<03:25, 714.18 examples/s]Map:  32%|███▏      | 69937/216925 [01:26<02:47, 875.87 examples/s]Map:  31%|███       | 66970/216925 [01:26<02:54, 858.85 examples/s]Map:  32%|███▏      | 68933/216925 [01:25<02:52, 858.16 examples/s]Map:  32%|███▏      | 70183/216925 [01:25<03:11, 764.29 examples/s]Map:  32%|███▏      | 70274/216925 [01:25<03:04, 796.94 examples/s]Map:  32%|███▏      | 70046/216925 [01:26<03:30, 697.12 examples/s]Map:  31%|███       | 67088/216925 [01:27<03:35, 694.44 examples/s]Map:  32%|███▏      | 69042/216925 [01:25<03:30, 700.98 examples/s]Map:  32%|███▏      | 70133/216925 [01:27<03:20, 733.75 examples/s]Map:  32%|███▏      | 70398/216925 [01:25<03:02, 802.42 examples/s]Map:  31%|███       | 67175/216925 [01:27<03:24, 731.76 examples/s]Map:  32%|███▏      | 69130/216925 [01:25<03:20, 736.09 examples/s]Map:  32%|███▏      | 70220/216925 [01:27<03:11, 764.17 examples/s]Map:  32%|███▏      | 70493/216925 [01:25<02:54, 837.08 examples/s]Map:  31%|███       | 67263/216925 [01:27<03:15, 766.23 examples/s]Map:  32%|███▏      | 69218/216925 [01:26<03:12, 768.04 examples/s]Map:  32%|███▏      | 70311/216925 [01:27<03:03, 798.10 examples/s]Map:  33%|███▎      | 70583/216925 [01:26<02:52, 850.29 examples/s]Map:  31%|███       | 67349/216925 [01:27<03:09, 788.22 examples/s]Map:  32%|███▏      | 69302/216925 [01:26<03:08, 784.93 examples/s]Map:  32%|███▏      | 70401/216925 [01:27<02:57, 824.81 examples/s]Map:  33%|███▎      | 70679/216925 [01:26<02:46, 876.34 examples/s]Map:  31%|███       | 67435/216925 [01:27<03:05, 806.11 examples/s]Map:  32%|███▏      | 69393/216925 [01:26<03:00, 815.28 examples/s]Map:  32%|███▏      | 70487/216925 [01:27<02:55, 833.23 examples/s]Map:  33%|███▎      | 70769/216925 [01:26<02:46, 880.22 examples/s]Map:  31%|███       | 67519/216925 [01:27<03:03, 813.47 examples/s]Map:  32%|███▏      | 69487/216925 [01:26<02:54, 846.01 examples/s]Map:  33%|███▎      | 70577/216925 [01:27<02:52, 849.12 examples/s]Map:  33%|███▎      | 70861/216925 [01:26<02:44, 889.66 examples/s]Map:  31%|███       | 67605/216925 [01:27<03:01, 824.12 examples/s]Map:  32%|███▏      | 69579/216925 [01:26<02:50, 864.12 examples/s]Map:  33%|███▎      | 70704/216925 [01:27<02:52, 847.19 examples/s]Map:  31%|███       | 67691/216925 [01:27<02:59, 831.93 examples/s]Map:  33%|███▎      | 70995/216925 [01:26<02:44, 887.97 examples/s]Map:  32%|███▏      | 69708/216925 [01:26<02:51, 857.41 examples/s]Map:  33%|███▎      | 70793/216925 [01:27<02:51, 851.97 examples/s]Map:  31%|███▏      | 67814/216925 [01:28<03:00, 823.85 examples/s]Map:  32%|███▏      | 69801/216925 [01:26<02:49, 870.46 examples/s]Map:  33%|███▎      | 70882/216925 [01:27<02:49, 861.23 examples/s]Map:  33%|███▎      | 71091/216925 [01:26<03:25, 710.61 examples/s]Map:  31%|███▏      | 67905/216925 [01:28<02:56, 843.66 examples/s]Map:  33%|███▎      | 70970/216925 [01:28<02:49, 862.13 examples/s]Map:  33%|███▎      | 71184/216925 [01:26<03:12, 758.87 examples/s]Map:  32%|███▏      | 69931/216925 [01:26<02:49, 865.89 examples/s]Map:  31%|███▏      | 67993/216925 [01:28<02:55, 848.78 examples/s]Map:  33%|███▎      | 71278/216925 [01:26<03:01, 801.15 examples/s]Map:  33%|███▎      | 71370/216925 [01:27<02:55, 829.40 examples/s]Map:  33%|███▎      | 71089/216925 [01:28<03:29, 697.52 examples/s]Map:  32%|███▏      | 70041/216925 [01:27<03:29, 701.87 examples/s]Map:  31%|███▏      | 68089/216925 [01:28<03:39, 676.86 examples/s]Map:  33%|███▎      | 71463/216925 [01:27<02:50, 853.39 examples/s]Map:  33%|███▎      | 71177/216925 [01:28<03:18, 735.10 examples/s]Map:  32%|███▏      | 70134/216925 [01:27<03:16, 748.50 examples/s]Map:  31%|███▏      | 68179/216925 [01:28<03:24, 726.54 examples/s]Map:  33%|███▎      | 71553/216925 [01:27<02:48, 864.40 examples/s]Map:  33%|███▎      | 71268/216925 [01:28<03:08, 772.73 examples/s]Map:  32%|███▏      | 70224/216925 [01:27<03:07, 780.77 examples/s]Map:  31%|███▏      | 68271/216925 [01:28<03:12, 770.83 examples/s]Map:  33%|███▎      | 71360/216925 [01:28<03:00, 807.36 examples/s]Map:  32%|███▏      | 70318/216925 [01:27<02:59, 816.26 examples/s]Map:  32%|███▏      | 68358/216925 [01:28<03:07, 792.10 examples/s]Map:  33%|███▎      | 71687/216925 [01:27<02:47, 868.92 examples/s]Map:  33%|███▎      | 71449/216925 [01:28<02:55, 827.96 examples/s]Map:  32%|███▏      | 70410/216925 [01:27<02:54, 840.12 examples/s]Map:  32%|███▏      | 68443/216925 [01:28<03:04, 805.19 examples/s]Map:  33%|███▎      | 71778/216925 [01:27<02:45, 877.45 examples/s]Map:  33%|███▎      | 71539/216925 [01:28<02:52, 845.24 examples/s]Map:  32%|███▏      | 70500/216925 [01:27<02:51, 852.78 examples/s]Map:  32%|███▏      | 68531/216925 [01:28<03:00, 821.98 examples/s]Map:  33%|███▎      | 71906/216925 [01:27<02:47, 866.77 examples/s]Map:  33%|███▎      | 71664/216925 [01:28<02:53, 838.48 examples/s]Map:  33%|███▎      | 70634/216925 [01:27<02:49, 864.04 examples/s]Map:  32%|███▏      | 68656/216925 [01:29<03:00, 823.35 examples/s]Map:  33%|███▎      | 71994/216925 [01:27<02:46, 869.10 examples/s]Map:  33%|███▎      | 71753/216925 [01:29<02:50, 849.75 examples/s]Map:  32%|███▏      | 68740/216925 [01:29<02:59, 825.48 examples/s]Map:  33%|███▎      | 70766/216925 [01:27<02:48, 866.75 examples/s]Map:  33%|███▎      | 71842/216925 [01:29<02:48, 859.24 examples/s]Map:  33%|███▎      | 72089/216925 [01:27<03:28, 694.90 examples/s]Map:  33%|███▎      | 70858/216925 [01:27<02:47, 873.70 examples/s]Map:  32%|███▏      | 68868/216925 [01:29<02:57, 833.09 examples/s]Map:  33%|███▎      | 71935/216925 [01:29<02:45, 875.64 examples/s]Map:  33%|███▎      | 72182/216925 [01:28<03:13, 746.16 examples/s]Map:  32%|███▏      | 68956/216925 [01:29<02:55, 841.90 examples/s]Map:  33%|███▎      | 70987/216925 [01:28<02:48, 867.96 examples/s]Map:  33%|███▎      | 72274/216925 [01:28<03:03, 788.27 examples/s]Map:  33%|███▎      | 72043/216925 [01:29<03:30, 688.26 examples/s]Map:  33%|███▎      | 72367/216925 [01:28<02:55, 824.19 examples/s]Map:  32%|███▏      | 69043/216925 [01:29<03:40, 670.96 examples/s]Map:  33%|███▎      | 72135/216925 [01:29<03:15, 740.37 examples/s]Map:  33%|███▎      | 71087/216925 [01:28<03:26, 706.91 examples/s]Map:  33%|███▎      | 72456/216925 [01:28<02:52, 838.77 examples/s]Map:  32%|███▏      | 69131/216925 [01:29<03:25, 717.91 examples/s]Map:  33%|███▎      | 72225/216925 [01:29<03:05, 778.39 examples/s]Map:  33%|███▎      | 71178/216925 [01:28<03:14, 747.88 examples/s]Map:  33%|███▎      | 72548/216925 [01:28<02:48, 857.42 examples/s]Map:  32%|███▏      | 69217/216925 [01:29<03:16, 750.71 examples/s]Map:  33%|███▎      | 72315/216925 [01:29<02:59, 807.85 examples/s]Map:  33%|███▎      | 71269/216925 [01:28<03:05, 784.74 examples/s]Map:  33%|███▎      | 72637/216925 [01:28<02:46, 865.69 examples/s]Map:  32%|███▏      | 69308/216925 [01:29<03:06, 789.72 examples/s]Map:  33%|███▎      | 72405/216925 [01:29<02:53, 831.80 examples/s]Map:  33%|███▎      | 71360/216925 [01:28<02:58, 813.80 examples/s]Map:  34%|███▎      | 72728/216925 [01:28<02:45, 873.44 examples/s]Map:  32%|███▏      | 69393/216925 [01:30<03:03, 803.60 examples/s]Map:  33%|███▎      | 72493/216925 [01:29<02:51, 843.92 examples/s]Map:  33%|███▎      | 71450/216925 [01:28<02:54, 834.50 examples/s]Map:  34%|███▎      | 72821/216925 [01:28<02:42, 889.28 examples/s]Map:  32%|███▏      | 69478/216925 [01:30<03:01, 812.14 examples/s]Map:  33%|███▎      | 72583/216925 [01:30<02:48, 854.70 examples/s]Map:  34%|███▎      | 72915/216925 [01:28<02:39, 900.97 examples/s]Map:  33%|███▎      | 71581/216925 [01:28<02:51, 845.81 examples/s]Map:  34%|███▎      | 72671/216925 [01:30<02:47, 859.14 examples/s]Map:  32%|███▏      | 69600/216925 [01:30<03:01, 811.26 examples/s]Map:  33%|███▎      | 71670/216925 [01:29<02:49, 854.63 examples/s]Map:  34%|███▎      | 72760/216925 [01:30<02:47, 863.03 examples/s]Map:  32%|███▏      | 69688/216925 [01:30<02:58, 826.08 examples/s]Map:  34%|███▎      | 73042/216925 [01:29<03:22, 711.38 examples/s]Map:  34%|███▎      | 72850/216925 [01:30<02:45, 872.45 examples/s]Map:  32%|███▏      | 69772/216925 [01:30<02:57, 827.01 examples/s]Map:  33%|███▎      | 71800/216925 [01:29<02:49, 854.70 examples/s]Map:  34%|███▎      | 73135/216925 [01:29<03:09, 757.79 examples/s]Map:  34%|███▎      | 72939/216925 [01:30<02:44, 873.06 examples/s]Map:  32%|███▏      | 69866/216925 [01:30<02:52, 853.70 examples/s]Map:  33%|███▎      | 71890/216925 [01:29<02:47, 864.25 examples/s]Map:  34%|███▍      | 73229/216925 [01:29<02:59, 799.94 examples/s]Map:  32%|███▏      | 69956/216925 [01:30<02:50, 862.01 examples/s]Map:  33%|███▎      | 71978/216925 [01:29<02:47, 866.77 examples/s]Map:  34%|███▍      | 73322/216925 [01:29<02:52, 833.29 examples/s]Map:  34%|█��█▎      | 73044/216925 [01:30<03:28, 690.47 examples/s]Map:  34%|███▍      | 73413/216925 [01:29<02:48, 851.17 examples/s]Map:  34%|███▎      | 73130/216925 [01:30<03:17, 729.18 examples/s]Map:  32%|███▏      | 70044/216925 [01:30<03:39, 668.06 examples/s]Map:  33%|███▎      | 72089/216925 [01:29<03:26, 701.48 examples/s]Map:  34%|███▍      | 73502/216925 [01:29<02:46, 860.29 examples/s]Map:  34%|███▍      | 73223/216925 [01:30<03:04, 777.48 examples/s]Map:  32%|███▏      | 70134/216925 [01:30<03:23, 720.93 examples/s]Map:  33%|███▎      | 72182/216925 [01:29<03:12, 751.25 examples/s]Map:  34%|███▍      | 73592/216925 [01:29<02:45, 866.59 examples/s]Map:  34%|███▍      | 73308/216925 [01:30<03:00, 793.54 examples/s]Map:  32%|███▏      | 70226/216925 [01:31<03:10, 769.45 examples/s]Map:  33%|███▎      | 72273/216925 [01:29<03:03, 788.85 examples/s]Map:  34%|███▍      | 73726/216925 [01:29<02:44, 872.12 examples/s]Map:  34%|███▍      | 73395/216925 [01:31<02:56, 813.91 examples/s]Map:  32%|███▏      | 70315/216925 [01:31<03:04, 796.13 examples/s]Map:  33%|███▎      | 72401/216925 [01:29<02:58, 807.46 examples/s]Map:  34%|███▍      | 73818/216925 [01:29<02:42, 882.32 examples/s]Map:  34%|███▍      | 73487/216925 [01:31<02:50, 842.49 examples/s]Map:  32%|███▏      | 70404/216925 [01:31<02:58, 818.75 examples/s]Map:  33%|███▎      | 72490/216925 [01:30<02:55, 824.74 examples/s]Map:  34%|███▍      | 73910/216925 [01:30<02:40, 889.03 examples/s]Map:  34%|███▍      | 73578/216925 [01:31<02:47, 857.37 examples/s]Map:  32%|███▏      | 70489/216925 [01:31<02:57, 823.65 examples/s]Map:  33%|███▎      | 72580/216925 [01:30<02:51, 841.29 examples/s]Map:  34%|███▍      | 73671/216925 [01:31<02:43, 874.33 examples/s]Map:  33%|███▎      | 70576/216925 [01:31<02:55, 833.20 examples/s]Map:  34%|███▎      | 72671/216925 [01:30<02:48, 857.47 examples/s]Map:  34%|███▍      | 74000/216925 [01:30<03:24, 697.25 examples/s]Map:  33%|███▎      | 70671/216925 [01:31<02:49, 864.85 examples/s]Map:  34%|███▍      | 73804/216925 [01:31<02:43, 874.71 examples/s]Map:  34%|███▎      | 72759/216925 [01:30<02:47, 861.99 examples/s]Map:  34%|███▍      | 74087/216925 [01:30<03:14, 735.44 examples/s]Map:  33%|███▎      | 70759/216925 [01:31<02:49, 863.71 examples/s]Map:  34%|███▍      | 73894/216925 [01:31<02:42, 879.98 examples/s]Map:  34%|███▎      | 72853/216925 [01:30<02:43, 881.17 examples/s]Map:  34%|███▍      | 74183/216925 [01:30<03:00, 788.92 examples/s]Map:  34%|███▍      | 73983/216925 [01:31<02:42, 881.23 examples/s]Map:  33%|███▎      | 70888/216925 [01:31<02:50, 857.69 examples/s]Map:  34%|███▎      | 72947/216925 [01:30<02:41, 894.12 examples/s]Map:  34%|███▍      | 74277/216925 [01:30<02:52, 827.29 examples/s]Map:  33%|███▎      | 70979/216925 [01:31<02:48, 867.63 examples/s]Map:  34%|███▍      | 74373/216925 [01:30<02:45, 860.89 examples/s]Map:  34%|███▍      | 74089/216925 [01:31<03:24, 698.86 examples/s]Map:  34%|███▎      | 73044/216925 [01:30<03:25, 699.70 examples/s]Map:  34%|███▍      | 74508/216925 [01:30<02:43, 873.03 examples/s]Map:  34%|███▍      | 74179/216925 [01:32<03:12, 743.08 examples/s]Map:  33%|███▎      | 71090/216925 [01:32<03:27, 704.38 examples/s]Map:  34%|███▎      | 73137/216925 [01:30<03:10, 754.71 examples/s]Map:  34%|███▍      | 74600/216925 [01:30<02:41, 881.03 examples/s]Map:  34%|███▍      | 74270/216925 [01:32<03:02, 783.25 examples/s]Map:  33%|███▎      | 71177/216925 [01:32<03:16, 741.86 examples/s]Map:  34%|███▍      | 73229/216925 [01:30<03:01, 793.48 examples/s]Map:  34%|███▍      | 74690/216925 [01:31<02:41, 882.83 examples/s]Map:  34%|███▍      | 74360/216925 [01:32<02:55, 812.21 examples/s]Map:  33%|███▎      | 71262/216925 [01:32<03:09, 767.91 examples/s]Map:  34%|███▍      | 73317/216925 [01:31<02:56, 813.18 examples/s]Map:  34%|███▍      | 74780/216925 [01:31<02:40, 885.65 examples/s]Map:  34%|███▍      | 74449/216925 [01:32<02:52, 828.33 examples/s]Map:  33%|███▎      | 71347/216925 [01:32<03:04, 788.03 examples/s]Map:  34%|███▍      | 73406/216925 [01:31<02:52, 830.67 examples/s]Map:  34%|███▍      | 74539/216925 [01:32<02:48, 845.38 examples/s]Map:  33%|███▎      | 71435/216925 [01:32<02:59, 812.63 examples/s]Map:  34%|███▍      | 73498/216925 [01:31<02:48, 849.80 examples/s]Map:  35%|███▍      | 74910/216925 [01:31<02:41, 877.28 examples/s]Map:  34%|███▍      | 74627/216925 [01:32<02:46, 853.72 examples/s]Map:  33%|███▎      | 71526/216925 [01:32<02:53, 837.01 examples/s]Map:  34%|███▍      | 73590/216925 [01:31<02:46, 860.91 examples/s]Map:  34%|███▍      | 74715/216925 [01:32<02:45, 857.36 examples/s]Map:  33%|███▎      | 71612/216925 [01:32<02:52, 842.25 examples/s]Map:  34%|███▍      | 73685/216925 [01:31<02:42, 881.71 examples/s]Map:  35%|███▍      | 75000/216925 [01:31<03:22, 702.46 examples/s]Map:  34%|███▍      | 74803/216925 [01:32<02:44, 863.13 examples/s]Map:  33%|███▎      | 71700/216925 [01:32<02:50, 850.91 examples/s]Map:  35%|███▍      | 75092/216925 [01:31<03:08, 750.47 examples/s]Map:  34%|███▍      | 73818/216925 [01:31<02:42, 879.23 examples/s]Map:  35%|███▍      | 74894/216925 [01:32<02:42, 873.87 examples/s]Map:  35%|███▍      | 75187/216925 [01:31<02:57, 796.71 examples/s]Map:  33%|███▎      | 71829/216925 [01:33<02:51, 848.27 examples/s]Map:  34%|███▍      | 73911/216925 [01:31<02:40, 889.87 examples/s]Map:  35%|███▍      | 74989/216925 [01:32<02:39, 891.93 examples/s]Map:  35%|███▍      | 75277/216925 [01:31<02:52, 819.87 examples/s]Map:  33%|███▎      | 71957/216925 [01:33<02:51, 845.76 examples/s]Map:  35%|███▍      | 75370/216925 [01:31<02:47, 847.33 examples/s]Map:  35%|███▍      | 75092/216925 [01:33<03:19, 711.03 examples/s]Map:  34%|███▍      | 74041/216925 [01:31<03:18, 719.66 examples/s]Map:  35%|███▍      | 75463/216925 [01:31<02:42, 868.67 examples/s]Map:  35%|███▍      | 75184/216925 [01:33<03:06, 759.23 examples/s]Map:  33%|███▎      | 72045/216925 [01:33<03:32, 682.92 examples/s]Map:  34%|███▍      | 74127/216925 [01:32<03:10, 749.00 examples/s]Map:  35%|███▍      | 75554/216925 [01:32<02:40, 879.35 examples/s]Map:  35%|███▍      | 75273/216925 [01:33<02:59, 790.77 examples/s]Map:  33%|███▎      | 72134/216925 [01:33<03:19, 726.15 examples/s]Map:  34%|███▍      | 74216/216925 [01:32<03:02, 781.66 examples/s]Map:  35%|███▍      | 75648/216925 [01:32<02:37, 894.31 examples/s]Map:  35%|███▍      | 75362/216925 [01:33<02:53, 815.73 examples/s]Map:  33%|███▎      | 72217/216925 [01:33<03:13, 749.58 examples/s]Map:  34%|███▍      | 74303/216925 [01:32<02:57, 801.63 examples/s]Map:  35%|███▍      | 75739/216925 [01:32<02:37, 895.88 examples/s]Map:  35%|███▍      | 75452/216925 [01:33<02:49, 836.65 examples/s]Map:  33%|███▎      | 72302/216925 [01:33<03:06, 774.72 examples/s]Map:  34%|███▍      | 74394/216925 [01:32<02:52, 827.14 examples/s]Map:  35%|███▍      | 75877/216925 [01:32<02:36, 900.70 examples/s]Map:  35%|███▍      | 75544/216925 [01:33<02:45, 853.69 examples/s]Map:  33%|███▎      | 72390/216925 [01:33<03:01, 798.28 examples/s]Map:  34%|███▍      | 74486/216925 [01:32<02:47, 849.52 examples/s]Map:  33%|███▎      | 72477/216925 [01:33<02:56, 816.99 examples/s]Map:  34%|███▍      | 74575/216925 [01:32<02:46, 856.61 examples/s]Map:  35%|███▍      | 75678/216925 [01:33<02:43, 862.94 examples/s]Map:  33%|███▎      | 72564/216925 [01:33<02:53, 829.80 examples/s]Map:  35%|███▌      | 76000/216925 [01:32<03:14, 725.94 examples/s]Map:  35%|███▍      | 75768/216925 [01:33<02:42, 869.51 examples/s]Map:  34%|███▍      | 74706/216925 [01:32<02:45, 858.65 examples/s]Map:  33%|███▎      | 72652/216925 [01:34<02:51, 841.02 examples/s]Map:  35%|███▌      | 76091/216925 [01:32<03:04, 763.62 examples/s]Map:  35%|███▍      | 75858/216925 [01:34<02:41, 875.75 examples/s]Map:  34%|███▍      | 74800/216925 [01:32<02:42, 875.00 examples/s]Map:  34%|███▎      | 72738/216925 [01:34<02:50, 843.53 examples/s]Map:  35%|███▌      | 76183/216925 [01:32<02:56, 799.15 examples/s]Map:  35%|███▌      | 75994/216925 [01:34<02:39, 882.09 examples/s]Map:  34%|███▎      | 72828/216925 [01:34<02:48, 856.93 examples/s]Map:  35%|███▌      | 76272/216925 [01:32<02:51, 820.56 examples/s]Map:  35%|███▍      | 74928/216925 [01:32<02:44, 861.94 examples/s]Map:  34%|███▎      | 72916/216925 [01:34<02:46, 863.44 examples/s]Map:  35%|███▌      | 76363/216925 [01:33<02:47, 840.67 examples/s]Map:  35%|███▌      | 76088/216925 [01:34<03:18, 710.52 examples/s]Map:  35%|███▌      | 76452/216925 [01:33<02:44, 851.57 examples/s]Map:  35%|███▍      | 75044/216925 [01:33<03:21, 703.59 examples/s]Map:  35%|███▌      | 76179/216925 [01:34<03:06, 755.12 examples/s]Map:  35%|███▌      | 76543/216925 [01:33<02:42, 865.59 examples/s]Map:  34%|███▎      | 73044/216925 [01:34<03:24, 702.88 examples/s]Map:  35%|███▍      | 75139/216925 [01:33<03:07, 754.59 examples/s]Map:  35%|███▌      | 76267/216925 [01:34<02:59, 782.21 examples/s]Map:  34%|███▎      | 73134/216925 [01:34<03:12, 746.87 examples/s]Map:  35%|███▍      | 75230/216925 [01:33<02:59, 787.87 examples/s]Map:  35%|███▌      | 76677/216925 [01:33<02:40, 872.76 examples/s]Map:  35%|███▌      | 76361/216925 [01:34<02:51, 819.31 examples/s]Map:  34%|███▍      | 73224/216925 [01:34<03:03, 783.08 examples/s]Map:  35%|███▍      | 75322/216925 [01:33<02:53, 818.47 examples/s]Map:  35%|███▌      | 76452/216925 [01:34<02:47, 840.74 examples/s]Map:  35%|███▌      | 76813/216925 [01:33<02:38, 882.89 examples/s]Map:  34%|███▍      | 73309/216925 [01:34<03:00, 797.28 examples/s]Map:  35%|███▍      | 75413/216925 [01:33<02:48, 839.11 examples/s]Map:  35%|███▌      | 76539/216925 [01:34<02:45, 847.26 examples/s]Map:  35%|███▌      | 76906/216925 [01:33<02:37, 889.83 examples/s]Map:  34%|███▍      | 73399/216925 [01:35<02:54, 821.78 examples/s]Map:  35%|███▍      | 75508/216925 [01:33<02:43, 865.48 examples/s]Map:  35%|███▌      | 76627/216925 [01:34<02:44, 855.10 examples/s]Map:  35%|███▌      | 76999/216925 [01:33<02:36, 895.50 examples/s]Map:  34%|███▍      | 73492/216925 [01:35<02:48, 851.02 examples/s]Map:  35%|███▍      | 75643/216925 [01:33<02:41, 873.24 examples/s]Map:  35%|███▌      | 76715/216925 [01:35<02:42, 860.23 examples/s]Map:  34%|███▍      | 73624/216925 [01:35<02:46, 858.70 examples/s]Map:  35%|███▌      | 76805/216925 [01:35<02:40, 870.35 examples/s]Map:  36%|███▌      | 77093/216925 [01:33<03:16, 712.92 examples/s]Map:  35%|███▍      | 75773/216925 [01:34<02:42, 870.16 examples/s]Map:  34%|███▍      | 73716/216925 [01:35<02:44, 873.06 examples/s]Map:  35%|███▌      | 76900/216925 [01:35<02:37, 890.88 examples/s]Map:  36%|███▌      | 77183/216925 [01:34<03:05, 754.37 examples/s]Map:  35%|███▍      | 75867/216925 [01:34<02:39, 883.98 examples/s]Map:  35%|███▌      | 76991/216925 [01:35<02:37, 891.24 examples/s]Map:  36%|███▌      | 77275/216925 [01:34<02:56, 793.33 examples/s]Map:  34%|███▍      | 73849/216925 [01:35<02:43, 874.79 examples/s]Map:  36%|███▌      | 77366/216925 [01:34<02:49, 822.37 examples/s]Map:  34%|███▍      | 73939/216925 [01:35<02:42, 878.91 examples/s]Map:  35%|███▌      | 76000/216925 [01:34<03:13, 726.87 examples/s]Map:  36%|███▌      | 77456/216925 [01:34<02:45, 842.42 examples/s]Map:  36%|███▌      | 77087/216925 [01:35<03:21, 695.28 examples/s]Map:  35%|███▌      | 76087/216925 [01:34<03:06, 755.86 examples/s]Map:  36%|███▌      | 77544/216925 [01:34<02:43, 852.67 examples/s]Map:  36%|███▌      | 77178/216925 [01:35<03:07, 744.60 examples/s]Map:  34%|███▍      | 74041/216925 [01:35<03:24, 699.15 examples/s]Map:  35%|███▌      | 76180/216925 [01:34<02:57, 792.99 examples/s]Map:  36%|███▌      | 77637/216925 [01:34<02:39, 871.52 examples/s]Map:  36%|███▌      | 77268/216925 [01:35<02:58, 783.99 examples/s]Map:  34%|███▍      | 74131/216925 [01:35<03:12, 741.35 examples/s]Map:  35%|███▌      | 76271/216925 [01:34<02:51, 819.01 examples/s]Map:  36%|███▌      | 77729/216925 [01:34<02:37, 882.23 examples/s]Map:  36%|███▌      | 77361/216925 [01:35<02:49, 821.04 examples/s]Map:  34%|███▍      | 74222/216925 [01:36<03:03, 779.46 examples/s]Map:  35%|███▌      | 76359/216925 [01:34<02:48, 832.73 examples/s]Map:  36%|███▌      | 77827/216925 [01:34<02:33, 907.88 examples/s]Map:  36%|███▌      | 77453/216925 [01:35<02:45, 844.99 examples/s]Map:  34%|███▍      | 74314/216925 [01:36<02:55, 813.63 examples/s]Map:  35%|███▌      | 76452/216925 [01:34<02:44, 855.63 examples/s]Map:  36%|███▌      | 77542/216925 [01:36<02:43, 852.31 examples/s]Map:  34%|███▍      | 74400/216925 [01:36<02:53, 822.71 examples/s]Map:  36%|███▌      | 77965/216925 [01:34<02:32, 909.22 examples/s]Map:  35%|███▌      | 76544/216925 [01:34<02:41, 870.10 examples/s]Map:  36%|███▌      | 77632/216925 [01:36<02:41, 862.84 examples/s]Map:  34%|███▍      | 74486/216925 [01:36<02:51, 829.14 examples/s]Map:  35%|███▌      | 76634/216925 [01:35<02:40, 876.02 examples/s]Map:  36%|███▌      | 77726/216925 [01:36<02:37, 881.37 examples/s]Map:  34%|███▍      | 74576/216925 [01:36<02:48, 842.37 examples/s]Map:  36%|███▌      | 78088/216925 [01:35<03:10, 729.53 examples/s]Map:  35%|███▌      | 76766/216925 [01:35<02:40, 873.13 examples/s]Map:  34%|███▍      | 74667/216925 [01:36<02:45, 861.12 examples/s]Map:  36%|███▌      | 77862/216925 [01:36<02:36, 888.52 examples/s]Map:  36%|███▌      | 78181/216925 [01:35<02:59, 772.76 examples/s]Map:  35%|███▌      | 76858/216925 [01:35<02:38, 881.94 examples/s]Map:  36%|███▌      | 78275/216925 [01:35<02:50, 811.15 examples/s]Map:  34%|███▍      | 74800/216925 [01:36<02:43, 866.70 examples/s]Map:  36%|███▌      | 77998/216925 [01:36<02:36, 888.49 examples/s]Map:  35%|███▌      | 76991/216925 [01:35<02:39, 879.57 examples/s]Map:  36%|███▌      | 78365/216925 [01:35<02:46, 831.44 examples/s]Map:  35%|███▍      | 74932/216925 [01:36<02:43, 868.93 examples/s]Map:  36%|███▌      | 78453/216925 [01:35<02:44, 843.80 examples/s]Map:  36%|███▌      | 78091/216925 [01:36<03:12, 720.07 examples/s]Map:  36%|███▌      | 78546/216925 [01:35<02:40, 862.98 examples/s]Map:  36%|███▌      | 77086/216925 [01:35<03:19, 701.63 examples/s]Map:  36%|███▌      | 78182/216925 [01:36<03:02, 759.25 examples/s]Map:  35%|███▍      | 75044/216925 [01:37<03:20, 706.21 examples/s]Map:  36%|███▋      | 78636/216925 [01:35<02:38, 871.68 examples/s]Map:  36%|███▌      | 77178/216925 [01:35<03:06, 748.58 examples/s]Map:  36%|███▌      | 78271/216925 [01:37<02:55, 788.18 examples/s]Map:  35%|███▍      | 75136/216925 [01:37<03:08, 750.34 examples/s]Map:  36%|███▋      | 78733/216925 [01:35<02:34, 893.89 examples/s]Map:  36%|███▌      | 77272/216925 [01:35<02:56, 792.33 examples/s]Map:  36%|███▌      | 78363/216925 [01:37<02:48, 820.12 examples/s]Map:  35%|███▍      | 75223/216925 [01:37<03:02, 776.33 examples/s]Map:  36%|███▋      | 78828/216925 [01:35<02:32, 905.89 examples/s]Map:  36%|███▌      | 77363/216925 [01:35<02:49, 821.69 examples/s]Map:  36%|███▌      | 78451/216925 [01:37<02:46, 833.71 examples/s]Map:  35%|███▍      | 75313/216925 [01:37<02:55, 805.97 examples/s]Map:  36%|███▋      | 78921/216925 [01:36<02:31, 908.57 examples/s]Map:  36%|███▌      | 77453/216925 [01:36<02:45, 840.31 examples/s]Map:  36%|███▌      | 78543/216925 [01:37<02:41, 856.76 examples/s]Map:  35%|███▍      | 75398/216925 [01:37<02:53, 816.02 examples/s]Map:  36%|███▌      | 77544/216925 [01:36<02:42, 857.90 examples/s]Map:  36%|███▌      | 78634/216925 [01:37<02:39, 867.81 examples/s]Map:  35%|███▍      | 75488/216925 [01:37<02:49, 835.98 examples/s]Map:  36%|███▌      | 77633/216925 [01:36<02:41, 863.91 examples/s]Map:  36%|███▋      | 78724/216925 [01:37<02:38, 873.27 examples/s]Map:  36%|███▋      | 79046/216925 [01:36<03:10, 722.78 examples/s]Map:  35%|███▍      | 75579/216925 [01:37<02:45, 856.07 examples/s]Map:  36%|███▌      | 77723/216925 [01:36<02:39, 871.09 examples/s]Map:  36%|███▋      | 78817/216925 [01:37<02:35, 885.52 examples/s]Map:  36%|███▋      | 79137/216925 [01:36<03:00, 763.85 examples/s]Map:  35%|███▍      | 75672/216925 [01:37<02:41, 875.98 examples/s]Map:  36%|███▌      | 77818/216925 [01:36<02:36, 890.89 examples/s]Map:  36%|███▋      | 78908/216925 [01:37<02:34, 891.61 examples/s]Map:  37%|███▋      | 79229/216925 [01:36<02:52, 800.24 examples/s]Map:  36%|███▋      | 78998/216925 [01:37<02:34, 891.16 examples/s]Map:  37%|███▋      | 79324/216925 [01:36<02:44, 837.10 examples/s]Map:  35%|███▍      | 75808/216925 [01:37<02:39, 884.77 examples/s]Map:  36%|███▌      | 77951/216925 [01:36<02:36, 886.74 examples/s]Map:  37%|███▋      | 79457/216925 [01:36<02:41, 850.13 examples/s]Map:  35%|███▌      | 75933/216925 [01:38<02:43, 864.03 examples/s]Map:  36%|███▌      | 78043/216925 [01:36<03:15, 708.82 examples/s]Map:  36%|███▋      | 79132/216925 [01:38<03:13, 711.77 examples/s]Map:  37%|███▋      | 79547/216925 [01:36<02:39, 859.62 examples/s]Map:  36%|███▌      | 78136/216925 [01:36<03:03, 757.83 examples/s]Map:  37%|███▋      | 79224/216925 [01:38<03:02, 756.34 examples/s]Map:  37%|███▋      | 79643/216925 [01:36<02:35, 882.34 examples/s]Map:  35%|███▌      | 76044/216925 [01:38<03:16, 717.90 examples/s]Map:  36%|███▌      | 78224/216925 [01:37<02:56, 784.04 examples/s]Map:  37%|███▋      | 79320/216925 [01:38<02:51, 804.62 examples/s]Map:  37%|███▋      | 79737/216925 [01:37<02:33, 895.37 examples/s]Map:  35%|███▌      | 76135/216925 [01:38<03:05, 757.49 examples/s]Map:  36%|███▌      | 78316/216925 [01:37<02:50, 814.08 examples/s]Map:  37%|███▋      | 79411/216925 [01:38<02:45, 829.02 examples/s]Map:  35%|███▌      | 76227/216925 [01:38<02:57, 794.09 examples/s]Map:  37%|███▋      | 79872/216925 [01:37<02:33, 893.55 examples/s]Map:  36%|███▌      | 78403/216925 [01:37<02:47, 827.84 examples/s]Map:  37%|███▋      | 79501/216925 [01:38<02:42, 847.00 examples/s]Map:  35%|███▌      | 76319/216925 [01:38<02:50, 824.34 examples/s]Map:  36%|███▌      | 78491/216925 [01:37<02:44, 839.42 examples/s]Map:  37%|███▋      | 79589/216925 [01:38<02:40, 855.28 examples/s]Map:  35%|███▌      | 76410/216925 [01:38<02:46, 843.11 examples/s]Map:  36%|███▌      | 78583/216925 [01:37<02:40, 860.14 examples/s]Map:  37%|███▋      | 79678/216925 [01:38<02:39, 861.48 examples/s]Map:  37%|███▋      | 80000/216925 [01:37<03:10, 718.56 examples/s]Map:  35%|███▌      | 76501/216925 [01:38<02:43, 859.11 examples/s]Map:  36%|███▋      | 78673/216925 [01:37<02:39, 868.68 examples/s]Map:  37%|███▋      | 79768/216925 [01:38<02:37, 869.73 examples/s]Map:  37%|███▋      | 80094/216925 [01:37<02:59, 763.78 examples/s]Map:  35%|███▌      | 76590/216925 [01:38<02:42, 865.52 examples/s]Map:  36%|███▋      | 78768/216925 [01:37<02:35, 886.79 examples/s]Map:  37%|███▋      | 79858/216925 [01:38<02:36, 877.21 examples/s]Map:  37%|███▋      | 80186/216925 [01:37<02:51, 797.42 examples/s]Map:  35%|███▌      | 76679/216925 [01:39<02:41, 868.91 examples/s]Map:  37%|███▋      | 80280/216925 [01:37<02:44, 830.10 examples/s]Map:  36%|███▋      | 78901/216925 [01:37<02:36, 883.89 examples/s]Map:  35%|███▌      | 76771/216925 [01:39<02:39, 879.53 examples/s]Map:  37%|███▋      | 79988/216925 [01:39<02:37, 870.84 examples/s]Map:  37%|███▋      | 80372/216925 [01:37<02:40, 852.10 examples/s]Map:  35%|███▌      | 76903/216925 [01:39<02:39, 877.52 examples/s]Map:  37%|███▋      | 80461/216925 [01:37<02:38, 858.32 examples/s]Map:  36%|███▋      | 79000/216925 [01:38<03:16, 703.23 examples/s]Map:  37%|███▋      | 80087/216925 [01:39<03:18, 688.11 examples/s]Map:  35%|███▌      | 76994/216925 [01:39<02:38, 884.05 examples/s]Map:  37%|███▋      | 80551/216925 [01:38<02:36, 869.44 examples/s]Map:  36%|███▋      | 79091/216925 [01:38<03:04, 748.00 examples/s]Map:  37%|███▋      | 80175/216925 [01:39<03:07, 729.71 examples/s]Map:  37%|███▋      | 80641/216925 [01:38<02:35, 876.43 examples/s]Map:  37%|███▋      | 79179/216925 [01:38<02:56, 779.03 examples/s]Map:  37%|███▋      | 80267/216925 [01:39<02:56, 772.30 examples/s]Map:  36%|███▌      | 77089/216925 [01:39<03:18, 703.91 examples/s]Map:  37%|███▋      | 80730/216925 [01:38<02:34, 879.92 examples/s]Map:  37%|███▋      | 79271/216925 [01:38<02:49, 811.63 examples/s]Map:  37%|███▋      | 80357/216925 [01:39<02:49, 803.72 examples/s]Map:  36%|███▌      | 77176/216925 [01:39<03:08, 739.73 examples/s]Map:  37%|███▋      | 80820/216925 [01:38<02:33, 885.15 examples/s]Map:  37%|███▋      | 79364/216925 [01:38<02:43, 840.93 examples/s]Map:  37%|███▋      | 80448/216925 [01:39<02:44, 830.06 examples/s]Map:  36%|███▌      | 77270/216925 [01:39<03:20, 698.25 examples/s]Map:  37%|███▋      | 79455/216925 [01:38<02:40, 858.94 examples/s]Map:  37%|███▋      | 80952/216925 [01:38<02:34, 880.42 examples/s]Map:  37%|███▋      | 80537/216925 [01:39<02:41, 843.05 examples/s]Map:  37%|███▋      | 79548/216925 [01:38<02:36, 876.83 examples/s]Map:  37%|███▋      | 80625/216925 [01:39<02:39, 852.14 examples/s]Map:  36%|███▌      | 77363/216925 [01:40<03:28, 668.09 examples/s]Map:  37%|███▋      | 81044/216925 [01:38<03:12, 704.49 examples/s]Map:  37%|███▋      | 80716/216925 [01:39<02:37, 864.98 examples/s]Map:  37%|███▋      | 79681/216925 [01:38<02:36, 876.81 examples/s]Map:  36%|███▌      | 77453/216925 [01:40<03:35, 646.26 examples/s]Map:  37%|███▋      | 81137/216925 [01:38<02:59, 755.53 examples/s]Map:  37%|███▋      | 80810/216925 [01:40<02:34, 882.82 examples/s]Map:  37%|███▋      | 79815/216925 [01:38<02:36, 878.09 examples/s]Map:  37%|███▋      | 81229/216925 [01:38<02:51, 792.93 examples/s]Map:  36%|███▌      | 77554/216925 [01:40<03:33, 651.37 examples/s]Map:  37%|███▋      | 80939/216925 [01:40<02:36, 868.78 examples/s]Map:  37%|███▋      | 81319/216925 [01:39<02:45, 817.18 examples/s]Map:  36%|███▌      | 77640/216925 [01:40<03:19, 696.95 examples/s]Map:  37%|███▋      | 79945/216925 [01:39<02:36, 872.71 examples/s]Map:  38%|███▊      | 81410/216925 [01:39<02:41, 839.81 examples/s]Map:  36%|███▌      | 77725/216925 [01:40<03:10, 732.59 examples/s]Map:  37%|███▋      | 81044/216925 [01:40<03:14, 700.27 examples/s]Map:  38%|███▊      | 81501/216925 [01:39<02:37, 857.13 examples/s]Map:  36%|███▌      | 77810/216925 [01:40<03:02, 760.68 examples/s]Map:  37%|███▋      | 80041/216925 [01:39<03:11, 714.04 examples/s]Map:  37%|███▋      | 81137/216925 [01:40<03:01, 749.34 examples/s]Map:  38%|███▊      | 81591/216925 [01:39<02:36, 865.37 examples/s]Map:  36%|███▌      | 77892/216925 [01:40<02:59, 773.11 examples/s]Map:  37%|███▋      | 80134/216925 [01:39<03:00, 758.51 examples/s]Map:  37%|███▋      | 81224/216925 [01:40<02:54, 776.22 examples/s]Map:  38%|███▊      | 81683/216925 [01:39<02:33, 880.08 examples/s]Map:  36%|███▌      | 77973/216925 [01:40<02:57, 781.07 examples/s]Map:  37%|███▋      | 80222/216925 [01:39<02:53, 786.07 examples/s]Map:  37%|███▋      | 81312/216925 [01:40<02:49, 800.98 examples/s]Map:  38%|███▊      | 81774/216925 [01:39<02:32, 884.55 examples/s]Map:  37%|███▋      | 80315/216925 [01:39<02:46, 820.60 examples/s]Map:  38%|███▊      | 81404/216925 [01:40<02:43, 829.59 examples/s]Map:  38%|███▊      | 81865/216925 [01:39<02:32, 887.90 examples/s]Map:  37%|███▋      | 80401/216925 [01:39<02:44, 828.44 examples/s]Map:  36%|███▌      | 78086/216925 [01:41<03:39, 633.90 examples/s]Map:  38%|███▊      | 81494/216925 [01:40<02:40, 845.80 examples/s]Map:  38%|███▊      | 81961/216925 [01:39<02:29, 904.69 examples/s]Map:  37%|███▋      | 80495/216925 [01:39<02:39, 856.60 examples/s]Map:  36%|███▌      | 78174/216925 [01:41<03:22, 685.64 examples/s]Map:  38%|███▊      | 81582/216925 [01:41<02:39, 850.37 examples/s]Map:  37%|███▋      | 80588/216925 [01:39<02:35, 874.32 examples/s]Map:  36%|███▌      | 78255/216925 [01:41<03:14, 714.33 examples/s]Map:  38%|███▊      | 81713/216925 [01:41<02:38, 854.78 examples/s]Map:  37%|███▋      | 80682/216925 [01:39<02:33, 887.54 examples/s]Map:  38%|███▊      | 82092/216925 [01:39<03:05, 725.18 examples/s]Map:  36%|███▌      | 78342/216925 [01:41<03:04, 752.02 examples/s]Map:  38%|███▊      | 81805/216925 [01:41<02:35, 871.55 examples/s]Map:  38%|███▊      | 82186/216925 [01:40<02:54, 771.66 examples/s]Map:  36%|███▌      | 78424/216925 [01:41<02:59, 769.63 examples/s]Map:  37%|███▋      | 80802/216925 [01:40<02:40, 849.57 examples/s]Map:  36%|███▌      | 78513/216925 [01:41<02:52, 800.46 examples/s]Map:  38%|███▊      | 81925/216925 [01:41<02:40, 843.72 examples/s]Map:  38%|███▊      | 82307/216925 [01:40<02:52, 781.86 examples/s]Map:  37%|███▋      | 80930/216925 [01:40<02:40, 847.28 examples/s]Map:  36%|███▌      | 78600/216925 [01:41<02:49, 816.37 examples/s]Map:  38%|███▊      | 82398/216925 [01:40<02:45, 811.00 examples/s]Map:  36%|███▋      | 78689/216925 [01:41<02:46, 832.59 examples/s]Map:  38%|███▊      | 82493/216925 [01:40<02:39, 843.62 examples/s]Map:  38%|███▊      | 82044/216925 [01:41<03:16, 687.71 examples/s]Map:  37%|███▋      | 81043/216925 [01:40<03:13, 701.50 examples/s]Map:  36%|███▋      | 78774/216925 [01:41<02:45, 834.23 examples/s]Map:  38%|███▊      | 82586/216925 [01:40<02:35, 863.53 examples/s]Map:  38%|███▊      | 82134/216925 [01:41<03:04, 729.42 examples/s]Map:  37%|███▋      | 81135/216925 [01:40<03:01, 746.24 examples/s]Map:  36%|███▋      | 78863/216925 [01:41<02:42, 847.44 examples/s]Map:  38%|███▊      | 82679/216925 [01:40<02:32, 879.64 examples/s]Map:  38%|███▊      | 82223/216925 [01:41<02:56, 765.10 examples/s]Map:  37%|███▋      | 81223/216925 [01:40<02:55, 774.30 examples/s]Map:  38%|███▊      | 82316/216925 [01:41<02:47, 805.40 examples/s]Map:  36%|███▋      | 78986/216925 [01:42<02:45, 834.02 examples/s]Map:  38%|███▊      | 82814/216925 [01:40<02:32, 882.20 examples/s]Map:  37%|███▋      | 81310/216925 [01:40<02:50, 794.38 examples/s]Map:  38%|███▊      | 82404/216925 [01:42<02:43, 822.17 examples/s]Map:  38%|███▊      | 82910/216925 [01:40<02:29, 897.81 examples/s]Map:  38%|███▊      | 81400/216925 [01:40<02:45, 819.48 examples/s]Map:  38%|███▊      | 82497/216925 [01:42<02:38, 849.77 examples/s]Map:  36%|███▋      | 79083/216925 [01:42<03:26, 666.69 examples/s]Map:  38%|███▊      | 81496/216925 [01:41<02:38, 854.74 examples/s]Map:  38%|███▊      | 82585/216925 [01:42<02:36, 855.85 examples/s]Map:  36%|███▋      | 79169/216925 [01:42<03:14, 708.08 examples/s]Map:  38%|███▊      | 81586/216925 [01:41<02:36, 865.15 examples/s]Map:  38%|███▊      | 83042/216925 [01:41<03:05, 720.90 examples/s]Map:  38%|███▊      | 82676/216925 [01:42<02:34, 869.02 examples/s]Map:  37%|███▋      | 79261/216925 [01:42<03:01, 758.59 examples/s]Map:  38%|███▊      | 81675/216925 [01:41<02:35, 871.57 examples/s]Map:  38%|███▊      | 83133/216925 [01:41<02:56, 759.68 examples/s]Map:  38%|███▊      | 82768/216925 [01:42<02:32, 879.28 examples/s]Map:  37%|███▋      | 79350/216925 [01:42<02:53, 791.34 examples/s]Map:  38%|███▊      | 81800/216925 [01:41<02:38, 853.63 examples/s]Map:  37%|███▋      | 79436/216925 [01:42<02:50, 807.72 examples/s]Map:  38%|███▊      | 83253/216925 [01:41<02:53, 769.80 examples/s]Map:  38%|███▊      | 82894/216925 [01:42<02:35, 861.85 examples/s]Map:  38%|███▊      | 81893/216925 [01:41<02:35, 870.58 examples/s]Map:  37%|███▋      | 79525/216925 [01:42<02:46, 826.12 examples/s]Map:  38%|███▊      | 83344/216925 [01:41<02:46, 800.61 examples/s]Map:  38%|███▊      | 82985/216925 [01:42<02:33, 870.89 examples/s]Map:  38%|███▊      | 81987/216925 [01:41<02:32, 886.51 examples/s]Map:  37%|███▋      | 79611/216925 [01:42<02:44, 834.47 examples/s]Map:  38%|███▊      | 83438/216925 [01:41<02:40, 832.47 examples/s]Map:  39%|███▊      | 83532/216925 [01:41<02:35, 857.52 examples/s]Map:  38%|███▊      | 83090/216925 [01:42<03:10, 702.71 examples/s]Map:  37%|███▋      | 79737/216925 [01:43<02:44, 833.64 examples/s]Map:  38%|███▊      | 82089/216925 [01:41<03:10, 708.02 examples/s]Map:  39%|███▊      | 83625/216925 [01:41<02:32, 874.57 examples/s]Map:  38%|███▊      | 83179/216925 [01:43<02:59, 743.62 examples/s]Map:  37%|███▋      | 79825/216925 [01:43<02:42, 844.79 examples/s]Map:  38%|███▊      | 82179/216925 [01:41<02:59, 751.44 examples/s]Map:  39%|███▊      | 83717/216925 [01:41<02:30, 885.62 examples/s]Map:  38%|███▊      | 83263/216925 [01:43<02:54, 765.54 examples/s]Map:  37%|███▋      | 79915/216925 [01:43<02:40, 854.64 examples/s]Map:  38%|███▊      | 82270/216925 [01:41<02:50, 789.28 examples/s]Map:  39%|███▊      | 83809/216925 [01:42<02:29, 891.51 examples/s]Map:  38%|███▊      | 83353/216925 [01:43<02:47, 798.76 examples/s]Map:  38%|███▊      | 82362/216925 [01:42<02:43, 822.66 examples/s]Map:  39%|███▊      | 83900/216925 [01:42<02:28, 893.32 examples/s]Map:  38%|███▊      | 83445/216925 [01:43<02:40, 829.13 examples/s]Map:  37%|███▋      | 80044/216925 [01:43<03:14, 704.53 examples/s]Map:  38%|███▊      | 82452/216925 [01:42<02:39, 841.15 examples/s]Map:  39%|███▊      | 83992/216925 [01:42<02:28, 895.65 examples/s]Map:  39%|███▊      | 83540/216925 [01:43<02:35, 859.63 examples/s]Map:  37%|███▋      | 80135/216925 [01:43<03:02, 748.75 examples/s]Map:  38%|███▊      | 82540/216925 [01:42<02:38, 847.25 examples/s]Map:  39%|███▊      | 83634/216925 [01:43<02:31, 879.97 examples/s]Map:  37%|███▋      | 80224/216925 [01:43<02:55, 780.64 examples/s]Map:  38%|███▊      | 82630/216925 [01:42<02:36, 858.06 examples/s]Map:  39%|███▉      | 84089/216925 [01:42<03:10, 695.69 examples/s]Map:  37%|███▋      | 80307/216925 [01:43<02:52, 789.91 examples/s]Map:  39%|███▊      | 83763/216925 [01:43<02:33, 868.63 examples/s]Map:  39%|███▉      | 84179/216925 [01:42<02:58, 742.79 examples/s]Map:  38%|███▊      | 82761/216925 [01:42<02:35, 860.24 examples/s]Map:  37%|███▋      | 80392/216925 [01:43<02:49, 803.15 examples/s]Map:  39%|███▊      | 83853/216925 [01:43<02:32, 874.86 examples/s]Map:  39%|███▉      | 84271/216925 [01:42<02:49, 784.25 examples/s]Map:  38%|███▊      | 82850/216925 [01:42<02:34, 866.24 examples/s]Map:  37%|███▋      | 80478/216925 [01:44<02:47, 815.23 examples/s]Map:  39%|███▊      | 83942/216925 [01:43<02:31, 875.80 examples/s]Map:  39%|███▉      | 84363/216925 [01:42<02:41, 819.07 examples/s]Map:  37%|███▋      | 80562/216925 [01:44<02:46, 818.71 examples/s]Map:  38%|███▊      | 82977/216925 [01:42<02:36, 855.85 examples/s]Map:  39%|███▉      | 84453/216925 [01:42<02:38, 836.43 examples/s]Map:  37%|███▋      | 80652/216925 [01:44<02:42, 838.91 examples/s]Map:  39%|███▊      | 84042/216925 [01:44<03:10, 697.69 examples/s]Map:  39%|███▉      | 84547/216925 [01:42<02:33, 864.11 examples/s]Map:  39%|███▉      | 84135/216925 [01:44<02:57, 750.00 examples/s]Map:  38%|███▊      | 83088/216925 [01:43<03:09, 704.50 examples/s]Map:  39%|███▉      | 84642/216925 [01:43<02:29, 886.00 examples/s]Map:  37%|███▋      | 80763/216925 [01:44<02:50, 798.37 examples/s]Map:  39%|███▉      | 84222/216925 [01:44<02:50, 778.51 examples/s]Map:  38%|███▊      | 83184/216925 [01:43<02:56, 757.91 examples/s]Map:  39%|███▉      | 84776/216925 [01:43<02:29, 883.64 examples/s]Map:  37%|███▋      | 80880/216925 [01:44<02:52, 788.51 examples/s]Map:  39%|███▉      | 84308/216925 [01:44<02:46, 797.32 examples/s]Map:  38%|███▊      | 83275/216925 [01:43<02:49, 790.30 examples/s]Map:  39%|███▉      | 84870/216925 [01:43<02:27, 897.97 examples/s]Map:  37%|███▋      | 80968/216925 [01:44<02:48, 809.00 examples/s]Map:  39%|███▉      | 84396/216925 [01:44<02:41, 818.45 examples/s]Map:  38%|███▊      | 83370/216925 [01:43<02:41, 826.63 examples/s]Map:  39%|███▉      | 84963/216925 [01:43<02:25, 905.41 examples/s]Map:  39%|███▉      | 84490/216925 [01:44<02:35, 851.00 examples/s]Map:  38%|███▊      | 83458/216925 [01:43<02:39, 838.19 examples/s]Map:  39%|███▉      | 84581/216925 [01:44<02:33, 864.55 examples/s]Map:  39%|███▊      | 83552/216925 [01:43<02:34, 863.27 examples/s]Map:  37%|███▋      | 81088/216925 [01:44<03:21, 673.90 examples/s]Map:  39%|███▉      | 85091/216925 [01:43<02:59, 733.82 examples/s]Map:  37%|███▋      | 81173/216925 [01:44<03:11, 710.26 examples/s]Map:  39%|███▉      | 84710/216925 [01:44<02:33, 859.40 examples/s]Map:  39%|███▊      | 83686/216925 [01:43<02:33, 869.33 examples/s]Map:  39%|███▉      | 85183/216925 [01:43<02:50, 774.37 examples/s]Map:  37%|███▋      | 81257/216925 [01:45<03:03, 739.25 examples/s]Map:  39%|███▉      | 84800/216925 [01:44<02:32, 865.46 examples/s]Map:  39%|███▉      | 85273/216925 [01:43<02:44, 802.15 examples/s]Map:  39%|███▊      | 83815/216925 [01:43<02:33, 864.42 examples/s]Map:  37%|███▋      | 81338/216925 [01:45<02:59, 753.67 examples/s]Map:  39%|███▉      | 84888/216925 [01:45<02:32, 865.32 examples/s]Map:  39%|███▉      | 85364/216925 [01:43<02:39, 825.49 examples/s]Map:  39%|███▊      | 83908/216925 [01:43<02:31, 878.18 examples/s]Map:  38%|███▊      | 81421/216925 [01:45<02:56, 769.62 examples/s]Map:  39%|███▉      | 84980/216925 [01:45<02:30, 878.54 examples/s]Map:  39%|███▉      | 85458/216925 [01:44<02:34, 851.79 examples/s]Map:  38%|███▊      | 81511/216925 [01:45<02:48, 802.35 examples/s]Map:  39%|███▉      | 85549/216925 [01:44<02:31, 865.67 examples/s]Map:  39%|███▊      | 84000/216925 [01:44<03:07, 707.81 examples/s]Map:  38%|███▊      | 81595/216925 [01:45<02:47, 808.68 examples/s]Map:  39%|███▉      | 85087/216925 [01:45<03:09, 693.90 examples/s]Map:  39%|███▉      | 85639/216925 [01:44<02:30, 872.44 examples/s]Map:  39%|███▉      | 84084/216925 [01:44<03:00, 736.17 examples/s]Map:  38%|███▊      | 81678/216925 [01:45<02:46, 812.71 examples/s]Map:  39%|███▉      | 85182/216925 [01:45<02:55, 751.89 examples/s]Map:  40%|███▉      | 85731/216925 [01:44<02:28, 882.81 examples/s]Map:  39%|███▉      | 84177/216925 [01:44<02:49, 781.31 examples/s]Map:  38%|███▊      | 81762/216925 [01:45<02:44, 819.46 examples/s]Map:  39%|███▉      | 85273/216925 [01:45<02:46, 790.08 examples/s]Map:  40%|███▉      | 85822/216925 [01:44<02:27, 888.16 examples/s]Map:  39%|███▉      | 84268/216925 [01:44<02:43, 811.18 examples/s]Map:  38%|███▊      | 81849/216925 [01:45<02:42, 828.89 examples/s]Map:  39%|███▉      | 85367/216925 [01:45<02:38, 828.13 examples/s]Map:  40%|███▉      | 85915/216925 [01:44<02:26, 897.19 examples/s]Map:  39%|███▉      | 84357/216925 [01:44<02:40, 827.23 examples/s]Map:  38%|███▊      | 81935/216925 [01:45<02:41, 834.21 examples/s]Map:  39%|███▉      | 84446/216925 [01:44<02:37, 842.53 examples/s]Map:  39%|███▉      | 85499/216925 [01:45<02:35, 844.05 examples/s]Map:  40%|███▉      | 86044/216925 [01:44<03:05, 704.54 examples/s]Map:  38%|███▊      | 82042/216925 [01:46<03:27, 650.65 examples/s]Map:  39%|███▉      | 84576/216925 [01:44<02:36, 846.47 examples/s]Map:  39%|███▉      | 85622/216925 [01:45<02:37, 831.37 examples/s]Map:  40%|███▉      | 86138/216925 [01:44<02:53, 755.11 examples/s]Map:  38%|███▊      | 82124/216925 [01:46<03:15, 688.53 examples/s]Map:  39%|███▉      | 84665/216925 [01:44<02:34, 853.53 examples/s]Map:  40%|███▉      | 85716/216925 [01:46<02:33, 854.60 examples/s]Map:  40%|███▉      | 86232/216925 [01:44<02:43, 797.75 examples/s]Map:  38%|███▊      | 82206/216925 [01:46<03:07, 719.37 examples/s]Map:  39%|███▉      | 84753/216925 [01:44<02:34, 857.95 examples/s]Map:  40%|███▉      | 85804/216925 [01:46<02:32, 860.36 examples/s]Map:  40%|███▉      | 86320/216925 [01:45<02:40, 815.93 examples/s]Map:  38%|███▊      | 82293/216925 [01:46<02:58, 755.74 examples/s]Map:  39%|███▉      | 84845/216925 [01:45<02:31, 870.66 examples/s]Map:  40%|███▉      | 85894/216925 [01:46<02:31, 866.35 examples/s]Map:  40%|███▉      | 86416/216925 [01:45<02:33, 852.20 examples/s]Map:  38%|███▊      | 82377/216925 [01:46<02:53, 776.67 examples/s]Map:  39%|███▉      | 84937/216925 [01:45<02:29, 880.66 examples/s]Map:  40%|███▉      | 85982/216925 [01:46<02:31, 863.58 examples/s]Map:  40%|███▉      | 86510/216925 [01:45<02:29, 874.59 examples/s]Map:  38%|███▊      | 82461/216925 [01:46<02:49, 791.88 examples/s]Map:  40%|███▉      | 86604/216925 [01:45<02:26, 891.02 examples/s]Map:  38%|███▊      | 82547/216925 [01:46<02:46, 808.02 examples/s]Map:  39%|███▉      | 85045/216925 [01:45<03:08, 701.23 examples/s]Map:  40%|███▉      | 86089/216925 [01:46<03:07, 696.17 examples/s]Map:  40%|███▉      | 86697/216925 [01:45<02:24, 899.02 examples/s]Map:  39%|���██▉      | 85134/216925 [01:45<02:57, 743.18 examples/s]Map:  40%|███▉      | 86185/216925 [01:46<02:52, 756.38 examples/s]Map:  38%|███▊      | 82654/216925 [01:46<02:54, 767.52 examples/s]Map:  39%|███▉      | 85225/216925 [01:45<02:48, 781.40 examples/s]Map:  40%|███▉      | 86272/216925 [01:46<02:47, 780.25 examples/s]Map:  40%|████      | 86828/216925 [01:45<02:27, 884.97 examples/s]Map:  38%|███▊      | 82744/216925 [01:46<02:47, 800.28 examples/s]Map:  39%|███▉      | 85317/216925 [01:45<02:41, 815.84 examples/s]Map:  40%|███▉      | 86364/216925 [01:46<02:40, 815.00 examples/s]Map:  40%|████      | 86919/216925 [01:45<02:26, 887.79 examples/s]Map:  38%|███▊      | 82832/216925 [01:47<02:44, 816.36 examples/s]Map:  39%|███▉      | 85407/216925 [01:45<02:37, 835.05 examples/s]Map:  40%|███▉      | 86487/216925 [01:47<02:39, 815.46 examples/s]Map:  38%|███▊      | 82956/216925 [01:47<02:43, 817.55 examples/s]Map:  39%|███▉      | 85533/216925 [01:45<02:38, 831.15 examples/s]Map:  40%|████      | 87044/216925 [01:45<03:03, 706.83 examples/s]Map:  40%|███▉      | 86615/216925 [01:47<02:37, 824.82 examples/s]Map:  39%|███▉      | 85624/216925 [01:46<02:34, 849.32 examples/s]Map:  40%|████      | 87143/216925 [01:46<02:49, 766.88 examples/s]Map:  38%|███▊      | 83040/216925 [01:47<03:24, 656.26 examples/s]Map:  40%|███▉      | 86703/216925 [01:47<02:36, 833.32 examples/s]Map:  40%|███▉      | 85716/216925 [01:46<02:31, 866.49 examples/s]Map:  40%|████      | 87235/216925 [01:46<02:41, 801.63 examples/s]Map:  38%|███▊      | 83123/216925 [01:47<03:12, 694.14 examples/s]Map:  40%|████      | 86791/216925 [01:47<02:34, 843.07 examples/s]Map:  40%|███▉      | 85805/216925 [01:46<02:30, 868.71 examples/s]Map:  40%|████      | 87328/216925 [01:46<02:35, 833.39 examples/s]Map:  38%|███▊      | 83207/216925 [01:47<03:03, 727.29 examples/s]Map:  40%|████      | 86886/216925 [01:47<02:29, 868.94 examples/s]Map:  40%|████      | 87422/216925 [01:46<02:31, 855.39 examples/s]Map:  38%|███▊      | 83293/216925 [01:47<02:55, 760.26 examples/s]Map:  40%|███▉      | 85937/216925 [01:46<02:30, 868.47 examples/s]Map:  40%|████      | 86980/216925 [01:47<02:26, 884.69 examples/s]Map:  40%|████      | 87512/216925 [01:46<02:29, 865.51 examples/s]Map:  38%|███▊      | 83374/216925 [01:47<02:53, 770.58 examples/s]Map:  40%|████      | 87605/216925 [01:46<02:27, 878.76 examples/s]Map:  38%|███▊      | 83458/216925 [01:47<02:50, 783.02 examples/s]Map:  40%|███▉      | 86046/216925 [01:46<03:03, 712.17 examples/s]Map:  40%|████      | 87092/216925 [01:47<03:02, 712.91 examples/s]Map:  40%|████      | 87701/216925 [01:46<02:24, 897.38 examples/s]Map:  39%|███▊      | 83543/216925 [01:48<02:47, 798.14 examples/s]Map:  40%|███▉      | 86136/216925 [01:46<02:53, 751.99 examples/s]Map:  40%|████      | 87183/216925 [01:47<02:51, 757.04 examples/s]Map:  40%|████      | 87793/216925 [01:46<02:23, 901.79 examples/s]Map:  39%|███▊      | 83628/216925 [01:48<02:44, 810.40 examples/s]Map:  40%|███▉      | 86227/216925 [01:46<02:45, 788.58 examples/s]Map:  40%|████      | 87270/216925 [01:48<02:45, 783.53 examples/s]Map:  39%|███▊      | 83714/216925 [01:48<02:42, 820.56 examples/s]Map:  40%|███▉      | 86318/216925 [01:46<02:39, 817.61 examples/s]Map:  41%|████      | 87927/216925 [01:46<02:24, 892.56 examples/s]Map:  40%|████      | 87360/216925 [01:48<02:40, 809.76 examples/s]Map:  39%|███▊      | 83802/216925 [01:48<02:39, 833.19 examples/s]Map:  40%|███▉      | 86406/216925 [01:47<02:37, 831.19 examples/s]Map:  40%|████      | 87445/216925 [01:48<02:37, 819.59 examples/s]Map:  40%|███▉      | 86500/216925 [01:47<02:31, 859.16 examples/s]Map:  40%|████      | 87532/216925 [01:48<02:35, 832.35 examples/s]Map:  39%|███▊      | 83928/216925 [01:48<02:40, 829.57 examples/s]Map:  41%|████      | 88043/216925 [01:47<02:59, 716.99 examples/s]Map:  40%|████      | 87624/216925 [01:48<02:31, 853.83 examples/s]Map:  41%|████      | 88135/216925 [01:47<02:49, 758.85 examples/s]Map:  40%|███▉      | 86631/216925 [01:47<02:31, 860.08 examples/s]Map:  40%|████      | 87711/216925 [01:48<02:30, 856.71 examples/s]Map:  41%|████      | 88227/216925 [01:47<02:41, 796.79 examples/s]Map:  39%|███▊      | 84045/216925 [01:48<03:17, 673.35 examples/s]Map:  40%|███▉      | 86761/216925 [01:47<02:31, 857.05 examples/s]Map:  40%|████      | 87798/216925 [01:48<02:30, 858.19 examples/s]Map:  41%|████      | 88320/216925 [01:47<02:35, 828.55 examples/s]Map:  39%|███▉      | 84132/216925 [01:48<03:06, 713.57 examples/s]Map:  40%|████      | 86855/216925 [01:47<02:28, 874.85 examples/s]Map:  41%|████      | 88411/216925 [01:47<02:31, 846.25 examples/s]Map:  39%|███▉      | 84214/216925 [01:48<03:00, 735.05 examples/s]Map:  41%|████      | 87927/216925 [01:48<02:30, 855.26 examples/s]Map:  40%|████      | 86946/216925 [01:47<02:27, 882.09 examples/s]Map:  41%|████      | 88503/216925 [01:47<02:28, 863.49 examples/s]Map:  39%|███▉      | 84300/216925 [01:49<02:53, 765.03 examples/s]Map:  41%|████      | 88595/216925 [01:47<02:26, 877.57 examples/s]Map:  39%|███▉      | 84384/216925 [01:49<02:49, 783.37 examples/s]Map:  41%|████      | 88044/216925 [01:49<03:04, 700.36 examples/s]Map:  40%|████      | 87044/216925 [01:47<03:03, 707.74 examples/s]Map:  41%|████      | 88685/216925 [01:47<02:25, 881.09 examples/s]Map:  39%|███▉      | 84468/216925 [01:49<02:46, 793.97 examples/s]Map:  41%|████      | 88133/216925 [01:49<02:53, 740.98 examples/s]Map:  40%|████      | 87134/216925 [01:47<02:52, 750.63 examples/s]Map:  41%|████      | 88777/216925 [01:47<02:24, 889.50 examples/s]Map:  39%|███▉      | 84551/216925 [01:49<02:45, 801.38 examples/s]Map:  41%|████      | 88224/216925 [01:49<02:45, 778.79 examples/s]Map:  40%|████      | 87220/216925 [01:48<02:46, 777.33 examples/s]Map:  41%|████      | 88871/216925 [01:48<02:22, 899.51 examples/s]Map:  39%|███▉      | 84638/216925 [01:49<02:41, 818.97 examples/s]Map:  41%|████      | 88313/216925 [01:49<02:39, 806.03 examples/s]Map:  40%|████      | 87308/216925 [01:48<02:41, 803.23 examples/s]Map:  41%|████      | 88962/216925 [01:48<02:22, 897.98 examples/s]Map:  41%|████      | 88403/216925 [01:49<02:35, 828.40 examples/s]Map:  39%|███▉      | 84762/216925 [01:49<02:41, 820.25 examples/s]Map:  40%|████      | 87399/216925 [01:48<02:35, 830.33 examples/s]Map:  41%|████      | 88493/216925 [01:49<02:31, 845.59 examples/s]Map:  39%|███▉      | 84849/216925 [01:49<02:39, 829.97 examples/s]Map:  40%|████      | 87487/216925 [01:48<02:33, 841.66 examples/s]Map:  41%|████      | 89088/216925 [01:48<02:59, 711.96 examples/s]Map:  41%|████      | 88581/216925 [01:49<02:31, 849.95 examples/s]Map:  39%|███▉      | 84937/216925 [01:49<02:37, 839.17 examples/s]Map:  40%|████      | 87575/216925 [01:48<02:32, 850.07 examples/s]Map:  41%|████      | 89180/216925 [01:48<02:48, 757.73 examples/s]Map:  41%|████      | 88675/216925 [01:49<02:26, 872.58 examples/s]Map:  40%|████      | 87663/216925 [01:48<02:31, 854.78 examples/s]Map:  41%|████      | 89271/216925 [01:48<02:40, 793.12 examples/s]Map:  41%|████      | 88766/216925 [01:49<02:25, 881.31 examples/s]Map:  40%|████      | 87755/216925 [01:48<02:27, 872.82 examples/s]Map:  39%|███▉      | 85044/216925 [01:50<03:15, 673.10 examples/s]Map:  41%|████      | 89363/216925 [01:48<02:34, 823.86 examples/s]Map:  40%|████      | 87844/216925 [01:48<02:27, 874.71 examples/s]Map:  39%|███▉      | 85130/216925 [01:50<03:04, 713.98 examples/s]Map:  41%|████      | 88899/216925 [01:50<02:25, 878.56 examples/s]Map:  41%|████      | 89457/216925 [01:48<02:29, 852.94 examples/s]Map:  39%|███▉      | 85214/216925 [01:50<02:57, 742.07 examples/s]Map:  41%|████      | 88993/216925 [01:50<02:23, 890.48 examples/s]Map:  41%|████      | 87972/216925 [01:48<02:29, 861.12 examples/s]Map:  41%|████▏     | 89548/216925 [01:48<02:27, 866.06 examples/s]Map:  39%|███▉      | 85299/216925 [01:50<02:51, 768.08 examples/s]Map:  41%|████▏     | 89638/216925 [01:49<02:25, 871.92 examples/s]Map:  41%|████      | 89090/216925 [01:50<02:59, 712.27 examples/s]Map:  41%|████▏     | 89728/216925 [01:49<02:25, 876.11 examples/s]Map:  39%|███▉      | 85421/216925 [01:50<02:48, 779.50 examples/s]Map:  41%|████      | 88086/216925 [01:49<03:04, 697.75 examples/s]Map:  41%|████      | 89176/216925 [01:50<02:51, 745.36 examples/s]Map:  41%|████▏     | 89822/216925 [01:49<02:22, 891.00 examples/s]Map:  39%|███▉      | 85507/216925 [01:50<02:44, 798.40 examples/s]Map:  41%|████      | 88176/216925 [01:49<02:53, 740.19 examples/s]Map:  41%|████      | 89268/216925 [01:50<02:42, 787.93 examples/s]Map:  41%|████▏     | 89913/216925 [01:49<02:22, 892.88 examples/s]Map:  39%|███▉      | 85590/216925 [01:50<02:43, 803.50 examples/s]Map:  41%|████      | 88266/216925 [01:49<02:45, 776.39 examples/s]Map:  41%|████      | 89355/216925 [01:50<02:37, 808.05 examples/s]Map:  39%|███▉      | 85674/216925 [01:50<02:42, 809.60 examples/s]Map:  41%|████      | 88354/216925 [01:49<02:40, 800.47 examples/s]Map:  41%|████      | 89445/216925 [01:50<02:33, 831.05 examples/s]Map:  40%|███▉      | 85760/216925 [01:50<02:40, 818.55 examples/s]Map:  41%|████      | 88447/216925 [01:49<02:34, 832.65 examples/s]Map:  42%|████▏     | 90045/216925 [01:49<02:56, 716.85 examples/s]Map:  41%|████▏     | 89534/216925 [01:50<02:30, 846.56 examples/s]Map:  40%|███▉      | 85846/216925 [01:50<02:38, 828.61 examples/s]Map:  42%|████▏     | 90143/216925 [01:49<02:43, 776.02 examples/s]Map:  41%|████▏     | 89628/216925 [01:50<02:26, 870.78 examples/s]Map:  41%|████      | 88581/216925 [01:49<02:31, 849.62 examples/s]Map:  40%|███▉      | 85934/216925 [01:51<02:35, 841.41 examples/s]Map:  42%|████▏     | 90234/216925 [01:49<02:37, 806.49 examples/s]Map:  41%|████      | 88672/216925 [01:49<02:28, 861.12 examples/s]Map:  41%|████▏     | 89719/216925 [01:51<02:25, 876.60 examples/s]Map:  42%|████▏     | 90329/216925 [01:49<02:30, 839.83 examples/s]Map:  41%|████      | 88761/216925 [01:49<02:27, 866.88 examples/s]Map:  41%|████▏     | 89813/216925 [01:51<02:22, 892.29 examples/s]Map:  40%|███▉      | 86041/216925 [01:51<03:16, 667.73 examples/s]Map:  42%|████▏     | 90418/216925 [01:49<02:29, 848.64 examples/s]Map:  41%|████      | 88851/216925 [01:50<02:26, 874.75 examples/s]Map:  41%|████▏     | 89903/216925 [01:51<02:22, 889.33 examples/s]Map:  40%|███▉      | 86128/216925 [01:51<03:03, 712.32 examples/s]Map:  42%|████▏     | 90509/216925 [01:50<02:26, 863.58 examples/s]Map:  41%|████      | 88940/216925 [01:50<02:26, 875.79 examples/s]Map:  41%|████▏     | 89996/216925 [01:51<02:21, 898.35 examples/s]Map:  40%|███▉      | 86212/216925 [01:51<02:56, 742.32 examples/s]Map:  42%|████▏     | 90603/216925 [01:50<02:23, 882.54 examples/s]Map:  40%|███▉      | 86298/216925 [01:51<02:49, 770.81 examples/s]Map:  42%|████▏     | 90088/216925 [01:51<03:00, 701.72 examples/s]Map:  41%|████      | 89045/216925 [01:50<03:03, 695.98 examples/s]Map:  42%|████▏     | 90738/216925 [01:50<02:22, 886.72 examples/s]Map:  40%|███▉      | 86391/216925 [01:51<02:40, 811.28 examples/s]Map:  42%|████▏     | 90179/216925 [01:51<02:48, 752.81 examples/s]Map:  41%|████      | 89136/216925 [01:50<02:51, 743.47 examples/s]Map:  42%|████▏     | 90829/216925 [01:50<02:21, 889.71 examples/s]Map:  40%|███▉      | 86477/216925 [01:51<02:38, 821.43 examples/s]Map:  42%|████▏     | 90275/216925 [01:51<02:38, 801.35 examples/s]Map:  41%|████      | 89221/216925 [01:50<02:46, 767.46 examples/s]Map:  42%|████▏     | 90922/216925 [01:50<02:20, 897.37 examples/s]Map:  40%|███▉      | 86562/216925 [01:51<02:37, 828.34 examples/s]Map:  42%|████▏     | 90366/216925 [01:51<02:32, 828.87 examples/s]Map:  41%|████      | 89307/216925 [01:50<02:41, 790.09 examples/s]Map:  40%|███▉      | 86650/216925 [01:52<02:34, 841.37 examples/s]Map:  41%|████      | 89400/216925 [01:50<02:34, 824.69 examples/s]Map:  42%|████▏     | 90496/216925 [01:51<02:30, 839.89 examples/s]Map:  42%|████▏     | 91041/216925 [01:50<02:55, 716.81 examples/s]Map:  41%|████▏     | 89492/216925 [01:50<02:30, 848.21 examples/s]Map:  40%|████      | 86780/216925 [01:52<02:33, 846.42 examples/s]Map:  42%|████▏     | 90592/216925 [01:52<02:25, 866.28 examples/s]Map:  42%|████▏     | 91136/216925 [01:50<02:44, 766.52 examples/s]Map:  41%|████▏     | 89583/216925 [01:50<02:27, 864.51 examples/s]Map:  40%|████      | 86872/216925 [01:52<02:30, 863.65 examples/s]Map:  42%|████▏     | 90685/216925 [01:52<02:23, 879.15 examples/s]Map:  42%|████▏     | 91230/216925 [01:50<02:35, 806.54 examples/s]Map:  41%|████▏     | 89674/216925 [01:51<02:25, 874.15 examples/s]Map:  42%|████▏     | 91321/216925 [01:51<02:31, 831.13 examples/s]Map:  40%|████      | 86998/216925 [01:52<02:32, 851.67 examples/s]Map:  42%|████▏     | 90816/216925 [01:52<02:24, 874.94 examples/s]Map:  41%|████▏     | 89769/216925 [01:51<02:22, 892.09 examples/s]Map:  42%|████▏     | 91412/216925 [01:51<02:27, 848.75 examples/s]Map:  42%|████▏     | 90909/216925 [01:52<02:22, 886.27 examples/s]Map:  41%|████▏     | 89861/216925 [01:51<02:21, 898.61 examples/s]Map:  42%|████▏     | 91507/216925 [01:51<02:23, 873.76 examples/s]Map:  40%|████      | 87088/216925 [01:52<03:08, 688.25 examples/s]Map:  41%|████▏     | 89996/216925 [01:51<02:21, 895.44 examples/s]Map:  40%|████      | 87178/216925 [01:52<02:56, 735.35 examples/s]Map:  42%|████▏     | 91000/216925 [01:52<02:59, 702.47 examples/s]Map:  42%|████▏     | 91643/216925 [01:51<02:22, 881.60 examples/s]Map:  40%|████      | 87272/216925 [01:52<02:45, 781.09 examples/s]Map:  42%|████▏     | 91090/216925 [01:52<02:48, 744.93 examples/s]Map:  42%|████▏     | 91739/216925 [01:51<02:19, 898.77 examples/s]Map:  42%|████▏     | 90089/216925 [01:51<02:57, 713.93 examples/s]Map:  40%|████      | 87359/216925 [01:52<02:41, 801.95 examples/s]Map:  42%|████▏     | 91183/216925 [01:52<02:39, 788.09 examples/s]Map:  42%|████▏     | 91831/216925 [01:51<02:18, 901.65 examples/s]Map:  42%|████▏     | 90179/216925 [01:51<02:47, 756.42 examples/s]Map:  40%|████      | 87447/216925 [01:53<02:37, 819.49 examples/s]Map:  42%|████▏     | 91272/216925 [01:52<02:34, 812.03 examples/s]Map:  42%|████▏     | 91926/216925 [01:51<02:16, 913.35 examples/s]Map:  42%|████▏     | 90267/216925 [01:51<02:41, 786.04 examples/s]Map:  40%|████      | 87537/216925 [01:53<02:34, 838.89 examples/s]Map:  42%|████▏     | 91365/216925 [01:53<02:29, 839.73 examples/s]Map:  42%|████▏     | 90358/216925 [01:51<02:34, 817.51 examples/s]Map:  40%|████      | 87625/216925 [01:53<02:32, 848.39 examples/s]Map:  42%|████▏     | 91454/216925 [01:53<02:27, 850.85 examples/s]Map:  42%|████▏     | 92046/216925 [01:51<02:49, 734.64 examples/s]Map:  42%|████▏     | 90447/216925 [01:51<02:31, 833.20 examples/s]Map:  40%|████      | 87713/216925 [01:53<02:30, 856.21 examples/s]Map:  42%|████▏     | 91544/216925 [01:53<02:26, 853.74 examples/s]Map:  42%|████▏     | 92141/216925 [01:52<02:39, 781.42 examples/s]Map:  42%|████▏     | 90538/216925 [01:52<02:28, 850.72 examples/s]Map:  40%|████      | 87841/216925 [01:53<02:31, 851.33 examples/s]Map:  43%|████▎     | 92227/216925 [01:52<02:35, 799.89 examples/s]Map:  42%|████▏     | 91675/216925 [01:53<02:25, 858.38 examples/s]Map:  42%|████▏     | 90631/216925 [01:52<02:24, 871.07 examples/s]Map:  41%|████      | 87928/216925 [01:53<02:31, 851.46 examples/s]Map:  43%|████▎     | 92318/216925 [01:52<02:30, 825.98 examples/s]Map:  42%|████▏     | 91765/216925 [01:53<02:24, 866.11 examples/s]Map:  42%|████▏     | 90722/216925 [01:52<02:23, 879.52 examples/s]Map:  43%|████▎     | 92407/216925 [01:52<02:27, 841.61 examples/s]Map:  42%|████▏     | 90811/216925 [01:52<02:23, 878.45 examples/s]Map:  42%|████▏     | 91895/216925 [01:53<02:25, 861.15 examples/s]Map:  43%|████▎     | 92499/216925 [01:52<02:24, 863.23 examples/s]Map:  41%|████      | 88044/216925 [01:53<03:05, 693.17 examples/s]Map:  42%|████▏     | 90944/216925 [01:52<02:23, 877.03 examples/s]Map:  43%|████▎     | 92590/216925 [01:52<02:22, 875.08 examples/s]Map:  41%|████      | 88133/216925 [01:53<02:54, 736.15 examples/s]Map:  42%|████▏     | 92000/216925 [01:53<03:00, 691.31 examples/s]Map:  43%|████▎     | 92683/216925 [01:52<02:19, 889.62 examples/s]Map:  41%|████      | 88219/216925 [01:54<02:48, 764.07 examples/s]Map:  42%|████▏     | 91044/216925 [01:52<02:59, 701.25 examples/s]Map:  42%|████▏     | 92089/216925 [01:53<02:50, 733.49 examples/s]Map:  41%|████      | 88312/216925 [01:54<02:40, 802.90 examples/s]Map:  43%|████▎     | 92812/216925 [01:52<02:21, 875.99 examples/s]Map:  42%|████▏     | 91128/216925 [01:52<02:51, 731.92 examples/s]Map:  42%|████▏     | 92180/216925 [01:54<02:41, 772.76 examples/s]Map:  41%|████      | 88400/216925 [01:54<02:36, 820.94 examples/s]Map:  43%|████▎     | 92907/216925 [01:52<02:18, 892.69 examples/s]Map:  42%|████▏     | 91217/216925 [01:52<02:44, 765.52 examples/s]Map:  43%|████▎     | 92273/216925 [01:54<02:33, 810.18 examples/s]Map:  41%|████      | 88490/216925 [01:54<02:32, 839.62 examples/s]Map:  42%|████▏     | 91312/216925 [01:53<02:34, 811.80 examples/s]Map:  43%|████▎     | 92362/216925 [01:54<02:30, 829.60 examples/s]Map:  43%|████▎     | 93000/216925 [01:53<02:53, 713.72 examples/s]Map:  41%|████      | 88621/216925 [01:54<02:31, 848.85 examples/s]Map:  42%|████▏     | 91404/216925 [01:53<02:29, 838.18 examples/s]Map:  43%|████▎     | 92456/216925 [01:54<02:25, 856.64 examples/s]Map:  43%|████▎     | 93093/216925 [01:53<02:42, 760.93 examples/s]Map:  41%|████      | 88714/216925 [01:54<02:27, 866.82 examples/s]Map:  42%|████▏     | 91494/216925 [01:53<02:26, 853.98 examples/s]Map:  43%|████▎     | 92548/216925 [01:54<02:22, 872.57 examples/s]Map:  43%|████▎     | 93185/216925 [01:53<02:34, 799.00 examples/s]Map:  41%|████      | 88803/216925 [01:54<02:27, 869.61 examples/s]Map:  42%|█��██▏     | 91588/216925 [01:53<02:23, 873.78 examples/s]Map:  43%|████▎     | 92638/216925 [01:54<02:21, 877.35 examples/s]Map:  43%|████▎     | 93278/216925 [01:53<02:28, 832.80 examples/s]Map:  41%|████      | 88897/216925 [01:54<02:24, 887.86 examples/s]Map:  42%|████▏     | 91722/216925 [01:53<02:22, 877.22 examples/s]Map:  43%|████▎     | 93366/216925 [01:53<02:26, 843.60 examples/s]Map:  43%|████▎     | 92766/216925 [01:54<02:24, 860.61 examples/s]Map:  42%|████▏     | 91811/216925 [01:53<02:22, 876.42 examples/s]Map:  43%|████▎     | 93463/216925 [01:53<02:21, 875.12 examples/s]Map:  43%|████▎     | 92857/216925 [01:54<02:22, 872.10 examples/s]Map:  41%|████      | 89000/216925 [01:54<03:01, 705.88 examples/s]Map:  42%|████▏     | 91905/216925 [01:53<02:20, 890.12 examples/s]Map:  43%|████▎     | 93554/216925 [01:53<02:19, 883.31 examples/s]Map:  41%|████      | 89088/216925 [01:55<02:51, 745.03 examples/s]Map:  43%|████▎     | 92987/216925 [01:54<02:23, 863.66 examples/s]Map:  41%|████      | 89179/216925 [01:55<02:43, 783.44 examples/s]Map:  43%|████▎     | 93689/216925 [01:53<02:19, 885.26 examples/s]Map:  42%|████▏     | 92000/216925 [01:53<02:57, 702.81 examples/s]Map:  41%|████      | 89268/216925 [01:55<02:37, 810.00 examples/s]Map:  43%|████▎     | 93089/216925 [01:55<02:56, 703.60 examples/s]Map:  43%|████▎     | 93824/216925 [01:54<02:18, 886.83 examples/s]Map:  42%|████▏     | 92086/216925 [01:54<02:49, 738.01 examples/s]Map:  41%|████      | 89361/216925 [01:55<02:31, 841.99 examples/s]Map:  43%|████▎     | 93181/216925 [01:55<02:44, 750.83 examples/s]Map:  43%|████▎     | 93919/216925 [01:54<02:16, 901.77 examples/s]Map:  42%|████▏     | 92179/216925 [01:54<02:39, 783.79 examples/s]Map:  41%|████      | 89450/216925 [01:55<02:29, 853.09 examples/s]Map:  43%|████▎     | 93271/216925 [01:55<02:37, 785.28 examples/s]Map:  43%|████▎     | 92267/216925 [01:54<02:34, 806.56 examples/s]Map:  41%|████▏     | 89541/216925 [01:55<02:27, 865.70 examples/s]Map:  43%|████▎     | 93360/216925 [01:55<02:32, 809.30 examples/s]Map:  43%|████▎     | 92357/216925 [01:54<02:30, 829.35 examples/s]Map:  41%|████▏     | 89633/216925 [01:55<02:24, 879.06 examples/s]Map:  43%|████▎     | 94043/216925 [01:54<02:50, 722.07 examples/s]Map:  43%|████▎     | 93449/216925 [01:55<02:29, 825.95 examples/s]Map:  43%|████▎     | 92448/216925 [01:54<02:26, 850.20 examples/s]Map:  41%|████▏     | 89724/216925 [01:55<02:23, 886.40 examples/s]Map:  43%|████▎     | 94138/216925 [01:54<02:39, 770.55 examples/s]Map:  43%|████▎     | 93537/216925 [01:55<02:27, 838.68 examples/s]Map:  43%|████▎     | 92538/216925 [01:54<02:24, 859.17 examples/s]Map:  41%|████▏     | 89818/216925 [01:55<02:21, 898.11 examples/s]Map:  43%|████▎     | 94227/216925 [01:54<02:34, 795.66 examples/s]Map:  43%|████▎     | 92629/216925 [01:54<02:22, 872.57 examples/s]Map:  43%|████▎     | 93668/216925 [01:55<02:25, 846.81 examples/s]Map:  43%|████▎     | 94319/216925 [01:54<02:28, 823.67 examples/s]Map:  41%|████▏     | 89953/216925 [01:56<02:21, 895.60 examples/s]Map:  43%|████▎     | 92718/216925 [01:54<02:22, 873.94 examples/s]Map:  43%|████▎     | 93761/216925 [01:55<02:22, 864.82 examples/s]Map:  44%|████▎     | 94407/216925 [01:54<02:26, 837.25 examples/s]Map:  43%|████▎     | 93850/216925 [01:56<02:21, 870.34 examples/s]Map:  44%|████▎     | 94499/216925 [01:54<02:23, 856.02 examples/s]Map:  43%|████▎     | 92852/216925 [01:54<02:21, 876.71 examples/s]Map:  42%|████▏     | 90044/216925 [01:56<02:56, 720.59 examples/s]Map:  44%|████▎     | 94588/216925 [01:54<02:21, 863.03 examples/s]Map:  43%|████▎     | 92942/216925 [01:54<02:20, 882.07 examples/s]Map:  43%|████▎     | 93981/216925 [01:56<02:21, 866.46 examples/s]Map:  42%|████▏     | 90137/216925 [01:56<02:45, 765.39 examples/s]Map:  44%|████▎     | 94680/216925 [01:55<02:19, 874.57 examples/s]Map:  42%|████▏     | 90232/216925 [01:56<02:36, 807.48 examples/s]Map:  43%|████▎     | 93045/216925 [01:55<02:55, 707.82 examples/s]Map:  42%|████▏     | 90326/216925 [01:56<02:31, 836.37 examples/s]Map:  43%|████▎     | 94083/216925 [01:56<02:58, 689.64 examples/s]Map:  44%|████▎     | 94812/216925 [01:55<02:20, 868.82 examples/s]Map:  43%|████▎     | 93137/216925 [01:55<02:44, 754.26 examples/s]Map:  42%|████▏     | 90413/216925 [01:56<02:30, 843.29 examples/s]Map:  43%|████▎     | 94178/216925 [01:56<02:44, 743.96 examples/s]Map:  44%|████▎     | 94902/216925 [01:55<02:19, 873.99 examples/s]Map:  43%|████▎     | 93231/216925 [01:55<02:35, 797.57 examples/s]Map:  42%|████▏     | 90503/216925 [01:56<02:27, 856.68 examples/s]Map:  43%|████▎     | 94269/216925 [01:56<02:36, 781.77 examples/s]Map:  44%|████▍     | 94991/216925 [01:55<02:19, 873.77 examples/s]Map:  43%|████▎     | 93322/216925 [01:55<02:29, 824.40 examples/s]Map:  42%|████▏     | 90596/216925 [01:56<02:24, 874.01 examples/s]Map:  43%|████▎     | 94359/216925 [01:56<02:31, 810.38 examples/s]Map:  44%|████▎     | 94446/216925 [01:56<02:28, 824.20 examples/s]Map:  44%|████▍     | 95083/216925 [01:55<03:01, 672.70 examples/s]Map:  43%|████▎     | 93447/216925 [01:55<02:30, 821.75 examples/s]Map:  42%|████▏     | 90730/216925 [01:57<02:23, 876.47 examples/s]Map:  44%|████▍     | 95167/216925 [01:55<02:51, 709.14 examples/s]Map:  43%|████▎     | 93535/216925 [01:55<02:28, 831.12 examples/s]Map:  42%|████▏     | 90825/216925 [01:57<02:21, 891.82 examples/s]Map:  44%|████▎     | 94574/216925 [01:56<02:27, 830.09 examples/s]Map:  44%|████▍     | 95257/216925 [01:55<02:41, 753.21 examples/s]Map:  43%|████▎     | 93629/216925 [01:55<02:24, 856.12 examples/s]Map:  42%|████▏     | 90918/216925 [01:57<02:19, 901.15 examples/s]Map:  44%|████▎     | 94670/216925 [01:57<02:21, 861.01 examples/s]Map:  44%|████▍     | 95351/216925 [01:55<02:32, 796.96 examples/s]Map:  43%|████▎     | 93722/216925 [01:55<02:21, 873.56 examples/s]Map:  44%|████▎     | 94762/216925 [01:57<02:19, 874.03 examples/s]Map:  44%|████▍     | 95442/216925 [01:56<02:27, 822.00 examples/s]Map:  43%|████▎     | 93814/216925 [01:56<02:19, 884.00 examples/s]Map:  42%|████▏     | 91041/216925 [01:57<02:53, 725.13 examples/s]Map:  44%|████▎     | 94895/216925 [01:57<02:19, 875.66 examples/s]Map:  44%|████▍     | 95536/216925 [01:56<02:22, 851.00 examples/s]Map:  42%|████▏     | 91136/216925 [01:57<02:42, 774.37 examples/s]Map:  43%|████▎     | 93947/216925 [01:56<02:19, 880.62 examples/s]Map:  44%|████▍     | 95625/216925 [01:56<02:21, 857.39 examples/s]Map:  42%|████▏     | 91230/216925 [01:57<02:34, 812.65 examples/s]Map:  44%|████▍     | 95000/216925 [01:57<02:52, 707.81 examples/s]Map:  44%|████▍     | 95717/216925 [01:56<02:18, 872.01 examples/s]Map:  42%|████▏     | 91321/216925 [01:57<02:30, 835.31 examples/s]Map:  43%|████▎     | 94041/216925 [01:56<02:52, 714.21 examples/s]Map:  44%|████▍     | 95087/216925 [01:57<02:44, 740.96 examples/s]Map:  44%|████▍     | 95809/216925 [01:56<02:17, 881.59 examples/s]Map:  42%|████▏     | 91412/216925 [01:57<02:27, 853.07 examples/s]Map:  43%|████▎     | 94132/216925 [01:56<02:42, 755.71 examples/s]Map:  44%|████▍     | 95181/216925 [01:57<02:34, 786.85 examples/s]Map:  42%|████▏     | 91504/216925 [01:57<02:24, 868.48 examples/s]Map:  44%|████▍     | 95941/216925 [01:56<02:17, 879.75 examples/s]Map:  43%|████▎     | 94220/216925 [01:56<02:36, 781.61 examples/s]Map:  44%|████▍     | 95272/216925 [01:57<02:28, 816.83 examples/s]Map:  43%|████▎     | 94316/216925 [01:56<02:28, 826.88 examples/s]Map:  42%|████▏     | 91640/216925 [01:58<02:22, 879.42 examples/s]Map:  44%|████▍     | 95393/216925 [01:58<02:30, 808.11 examples/s]Map:  44%|████▎     | 94403/216925 [01:56<02:26, 836.34 examples/s]Map:  44%|████▍     | 96039/216925 [01:56<02:58, 678.18 examples/s]Map:  44%|████▍     | 95482/216925 [01:58<02:26, 827.58 examples/s]Map:  42%|████▏     | 91776/216925 [01:58<02:21, 885.91 examples/s]Map:  44%|████▎     | 94494/216925 [01:56<02:23, 854.63 examples/s]Map:  44%|████▍     | 96131/216925 [01:56<02:45, 728.15 examples/s]Map:  44%|████▍     | 95573/216925 [01:58<02:23, 847.27 examples/s]Map:  42%|████▏     | 91869/216925 [01:58<02:19, 896.31 examples/s]Map:  44%|████▎     | 94585/216925 [01:57<02:20, 869.43 examples/s]Map:  44%|████▍     | 96221/216925 [01:57<02:37, 768.18 examples/s]Map:  44%|████▍     | 95664/216925 [01:58<02:20, 862.65 examples/s]Map:  42%|████▏     | 91961/216925 [01:58<02:18, 901.60 examples/s]Map:  44%|████▎     | 94678/216925 [01:57<02:18, 882.80 examples/s]Map:  44%|████▍     | 96312/216925 [01:57<02:30, 802.55 examples/s]Map:  44%|████▍     | 95757/216925 [01:58<02:17, 878.70 examples/s]Map:  44%|████▎     | 94771/216925 [01:57<02:16, 891.72 examples/s]Map:  44%|████▍     | 96400/216925 [01:57<02:26, 822.70 examples/s]Map:  44%|████▍     | 95848/216925 [01:58<02:16, 886.00 examples/s]Map:  44%|████▎     | 94866/216925 [01:57<02:14, 905.13 examples/s]Map:  44%|████▍     | 96488/216925 [01:57<02:24, 833.54 examples/s]Map:  42%|████▏     | 92092/216925 [01:58<02:48, 738.68 examples/s]Map:  44%|████▍     | 95941/216925 [01:58<02:14, 897.39 examples/s]Map:  42%|████▏     | 92184/216925 [01:58<02:40, 776.88 examples/s]Map:  45%|████▍     | 96580/216925 [01:57<02:20, 854.77 examples/s]Map:  45%|████▍     | 96672/216925 [01:57<02:18, 871.38 examples/s]Map:  43%|████▎     | 92270/216925 [01:58<02:37, 793.68 examples/s]Map:  44%|████▍     | 95000/216925 [01:57<02:46, 733.93 examples/s]Map:  44%|████▍     | 96042/216925 [01:58<02:53, 694.75 examples/s]Map:  45%|████▍     | 96761/216925 [01:57<02:17, 874.01 examples/s]Map:  43%|████▎     | 92363/216925 [01:58<02:30, 826.51 examples/s]Map:  44%|████▍     | 95083/216925 [01:57<02:41, 754.54 examples/s]Map:  44%|████▍     | 96132/216925 [01:58<02:42, 741.55 examples/s]Map:  45%|████▍     | 96853/216925 [01:57<02:15, 884.40 examples/s]Map:  43%|████▎     | 92455/216925 [01:59<02:26, 849.42 examples/s]Map:  44%|████▍     | 95172/216925 [01:57<02:34, 785.77 examples/s]Map:  44%|████▍     | 96219/216925 [01:59<02:36, 771.53 examples/s]Map:  43%|████▎     | 92546/216925 [01:59<02:24, 861.73 examples/s]Map:  44%|████▍     | 95262/216925 [01:57<02:29, 813.41 examples/s]Map:  45%|████▍     | 96982/216925 [01:57<02:17, 869.89 examples/s]Map:  44%|████▍     | 96307/216925 [01:59<02:31, 798.58 examples/s]Map:  44%|████▍     | 95350/216925 [01:57<02:26, 828.46 examples/s]Map:  43%|████▎     | 92679/216925 [01:59<02:23, 866.00 examples/s]Map:  44%|████▍     | 96393/216925 [01:59<02:28, 812.74 examples/s]Map:  44%|████▍     | 95445/216925 [01:58<02:21, 860.25 examples/s]Map:  45%|████▍     | 97087/216925 [01:58<02:52, 692.71 examples/s]Map:  44%|████▍     | 96481/216925 [01:59<02:25, 829.73 examples/s]Map:  43%|████▎     | 92811/216925 [01:59<02:23, 867.47 examples/s]Map:  44%|████▍     | 95538/216925 [01:58<02:18, 877.12 examples/s]Map:  45%|████▍     | 97177/216925 [01:58<02:42, 737.11 examples/s]Map:  45%|████▍     | 96571/216925 [01:59<02:22, 844.72 examples/s]Map:  43%|████▎     | 92903/216925 [01:59<02:21, 875.53 examples/s]Map:  44%|████▍     | 95633/216925 [01:58<02:15, 897.02 examples/s]Map:  45%|████▍     | 97269/216925 [01:58<02:33, 777.55 examples/s]Map:  45%|████▍     | 96661/216925 [01:59<02:20, 857.39 examples/s]Map:  43%|████▎     | 92995/216925 [01:59<02:20, 884.84 examples/s]Map:  44%|████▍     | 95769/216925 [01:58<02:15, 895.92 examples/s]Map:  45%|████▍     | 97363/216925 [01:58<02:26, 816.19 examples/s]Map:  45%|████▍     | 96750/216925 [01:59<02:19, 862.45 examples/s]Map:  44%|████▍     | 95861/216925 [01:58<02:14, 900.29 examples/s]Map:  45%|████▍     | 97454/216925 [01:58<02:22, 838.41 examples/s]Map:  45%|████▍     | 96841/216925 [01:59<02:17, 873.98 examples/s]Map:  43%|████▎     | 93129/216925 [01:59<02:52, 715.69 examples/s]Map:  44%|████▍     | 95952/216925 [01:58<02:14, 900.21 examples/s]Map:  45%|████▍     | 97544/216925 [01:58<02:20, 849.67 examples/s]Map:  45%|████▍     | 96930/216925 [01:59<02:16, 876.02 examples/s]Map:  43%|████▎     | 93224/216925 [02:00<02:41, 765.42 examples/s]Map:  45%|████▌     | 97675/216925 [01:58<02:19, 856.36 examples/s]Map:  43%|████▎     | 93314/216925 [02:00<02:35, 795.08 examples/s]Map:  44%|████▍     | 96043/216925 [01:58<02:49, 711.23 examples/s]Map:  45%|████▍     | 97044/216925 [02:00<02:51, 696.99 examples/s]Map:  45%|████▌     | 97766/216925 [01:58<02:17, 866.13 examples/s]Map:  44%|████▍     | 96132/216925 [01:58<02:40, 751.49 examples/s]Map:  43%|████▎     | 93447/216925 [02:00<02:30, 822.34 examples/s]Map:  45%|████▍     | 97134/216925 [02:00<02:41, 743.23 examples/s]Map:  45%|████▌     | 97857/216925 [01:58<02:16, 875.47 examples/s]Map:  44%|████▍     | 96219/216925 [01:59<02:35, 778.35 examples/s]Map:  43%|████▎     | 93542/216925 [02:00<02:24, 852.09 examples/s]Map:  45%|████▍     | 97223/216925 [02:00<02:33, 777.32 examples/s]Map:  45%|████▌     | 97951/216925 [01:59<02:13, 890.49 examples/s]Map:  44%|████▍     | 96310/216925 [01:59<02:28, 811.43 examples/s]Map:  45%|████▍     | 97314/216925 [02:00<02:27, 811.18 examples/s]Map:  43%|████▎     | 93675/216925 [02:00<02:23, 859.53 examples/s]Map:  44%|████▍     | 96397/216925 [01:59<02:25, 825.71 examples/s]Map:  45%|████���     | 97403/216925 [02:00<02:24, 829.88 examples/s]Map:  45%|████▌     | 98044/216925 [01:59<02:50, 698.73 examples/s]Map:  43%|████▎     | 93770/216925 [02:00<02:20, 876.50 examples/s]Map:  44%|████▍     | 96489/216925 [01:59<02:22, 846.82 examples/s]Map:  45%|████▍     | 97493/216925 [02:00<02:20, 847.99 examples/s]Map:  45%|████▌     | 98135/216925 [01:59<02:38, 747.88 examples/s]Map:  43%|████▎     | 93864/216925 [02:00<02:18, 890.08 examples/s]Map:  45%|████▍     | 96579/216925 [01:59<02:19, 859.64 examples/s]Map:  45%|████▌     | 98229/216925 [01:59<02:29, 792.19 examples/s]Map:  45%|████▌     | 97624/216925 [02:00<02:19, 855.79 examples/s]Map:  45%|████▍     | 96675/216925 [01:59<02:15, 886.53 examples/s]Map:  43%|████▎     | 93999/216925 [02:00<02:18, 890.22 examples/s]Map:  45%|████▌     | 98319/216925 [01:59<02:24, 818.90 examples/s]Map:  45%|████▌     | 97714/216925 [02:00<02:17, 865.17 examples/s]Map:  45%|████▍     | 96808/216925 [01:59<02:16, 882.69 examples/s]Map:  45%|████▌     | 98411/216925 [01:59<02:20, 843.24 examples/s]Map:  45%|████▌     | 97804/216925 [02:00<02:17, 868.80 examples/s]Map:  45%|████▍     | 96899/216925 [01:59<02:15, 887.09 examples/s]Map:  45%|████▌     | 98505/216925 [01:59<02:16, 869.45 examples/s]Map:  43%|████▎     | 94131/216925 [02:01<02:47, 732.01 examples/s]Map:  45%|████▌     | 97893/216925 [02:01<02:16, 872.50 examples/s]Map:  45%|████▍     | 96990/216925 [01:59<02:14, 890.58 examples/s]Map:  45%|████▌     | 98595/216925 [01:59<02:15, 874.98 examples/s]Map:  43%|████▎     | 94222/216925 [02:01<02:39, 767.89 examples/s]Map:  45%|████▌     | 97985/216925 [02:01<02:14, 883.50 examples/s]Map:  45%|████▌     | 98687/216925 [02:00<02:13, 884.82 examples/s]Map:  43%|████▎     | 94312/216925 [02:01<02:33, 796.34 examples/s]Map:  45%|████▍     | 97090/216925 [02:00<02:50, 704.16 examples/s]Map:  44%|████▎     | 94405/216925 [02:01<02:28, 827.00 examples/s]Map:  45%|████▌     | 98085/216925 [02:01<02:52, 689.25 examples/s]Map:  46%|████▌     | 98821/216925 [02:00<02:13, 882.67 examples/s]Map:  45%|████▍     | 97179/216925 [02:00<02:40, 746.69 examples/s]Map:  44%|████▎     | 94496/216925 [02:01<02:24, 846.47 examples/s]Map:  45%|████▌     | 98177/216925 [02:01<02:40, 741.42 examples/s]Map:  46%|████▌     | 98912/216925 [02:00<02:12, 888.61 examples/s]Map:  45%|████▍     | 97273/216925 [02:00<02:30, 793.13 examples/s]Map:  44%|████▎     | 94584/216925 [02:01<02:23, 854.63 examples/s]Map:  45%|████▌     | 98266/216925 [02:01<02:32, 776.56 examples/s]Map:  45%|████▍     | 97365/216925 [02:00<02:25, 823.48 examples/s]Map:  44%|████▎     | 94673/216925 [02:01<02:21, 862.75 examples/s]Map:  45%|████▌     | 98351/216925 [02:01<02:29, 794.70 examples/s]Map:  45%|████▍     | 97456/216925 [02:00<02:21, 842.71 examples/s]Map:  46%|████▌     | 99041/216925 [02:00<02:46, 708.50 examples/s]Map:  44%|████▎     | 94764/216925 [02:01<02:19, 873.18 examples/s]Map:  45%|████▌     | 98439/216925 [02:01<02:25, 814.31 examples/s]Map:  45%|████▍     | 97545/216925 [02:00<02:20, 852.53 examples/s]Map:  46%|████▌     | 99132/216925 [02:00<02:36, 751.19 examples/s]Map:  45%|████▌     | 98526/216925 [02:01<02:23, 824.87 examples/s]Map:  44%|████▎     | 94895/216925 [02:02<02:20, 868.98 examples/s]Map:  46%|████▌     | 99214/216925 [02:00<02:33, 766.04 examples/s]Map:  45%|████▌     | 97676/216925 [02:00<02:19, 854.46 examples/s]Map:  45%|████▌     | 98647/216925 [02:02<02:25, 814.38 examples/s]Map:  46%|████▌     | 99306/216925 [02:00<02:26, 802.74 examples/s]Map:  45%|████▌     | 97770/216925 [02:00<02:16, 873.95 examples/s]Map:  44%|████▍     | 95000/216925 [02:02<02:53, 703.43 examples/s]Map:  46%|████▌     | 98735/216925 [02:02<02:22, 829.73 examples/s]Map:  45%|████▌     | 97861/216925 [02:00<02:15, 881.82 examples/s]Map:  46%|████▌     | 99434/216925 [02:00<02:23, 816.19 examples/s]Map:  44%|████▍     | 95088/216925 [02:02<02:44, 741.96 examples/s]Map:  46%|████▌     | 98822/216925 [02:02<02:20, 839.99 examples/s]Map:  45%|████▌     | 97951/216925 [02:01<02:14, 885.07 examples/s]Map:  46%|████▌     | 99525/216925 [02:01<02:20, 836.14 examples/s]Map:  44%|████▍     | 95179/216925 [02:02<02:36, 780.27 examples/s]Map:  46%|████▌     | 98948/216925 [02:02<02:21, 836.17 examples/s]Map:  44%|████▍     | 95270/216925 [02:02<02:30, 810.17 examples/s]Map:  46%|████▌     | 99651/216925 [02:01<02:20, 832.01 examples/s]Map:  44%|████▍     | 95363/216925 [02:02<02:24, 839.58 examples/s]Map:  45%|████▌     | 98080/216925 [02:01<02:53, 684.54 examples/s]Map:  46%|████▌     | 99776/216925 [02:01<02:21, 829.79 examples/s]Map:  46%|████▌     | 99043/216925 [02:02<02:58, 661.04 examples/s]Map:  44%|████▍     | 95454/216925 [02:02<02:21, 856.34 examples/s]Map:  45%|████▌     | 98176/216925 [02:01<02:39, 742.88 examples/s]Map:  46%|████▌     | 99867/216925 [02:01<02:18, 847.68 examples/s]Map:  46%|████▌     | 99127/216925 [02:02<02:48, 698.77 examples/s]Map:  44%|████▍     | 95544/216925 [02:02<02:19, 868.04 examples/s]Map:  45%|████▌     | 98266/216925 [02:01<02:32, 777.06 examples/s]Map:  46%|████▌     | 99210/216925 [02:02<02:41, 728.23 examples/s]Map:  44%|████▍     | 95637/216925 [02:02<02:17, 882.52 examples/s]Map:  46%|████▌     | 99997/216925 [02:01<02:17, 847.63 examples/s]Map:  45%|████▌     | 98354/216925 [02:01<02:27, 801.95 examples/s]Map:  46%|████▌     | 99293/216925 [02:02<02:36, 752.50 examples/s]Map:  44%|████▍     | 95729/216925 [02:03<02:15, 891.20 examples/s]Map:  45%|████▌     | 98441/216925 [02:01<02:25, 815.60 examples/s]Map:  46%|████▌     | 99377/216925 [02:02<02:31, 773.57 examples/s]Map:  44%|████▍     | 95823/216925 [02:03<02:14, 902.58 examples/s]Map:  46%|████▌     | 100087/216925 [02:01<02:50, 684.51 examples/s]Map:  45%|████▌     | 98531/216925 [02:01<02:21, 835.29 examples/s]Map:  46%|████▌     | 99468/216925 [02:03<02:25, 808.19 examples/s]Map:  44%|████▍     | 95916/216925 [02:03<02:13, 905.45 examples/s]Map:  46%|████▌     | 100175/216925 [02:01<02:40, 725.43 examples/s]Map:  45%|████▌     | 98622/216925 [02:01<02:18, 854.95 examples/s]Map:  46%|████▌     | 99553/216925 [02:03<02:23, 816.48 examples/s]Map:  46%|████▌     | 100264/216925 [02:02<02:32, 763.11 examples/s]Map:  46%|████▌     | 98716/216925 [02:02<02:15, 874.52 examples/s]Map:  46%|████▌     | 99637/216925 [02:03<02:22, 820.26 examples/s]Map:  46%|████▋     | 100353/216925 [02:02<02:26, 794.33 examples/s]Map:  46%|████▌     | 98808/216925 [02:02<02:13, 886.02 examples/s]Map:  44%|████▍     | 96044/216925 [02:03<02:44, 733.15 examples/s]Map:  46%|████▋     | 100439/216925 [02:02<02:23, 810.47 examples/s]Map:  46%|████▌     | 99763/216925 [02:03<02:22, 823.16 examples/s]Map:  44%|████▍     | 96138/216925 [02:03<02:34, 779.54 examples/s]Map:  46%|████▌     | 98940/216925 [02:02<02:14, 879.77 examples/s]Map:  46%|████▋     | 100530/216925 [02:02<02:19, 835.75 examples/s]Map:  44%|████▍     | 96229/216925 [02:03<02:28, 810.16 examples/s]Map:  46%|████▌     | 99883/216925 [02:03<02:24, 810.87 examples/s]Map:  44%|████▍     | 96320/216925 [02:03<02:24, 834.58 examples/s]Map:  46%|████▋     | 100653/216925 [02:02<02:20, 826.58 examples/s]Map:  46%|████▌     | 99965/216925 [02:03<02:24, 810.29 examples/s]Map:  46%|████▌     | 99042/216925 [02:02<02:50, 691.22 examples/s]Map:  44%|████▍     | 96409/216925 [02:03<02:22, 847.48 examples/s]Map:  46%|████▋     | 100743/216925 [02:02<02:18, 841.05 examples/s]Map:  46%|████▌     | 99127/216925 [02:02<02:42, 725.02 examples/s]Map:  44%|████▍     | 96503/216925 [02:03<02:18, 870.96 examples/s]Map:  46%|████▋     | 100831/216925 [02:02<02:16, 849.42 examples/s]Map:  46%|████▌     | 99217/216925 [02:02<02:33, 764.73 examples/s]Map:  46%|████▌     | 100087/216925 [02:03<02:55, 663.96 examples/s]Map:  45%|████▍     | 96596/216925 [02:04<02:15, 885.47 examples/s]Map:  47%|████▋     | 100918/216925 [02:02<02:16, 849.93 examples/s]Map:  46%|████▌     | 99304/216925 [02:02<02:29, 787.68 examples/s]Map:  46%|████▌     | 100172/216925 [02:04<02:46, 702.57 examples/s]Map:  45%|████▍     | 96687/216925 [02:04<02:15, 886.99 examples/s]Map:  46%|████▌     | 99396/216925 [02:02<02:23, 821.54 examples/s]Map:  46%|████▌     | 100257/216925 [02:04<02:38, 736.04 examples/s]Map:  45%|████▍     | 96778/216925 [02:04<02:14, 891.54 examples/s]Map:  46%|████▌     | 99485/216925 [02:03<02:20, 838.20 examples/s]Map:  47%|████▋     | 101043/216925 [02:03<02:49, 684.90 examples/s]Map:  46%|████▋     | 100343/216925 [02:04<02:32, 762.85 examples/s]Map:  45%|████▍     | 96906/216925 [02:04<02:18, 868.55 examples/s]Map:  46%|████▌     | 99572/216925 [02:03<02:19, 841.92 examples/s]Map:  47%|████▋     | 101131/216925 [02:03<02:39, 725.61 examples/s]Map:  46%|████▋     | 100432/216925 [02:04<02:27, 792.19 examples/s]Map:  45%|████▍     | 96994/216925 [02:04<02:18, 868.64 examples/s]Map:  46%|████▌     | 99663/216925 [02:03<02:16, 859.19 examples/s]Map:  47%|████▋     | 101220/216925 [02:03<02:31, 763.32 examples/s]Map:  46%|████▋     | 100517/216925 [02:04<02:24, 803.98 examples/s]Map:  46%|████▌     | 99753/216925 [02:03<02:14, 868.48 examples/s]Map:  47%|████▋     | 101305/216925 [02:03<02:27, 781.74 examples/s]Map:  46%|████▋     | 100604/216925 [02:04<02:21, 820.72 examples/s]Map:  45%|████▍     | 97085/216925 [02:04<02:55, 684.10 examples/s]Map:  46%|████▌     | 99846/216925 [02:03<02:12, 884.98 examples/s]Map:  47%|████▋     | 101391/216925 [02:03<02:24, 800.70 examples/s]Map:  46%|████▋     | 100693/216925 [02:04<02:18, 839.32 examples/s]Map:  45%|████▍     | 97168/216925 [02:04<02:47, 716.14 examples/s]Map:  46%|████▌     | 99963/216925 [02:03<02:19, 840.25 examples/s]Map:  47%|████▋     | 101512/216925 [02:03<02:24, 798.94 examples/s]Map:  46%|████▋     | 100811/216925 [02:04<02:22, 815.01 examples/s]Map:  45%|████▍     | 97282/216925 [02:04<02:45, 724.79 examples/s]Map:  47%|████▋     | 101597/216925 [02:03<02:22, 809.31 examples/s]Map:  47%|████▋     | 100895/216925 [02:04<02:21, 819.62 examples/s]Map:  45%|████▍     | 97362/216925 [02:05<02:41, 740.81 examples/s]Map:  47%|████▋     | 101685/216925 [02:03<02:19, 827.38 examples/s]Map:  47%|████▋     | 100980/216925 [02:04<02:20, 824.41 examples/s]Map:  46%|████▌     | 100088/216925 [02:03<02:49, 688.75 examples/s]Map:  45%|████▍     | 97446/216925 [02:05<02:36, 764.89 examples/s]Map:  46%|████▌     | 100177/216925 [02:03<02:39, 729.90 examples/s]Map:  47%|████▋     | 101814/216925 [02:03<02:17, 835.45 examples/s]Map:  45%|████▍     | 97530/216925 [02:05<02:32, 781.60 examples/s]Map:  46%|████▌     | 100262/216925 [02:04<02:34, 754.20 examples/s]Map:  47%|████▋     | 101085/216925 [02:05<02:56, 656.75 examples/s]Map:  47%|████▋     | 101901/216925 [02:04<02:16, 841.10 examples/s]Map:  45%|████▌     | 97652/216925 [02:05<02:31, 789.81 examples/s]Map:  46%|████▋     | 100350/216925 [02:04<02:28, 783.47 examples/s]Map:  47%|████▋     | 101172/216925 [02:05<02:44, 705.11 examples/s]Map:  47%|████▋     | 101993/216925 [02:04<02:14, 857.04 examples/s]Map:  45%|████▌     | 97734/216925 [02:05<02:29, 796.18 examples/s]Map:  46%|████▋     | 100437/216925 [02:04<02:24, 804.62 examples/s]Map:  47%|████▋     | 101256/216925 [02:05<02:37, 734.76 examples/s]Map:  46%|████▋     | 100524/216925 [02:04<02:21, 820.02 examples/s]Map:  47%|████▋     | 101345/216925 [02:05<02:29, 773.93 examples/s]Map:  47%|████▋     | 102091/216925 [02:04<02:48, 681.23 examples/s]Map:  45%|████▌     | 97855/216925 [02:05<02:29, 797.67 examples/s]Map:  46%|████▋     | 100613/216925 [02:04<02:19, 835.15 examples/s]Map:  47%|████▋     | 101434/216925 [02:05<02:23, 802.55 examples/s]Map:  47%|████▋     | 102184/216925 [02:04<02:35, 737.08 examples/s]Map:  45%|████▌     | 97943/216925 [02:05<02:25, 816.37 examples/s]Map:  46%|████▋     | 100702/216925 [02:04<02:16, 849.80 examples/s]Map:  47%|████▋     | 101520/216925 [02:05<02:21, 815.05 examples/s]Map:  47%|████▋     | 102273/216925 [02:04<02:28, 773.08 examples/s]Map:  46%|████▋     | 100791/216925 [02:04<02:15, 858.75 examples/s]Map:  47%|████▋     | 101606/216925 [02:05<02:19, 826.11 examples/s]Map:  47%|████▋     | 102360/216925 [02:04<02:24, 795.10 examples/s]Map:  45%|████▌     | 98037/216925 [02:06<03:04, 643.39 examples/s]Map:  47%|████▋     | 100909/216925 [02:04<02:20, 828.44 examples/s]Map:  47%|████▋     | 101720/216925 [02:05<02:24, 797.20 examples/s]Map:  45%|████▌     | 98117/216925 [02:06<02:55, 677.24 examples/s]Map:  47%|████▋     | 102486/216925 [02:04<02:21, 807.30 examples/s]Map:  47%|████▋     | 100994/216925 [02:04<02:19, 830.30 examples/s]Map:  47%|████▋     | 101809/216925 [02:06<02:20, 818.24 examples/s]Map:  45%|████▌     | 98200/216925 [02:06<02:46, 712.06 examples/s]Map:  47%|████▋     | 102572/216925 [02:04<02:19, 817.95 examples/s]Map:  47%|████▋     | 101895/216925 [02:06<02:19, 826.11 examples/s]Map:  45%|████▌     | 98284/216925 [02:06<02:39, 742.47 examples/s]Map:  47%|████▋     | 102662/216925 [02:05<02:16, 835.16 examples/s]Map:  47%|████▋     | 101086/216925 [02:05<02:54, 662.68 examples/s]Map:  47%|████▋     | 101980/216925 [02:06<02:18, 831.24 examples/s]Map:  45%|████▌     | 98367/216925 [02:06<02:35, 763.37 examples/s]Map:  47%|████▋     | 102751/216925 [02:05<02:14, 847.07 examples/s]Map:  47%|████▋     | 101176/216925 [02:05<02:41, 716.27 examples/s]Map:  45%|████▌     | 98453/216925 [02:06<02:30, 788.58 examples/s]Map:  47%|████▋     | 102838/216925 [02:05<02:14, 848.72 examples/s]Map:  47%|████▋     | 101262/216925 [02:05<02:34, 751.00 examples/s]Map:  45%|████▌     | 98536/216925 [02:06<02:28, 795.20 examples/s]Map:  47%|████▋     | 102091/216925 [02:06<02:50, 673.34 examples/s]Map:  47%|████▋     | 102969/216925 [02:05<02:13, 855.72 examples/s]Map:  47%|████▋     | 101348/216925 [02:05<02:28, 776.60 examples/s]Map:  45%|████▌     | 98624/216925 [02:06<02:25, 815.51 examples/s]Map:  47%|████▋     | 102177/216925 [02:06<02:40, 715.68 examples/s]Map:  47%|████▋     | 101436/216925 [02:05<02:23, 803.94 examples/s]Map:  46%|████▌     | 98707/216925 [02:06<02:24, 817.98 examples/s]Map:  47%|████▋     | 102262/216925 [02:06<02:34, 742.85 examples/s]Map:  47%|████▋     | 101523/216925 [02:05<02:20, 819.59 examples/s]Map:  46%|████▌     | 98796/216925 [02:06<02:21, 835.32 examples/s]Map:  48%|████▊     | 103088/216925 [02:05<02:44, 692.86 examples/s]Map:  47%|████▋     | 102346/216925 [02:06<02:29, 765.14 examples/s]Map:  47%|████▋     | 101608/216925 [02:05<02:19, 824.26 examples/s]Map:  46%|████▌     | 98885/216925 [02:07<02:18, 849.44 examples/s]Map:  48%|████▊     | 103179/216925 [02:05<02:34, 736.56 examples/s]Map:  47%|████▋     | 102432/216925 [02:06<02:25, 788.50 examples/s]Map:  47%|████▋     | 101698/216925 [02:05<02:16, 842.97 examples/s]Map:  48%|████▊     | 103268/216925 [02:05<02:27, 770.32 examples/s]Map:  47%|████▋     | 102518/216925 [02:07<02:22, 805.54 examples/s]Map:  47%|████▋     | 101817/216925 [02:05<02:20, 820.97 examples/s]Map:  46%|████▌     | 99000/216925 [02:07<02:58, 660.87 examples/s]Map:  48%|████▊     | 103387/216925 [02:05<02:26, 772.58 examples/s]Map:  47%|████▋     | 102644/216925 [02:07<02:20, 815.11 examples/s]Map:  47%|████▋     | 101907/216925 [02:06<02:17, 838.00 examples/s]Map:  46%|████▌     | 99082/216925 [02:07<02:49, 696.40 examples/s]Map:  48%|████▊     | 103476/216925 [02:06<02:21, 799.66 examples/s]Map:  47%|████▋     | 102730/216925 [02:07<02:18, 824.74 examples/s]Map:  47%|████▋     | 101995/216925 [02:06<02:15, 847.89 examples/s]Map:  46%|████▌     | 99173/216925 [02:07<02:37, 745.69 examples/s]Map:  48%|████▊     | 103569/216925 [02:06<02:16, 830.46 examples/s]Map:  47%|████▋     | 102816/216925 [02:07<02:17, 830.24 examples/s]Map:  46%|████▌     | 99261/216925 [02:07<02:31, 777.97 examples/s]Map:  48%|████▊     | 103664/216925 [02:06<02:11, 859.90 examples/s]Map:  47%|████▋     | 102903/216925 [02:07<02:16, 838.00 examples/s]Map:  46%|████▌     | 99350/216925 [02:07<02:25, 806.97 examples/s]Map:  47%|████▋     | 102089/216925 [02:06<02:50, 672.68 examples/s]Map:  48%|████▊     | 103758/216925 [02:06<02:08, 877.32 examples/s]Map:  47%|████▋     | 102991/216925 [02:07<02:14, 847.98 examples/s]Map:  47%|████▋     | 102180/216925 [02:06<02:38, 726.14 examples/s]Map:  46%|████▌     | 99442/216925 [02:07<02:20, 833.40 examples/s]Map:  48%|████▊     | 103852/216925 [02:06<02:06, 891.11 examples/s]Map:  46%|████▌     | 99532/216925 [02:07<02:18, 848.50 examples/s]Map:  47%|████▋     | 102271/216925 [02:06<02:29, 767.70 examples/s]Map:  48%|████▊     | 103949/216925 [02:06<02:04, 910.01 examples/s]Map:  48%|████▊     | 103086/216925 [02:07<02:50, 667.68 examples/s]Map:  46%|████▌     | 99620/216925 [02:07<02:16, 857.05 examples/s]Map:  47%|████▋     | 102361/216925 [02:06<02:23, 798.82 examples/s]Map:  48%|████▊     | 103175/216925 [02:07<02:38, 719.23 examples/s]Map:  46%|████▌     | 99714/216925 [02:08<02:13, 876.30 examples/s]Map:  48%|████▊     | 104046/216925 [02:06<02:38, 712.96 examples/s]Map:  48%|████▊     | 103265/216925 [02:07<02:29, 762.10 examples/s]Map:  47%|████▋     | 102489/216925 [02:06<02:20, 815.05 examples/s]Map:  46%|████▌     | 99804/216925 [02:08<02:13, 880.27 examples/s]Map:  48%|████▊     | 104141/216925 [02:06<02:27, 766.53 examples/s]Map:  48%|████▊     | 103356/216925 [02:08<02:22, 799.58 examples/s]Map:  47%|████▋     | 102578/216925 [02:06<02:17, 834.00 examples/s]Map:  48%|████▊     | 104230/216925 [02:06<02:21, 795.01 examples/s]Map:  48%|████▊     | 103440/216925 [02:08<02:20, 808.93 examples/s]Map:  46%|████▌     | 99927/216925 [02:08<02:17, 851.35 examples/s]Map:  47%|████▋     | 102708/216925 [02:07<02:15, 843.58 examples/s]Map:  48%|████▊     | 104317/216925 [02:07<02:18, 812.24 examples/s]Map:  48%|████▊     | 103531/216925 [02:08<02:16, 833.77 examples/s]Map:  47%|████▋     | 102798/216925 [02:07<02:13, 853.96 examples/s]Map:  48%|████▊     | 104412/216925 [02:07<02:12, 847.96 examples/s]Map:  48%|████▊     | 103620/216925 [02:08<02:13, 847.75 examples/s]Map:  46%|████▌     | 100044/216925 [02:08<02:47, 698.35 examples/s]Map:  47%|████▋     | 102891/216925 [02:07<02:10, 870.80 examples/s]Map:  48%|████▊     | 104504/216925 [02:07<02:10, 862.90 examples/s]Map:  48%|████▊     | 103710/216925 [02:08<02:11, 859.52 examples/s]Map:  46%|████▌     | 100136/216925 [02:08<02:36, 746.45 examples/s]Map:  47%|████▋     | 102985/216925 [02:07<02:08, 888.70 examples/s]Map:  48%|████▊     | 104599/216925 [02:07<02:06, 885.47 examples/s]Map:  48%|████▊     | 103800/216925 [02:08<02:10, 867.47 examples/s]Map:  46%|████▌     | 100229/216925 [02:08<02:28, 786.44 examples/s]Map:  48%|████▊     | 104695/216925 [02:07<02:04, 903.88 examples/s]Map:  46%|████▌     | 100318/216925 [02:08<02:23, 810.21 examples/s]Map:  48%|████▊     | 103929/216925 [02:08<02:11, 860.67 examples/s]Map:  48%|████▊     | 103085/216925 [02:07<02:41, 706.75 examples/s]Map:  48%|████▊     | 104824/216925 [02:07<02:06, 882.84 examples/s]Map:  46%|████▋     | 100403/216925 [02:08<02:22, 816.18 examples/s]Map:  48%|████▊     | 103175/216925 [02:07<02:31, 750.09 examples/s]Map:  48%|████▊     | 103262/216925 [02:07<02:25, 778.66 examples/s]Map:  48%|████▊     | 104041/216925 [02:08<02:42, 694.39 examples/s]Map:  48%|████▊     | 104959/216925 [02:07<02:06, 883.73 examples/s]Map:  46%|████▋     | 100528/216925 [02:09<02:21, 821.01 examples/s]Map:  48%|████▊     | 103355/216925 [02:07<02:19, 816.59 examples/s]Map:  48%|████▊     | 104129/216925 [02:09<02:33, 734.17 examples/s]Map:  46%|████▋     | 100652/216925 [02:09<02:22, 817.74 examples/s]Map:  48%|████▊     | 104217/216925 [02:09<02:27, 765.24 examples/s]Map:  48%|████▊     | 103482/216925 [02:08<02:17, 824.13 examples/s]Map:  48%|████▊     | 105089/216925 [02:08<02:33, 728.20 examples/s]Map:  46%|████▋     | 100739/216925 [02:09<02:20, 827.17 examples/s]Map:  48%|████▊     | 104307/216925 [02:09<02:21, 797.19 examples/s]Map:  48%|████▊     | 103573/216925 [02:08<02:14, 842.05 examples/s]Map:  48%|████▊     | 105184/216925 [02:08<02:24, 772.45 examples/s]Map:  46%|████▋     | 100824/216925 [02:09<02:19, 829.48 examples/s]Map:  48%|████▊     | 104402/216925 [02:09<02:14, 835.28 examples/s]Map:  48%|████▊     | 103664/216925 [02:08<02:11, 858.74 examples/s]Map:  49%|████▊     | 105276/216925 [02:08<02:18, 803.69 examples/s]Map:  47%|████▋     | 100909/216925 [02:09<02:19, 831.63 examples/s]Map:  48%|████▊     | 104490/216925 [02:09<02:12, 846.78 examples/s]Map:  49%|████▊     | 105362/216925 [02:08<02:17, 814.07 examples/s]Map:  47%|████▋     | 100996/216925 [02:09<02:18, 838.53 examples/s]Map:  48%|████▊     | 103794/216925 [02:08<02:11, 859.58 examples/s]Map:  48%|████▊     | 104580/216925 [02:09<02:10, 857.89 examples/s]Map:  49%|████▊     | 105456/216925 [02:08<02:11, 844.69 examples/s]Map:  48%|████▊     | 103886/216925 [02:08<02:09, 871.72 examples/s]Map:  48%|████▊     | 104670/216925 [02:09<02:09, 864.36 examples/s]Map:  49%|████▊     | 105545/216925 [02:08<02:10, 854.47 examples/s]Map:  47%|████▋     | 101085/216925 [02:09<02:54, 662.70 examples/s]Map:  48%|████▊     | 103978/216925 [02:08<02:08, 882.18 examples/s]Map:  48%|████▊     | 104762/216925 [02:09<02:08, 872.81 examples/s]Map:  49%|████▊     | 105641/216925 [02:08<02:06, 881.00 examples/s]Map:  47%|████▋     | 101169/216925 [02:09<02:44, 703.69 examples/s]Map:  48%|████▊     | 104892/216925 [02:09<02:09, 865.41 examples/s]Map:  49%|████▊     | 105733/216925 [02:08<02:04, 891.69 examples/s]Map:  47%|████▋     | 101255/216925 [02:10<02:36, 739.70 examples/s]Map:  48%|████▊     | 104089/216925 [02:08<02:39, 706.58 examples/s]Map:  48%|████▊     | 104983/216925 [02:10<02:07, 876.50 examples/s]Map:  49%|████▉     | 105824/216925 [02:08<02:04, 894.88 examples/s]Map:  47%|████▋     | 101343/216925 [02:10<02:29, 772.59 examples/s]Map:  48%|████▊     | 104175/216925 [02:08<02:32, 738.60 examples/s]Map:  49%|████▉     | 105917/216925 [02:08<02:02, 903.38 examples/s]Map:  47%|████▋     | 101426/216925 [02:10<02:26, 787.08 examples/s]Map:  48%|███���▊     | 104261/216925 [02:09<02:27, 765.56 examples/s]Map:  48%|████▊     | 105087/216925 [02:10<02:40, 698.62 examples/s]Map:  47%|████▋     | 101511/216925 [02:10<02:23, 801.61 examples/s]Map:  48%|████▊     | 104355/216925 [02:09<02:19, 808.44 examples/s]Map:  48%|████▊     | 105180/216925 [02:10<02:29, 749.56 examples/s]Map:  49%|████▉     | 106046/216925 [02:09<02:31, 732.65 examples/s]Map:  48%|████▊     | 104445/216925 [02:09<02:15, 830.82 examples/s]Map:  47%|████▋     | 101636/216925 [02:10<02:22, 809.18 examples/s]Map:  49%|████▊     | 105271/216925 [02:10<02:22, 785.48 examples/s]Map:  49%|████▉     | 106140/216925 [02:09<02:22, 777.27 examples/s]Map:  48%|████▊     | 104536/216925 [02:09<02:12, 850.58 examples/s]Map:  49%|████▊     | 105367/216925 [02:10<02:14, 827.53 examples/s]Map:  47%|████▋     | 101745/216925 [02:10<02:27, 779.71 examples/s]Map:  49%|████▉     | 106233/216925 [02:09<02:16, 812.65 examples/s]Map:  48%|████▊     | 104625/216925 [02:09<02:10, 860.84 examples/s]Map:  49%|████▊     | 105456/216925 [02:10<02:12, 842.71 examples/s]Map:  49%|████▉     | 106325/216925 [02:09<02:11, 838.70 examples/s]Map:  48%|████▊     | 104714/216925 [02:09<02:10, 861.88 examples/s]Map:  47%|████▋     | 101835/216925 [02:10<02:40, 717.65 examples/s]Map:  49%|████▊     | 105544/216925 [02:10<02:11, 849.34 examples/s]Map:  49%|████▉     | 106452/216925 [02:09<02:11, 839.54 examples/s]Map:  48%|████▊     | 104831/216925 [02:09<02:15, 827.05 examples/s]Map:  47%|████▋     | 101923/216925 [02:10<02:50, 672.82 examples/s]Map:  49%|████▊     | 105670/216925 [02:10<02:12, 841.45 examples/s]Map:  49%|████▉     | 106544/216925 [02:09<02:09, 855.57 examples/s]Map:  48%|████▊     | 104919/216925 [02:09<02:13, 840.35 examples/s]Map:  49%|████▉     | 105758/216925 [02:11<02:10, 849.61 examples/s]Map:  49%|████▉     | 106639/216925 [02:09<02:05, 878.27 examples/s]Map:  49%|████▉     | 105847/216925 [02:11<02:09, 856.74 examples/s]Map:  47%|████▋     | 102000/216925 [02:11<03:46, 508.30 examples/s]Map:  49%|████▉     | 106729/216925 [02:09<02:04, 882.12 examples/s]Map:  48%|████▊     | 105043/216925 [02:10<02:43, 684.92 examples/s]Map:  49%|████▉     | 105939/216925 [02:11<02:07, 871.35 examples/s]Map:  47%|████▋     | 102087/216925 [02:11<03:18, 578.06 examples/s]Map:  49%|████▉     | 106822/216925 [02:10<02:03, 893.23 examples/s]Map:  48%|████▊     | 105136/216925 [02:10<02:31, 737.51 examples/s]Map:  47%|████▋     | 102170/216925 [02:11<03:01, 632.35 examples/s]Map:  49%|████▉     | 106918/216925 [02:10<02:00, 909.37 examples/s]Map:  49%|████▊     | 105228/216925 [02:10<02:23, 777.89 examples/s]Map:  47%|████▋     | 102255/216925 [02:11<02:48, 680.58 examples/s]Map:  49%|████▉     | 106046/216925 [02:11<02:41, 687.37 examples/s]Map:  49%|████▊     | 105318/216925 [02:10<02:18, 806.06 examples/s]Map:  47%|████▋     | 102341/216925 [02:11<02:38, 723.39 examples/s]Map:  49%|████▉     | 106137/216925 [02:11<02:30, 737.21 examples/s]Map:  49%|████▉     | 107045/216925 [02:10<02:32, 721.53 examples/s]Map:  49%|████▊     | 105412/216925 [02:10<02:12, 839.01 examples/s]Map:  47%|████▋     | 102422/216925 [02:11<02:33, 744.59 examples/s]Map:  49%|████▉     | 106230/216925 [02:11<02:21, 781.47 examples/s]Map:  49%|████▉     | 107137/216925 [02:10<02:23, 762.92 examples/s]Map:  49%|████▊     | 105501/216925 [02:10<02:10, 850.73 examples/s]Map:  47%|████▋     | 102505/216925 [02:11<02:29, 765.43 examples/s]Map:  49%|████▉     | 106319/216925 [02:11<02:16, 807.39 examples/s]Map:  49%|████▉     | 107228/216925 [02:10<02:17, 797.21 examples/s]Map:  49%|████▊     | 105593/216925 [02:10<02:08, 868.37 examples/s]Map:  47%|████▋     | 102587/216925 [02:11<02:27, 776.67 examples/s]Map:  49%|████▉     | 106406/216925 [02:11<02:14, 822.93 examples/s]Map:  49%|████▉     | 107316/216925 [02:10<02:13, 818.17 examples/s]Map:  49%|████▊     | 105683/216925 [02:10<02:07, 874.14 examples/s]Map:  47%|████▋     | 102673/216925 [02:12<02:23, 795.83 examples/s]Map:  49%|████▉     | 106494/216925 [02:11<02:11, 836.69 examples/s]Map:  50%|████▉     | 107405/216925 [02:10<02:11, 833.60 examples/s]Map:  47%|████▋     | 102755/216925 [02:12<02:22, 798.54 examples/s]Map:  49%|████▉     | 106582/216925 [02:12<02:10, 846.05 examples/s]Map:  49%|████▉     | 105812/216925 [02:10<02:08, 864.99 examples/s]Map:  50%|████▉     | 107496/216925 [02:10<02:08, 853.07 examples/s]Map:  47%|████▋     | 102840/216925 [02:12<02:20, 809.25 examples/s]Map:  49%|████▉     | 106672/216925 [02:12<02:08, 857.68 examples/s]Map:  49%|████▉     | 105902/216925 [02:10<02:07, 873.49 examples/s]Map:  50%|████▉     | 107585/216925 [02:10<02:06, 861.66 examples/s]Map:  47%|████▋     | 102927/216925 [02:12<02:18, 820.36 examples/s]Map:  49%|████▉     | 106759/216925 [02:12<02:08, 858.30 examples/s]Map:  49%|████▉     | 105991/216925 [02:11<02:06, 874.88 examples/s]Map:  50%|████▉     | 107673/216925 [02:11<02:06, 864.60 examples/s]Map:  49%|████▉     | 106849/216925 [02:12<02:07, 865.77 examples/s]Map:  50%|████▉     | 107764/216925 [02:11<02:04, 874.16 examples/s]Map:  49%|████▉     | 106081/216925 [02:11<02:42, 680.98 examples/s]Map:  47%|████▋     | 103036/216925 [02:12<02:56, 643.47 examples/s]Map:  49%|████▉     | 106969/216925 [02:12<02:11, 836.72 examples/s]Map:  50%|████▉     | 107887/216925 [02:11<02:08, 847.96 examples/s]Map:  49%|████▉     | 106160/216925 [02:11<02:36, 706.36 examples/s]Map:  48%|████▊     | 103117/216925 [02:12<02:47, 680.60 examples/s]Map:  50%|████▉     | 107977/216925 [02:11<02:07, 856.38 examples/s]Map:  49%|████▉     | 106246/216925 [02:11<02:28, 744.93 examples/s]Map:  48%|████▊     | 103204/216925 [02:12<02:37, 722.15 examples/s]Map:  49%|████▉     | 107086/216925 [02:12<02:41, 678.42 examples/s]Map:  49%|████▉     | 106334/216925 [02:11<02:21, 779.68 examples/s]Map:  48%|████▊     | 103284/216925 [02:12<02:33, 741.29 examples/s]Map:  49%|████▉     | 107177/216925 [02:12<02:30, 728.07 examples/s]Map:  50%|████▉     | 108086/216925 [02:11<02:38, 686.97 examples/s]Map:  49%|████▉     | 106423/216925 [02:11<02:16, 807.50 examples/s]Map:  48%|████▊     | 103370/216925 [02:13<02:27, 767.50 examples/s]Map:  49%|████▉     | 107263/216925 [02:12<02:24, 758.97 examples/s]Map:  50%|████▉     | 108174/216925 [02:11<02:29, 728.97 examples/s]Map:  49%|████▉     | 106513/216925 [02:11<02:12, 830.70 examples/s]Map:  48%|████▊     | 103456/216925 [02:13<02:23, 792.52 examples/s]Map:  49%|████▉     | 107353/216925 [02:13<02:18, 790.72 examples/s]Map:  50%|████▉     | 108263/216925 [02:11<02:21, 766.87 examples/s]Map:  49%|████▉     | 106603/216925 [02:11<02:10, 847.57 examples/s]Map:  48%|████▊     | 103541/216925 [02:13<02:20, 804.76 examples/s]Map:  50%|████▉     | 107444/216925 [02:13<02:13, 818.69 examples/s]Map:  50%|████▉     | 108350/216925 [02:11<02:17, 791.73 examples/s]Map:  49%|████▉     | 106691/216925 [02:11<02:08, 855.03 examples/s]Map:  48%|████▊     | 103629/216925 [02:13<02:17, 824.45 examples/s]Map:  50%|████▉     | 107540/216925 [02:13<02:08, 854.20 examples/s]Map:  50%|████▉     | 108442/216925 [02:12<02:11, 822.41 examples/s]Map:  49%|████▉     | 106781/216925 [02:12<02:07, 862.07 examples/s]Map:  48%|████▊     | 103717/216925 [02:13<02:15, 836.38 examples/s]Map:  50%|████▉     | 107632/216925 [02:13<02:05, 870.81 examples/s]Map:  50%|█████     | 108536/216925 [02:12<02:07, 852.91 examples/s]Map:  49%|████▉     | 106872/216925 [02:12<02:06, 872.50 examples/s]Map:  48%|████▊     | 103804/216925 [02:13<02:14, 843.15 examples/s]Map:  50%|████▉     | 107724/216925 [02:13<02:03, 881.46 examples/s]Map:  50%|█████     | 108626/216925 [02:12<02:05, 864.56 examples/s]Map:  49%|████▉     | 106961/216925 [02:12<02:05, 873.67 examples/s]Map:  48%|████▊     | 103929/216925 [02:13<02:15, 834.99 examples/s]Map:  50%|████▉     | 107820/216925 [02:13<02:01, 899.95 examples/s]Map:  50%|█████     | 108721/216925 [02:12<02:01, 887.18 examples/s]Map:  50%|████▉     | 107913/216925 [02:13<02:00, 904.66 examples/s]Map:  50%|█████     | 108816/216925 [02:12<01:59, 902.23 examples/s]Map:  49%|████▉     | 107094/216925 [02:12<02:34, 710.12 examples/s]Map:  48%|████▊     | 104044/216925 [02:13<02:43, 688.30 examples/s]Map:  50%|█████     | 108909/216925 [02:12<01:59, 907.28 examples/s]Map:  49%|████▉     | 107186/216925 [02:12<02:24, 757.48 examples/s]Map:  48%|████▊     | 104129/216925 [02:13<02:36, 721.96 examples/s]Map:  50%|████▉     | 108045/216925 [02:13<02:31, 720.15 examples/s]Map:  49%|████▉     | 107276/216925 [02:12<02:18, 790.72 examples/s]Map:  48%|████▊     | 104216/216925 [02:14<02:28, 756.45 examples/s]Map:  50%|████▉     | 108139/216925 [02:13<02:21, 768.23 examples/s]Map:  49%|████▉     | 107367/216925 [02:12<02:13, 818.05 examples/s]Map:  50%|█████     | 109041/216925 [02:12<02:32, 707.57 examples/s]Map:  48%|████▊     | 104306/216925 [02:14<02:22, 790.67 examples/s]Map:  50%|████▉     | 108232/216925 [02:14<02:15, 804.32 examples/s]Map:  50%|████▉     | 107455/216925 [02:12<02:11, 830.20 examples/s]Map:  50%|█████     | 109135/216925 [02:12<02:22, 756.55 examples/s]Map:  48%|████▊     | 104397/216925 [02:14<02:16, 821.38 examples/s]Map:  50%|████▉     | 108321/216925 [02:14<02:11, 823.64 examples/s]Map:  50%|████▉     | 107542/216925 [02:13<02:10, 839.64 examples/s]Map:  50%|█████     | 109224/216925 [02:13<02:16, 788.33 examples/s]Map:  48%|████▊     | 104485/216925 [02:14<02:14, 832.92 examples/s]Map:  50%|████▉     | 108416/216925 [02:14<02:07, 853.82 examples/s]Map:  50%|████▉     | 107630/216925 [02:13<02:08, 848.74 examples/s]Map:  50%|█████     | 109315/216925 [02:13<02:11, 816.91 examples/s]Map:  50%|█████     | 108505/216925 [02:14<02:05, 861.18 examples/s]Map:  48%|████▊     | 104614/216925 [02:14<02:14, 837.37 examples/s]Map:  50%|█████     | 109408/216925 [02:13<02:07, 845.69 examples/s]Map:  50%|████▉     | 107762/216925 [02:13<02:07, 857.36 examples/s]Map:  50%|█████     | 108597/216925 [02:14<02:04, 873.59 examples/s]Map:  48%|████▊     | 104706/216925 [02:14<02:11, 855.41 examples/s]Map:  50%|█████     | 109503/216925 [02:13<02:02, 874.12 examples/s]Map:  50%|████▉     | 107853/216925 [02:13<02:05, 868.73 examples/s]Map:  50%|█████     | 108691/216925 [02:14<02:01, 890.26 examples/s]Map:  48%|████▊     | 104837/216925 [02:14<02:10, 857.96 examples/s]Map:  50%|████▉     | 107943/216925 [02:13<02:04, 874.16 examples/s]Map:  51%|█████     | 109635/216925 [02:13<02:02, 872.40 examples/s]Map:  50%|█████     | 108784/216925 [02:14<02:00, 898.41 examples/s]Map:  48%|████▊     | 104925/216925 [02:14<02:10, 859.59 examples/s]Map:  51%|█████     | 109725/216925 [02:13<02:02, 877.24 examples/s]Map:  50%|█████     | 108875/216925 [02:14<02:00, 897.30 examples/s]Map:  51%|█████     | 109815/216925 [02:13<02:01, 881.75 examples/s]Map:  50%|████▉     | 108043/216925 [02:13<02:34, 704.51 examples/s]Map:  51%|█████     | 109911/216925 [02:13<01:58, 901.74 examples/s]Map:  50%|████▉     | 108134/216925 [02:13<02:25, 750.00 examples/s]Map:  48%|████▊     | 105044/216925 [02:15<02:43, 684.78 examples/s]Map:  50%|█████     | 109000/216925 [02:15<02:29, 719.78 examples/s]Map:  50%|████▉     | 108220/216925 [02:13<02:19, 776.65 examples/s]Map:  48%|████▊     | 105127/216925 [02:15<02:36, 714.47 examples/s]Map:  50%|█████     | 109090/216925 [02:15<02:22, 758.31 examples/s]Map:  50%|████▉     | 108307/216925 [02:13<02:15, 799.52 examples/s]Map:  49%|████▊     | 105210/216925 [02:15<02:31, 739.80 examples/s]Map:  51%|█████     | 110044/216925 [02:14<02:30, 712.13 examples/s]Map:  50%|█████     | 109186/216925 [02:15<02:13, 805.17 examples/s]Map:  49%|████▊     | 105304/216925 [02:15<02:21, 787.93 examples/s]Map:  51%|█████     | 110138/216925 [02:14<02:20, 760.62 examples/s]Map:  50%|████▉     | 108431/216925 [02:14<02:14, 807.36 examples/s]Map:  50%|█████     | 109279/216925 [02:15<02:08, 836.89 examples/s]Map:  49%|████▊     | 105393/216925 [02:15<02:17, 811.35 examples/s]Map:  51%|█████     | 110229/216925 [02:14<02:14, 794.57 examples/s]Map:  50%|█████     | 108524/216925 [02:14<02:09, 835.77 examples/s]Map:  50%|█████     | 109374/216925 [02:15<02:04, 864.19 examples/s]Map:  49%|████▊     | 105484/216925 [02:15<02:13, 835.67 examples/s]Map:  51%|█████     | 110318/216925 [02:14<02:10, 816.67 examples/s]Map:  50%|█████     | 108614/216925 [02:14<02:07, 850.75 examples/s]Map:  50%|█████     | 109466/216925 [02:15<02:02, 877.10 examples/s]Map:  49%|████▊     | 105577/216925 [02:15<02:09, 857.25 examples/s]Map:  51%|█████     | 110409/216925 [02:14<02:06, 840.21 examples/s]Map:  50%|█████     | 108706/216925 [02:14<02:04, 867.74 examples/s]Map:  51%|█████     | 109598/216925 [02:15<02:02, 874.47 examples/s]Map:  51%|█████     | 110501/216925 [02:14<02:03, 861.11 examples/s]Map:  50%|█████     | 108797/216925 [02:14<02:03, 877.17 examples/s]Map:  49%|████▊     | 105707/216925 [02:15<02:09, 855.83 examples/s]Map:  51%|█████     | 110591/216925 [02:14<02:02, 868.46 examples/s]Map:  50%|█████     | 108891/216925 [02:14<02:01, 889.84 examples/s]Map:  51%|█████     | 109731/216925 [02:15<02:02, 875.18 examples/s]Map:  49%|████▉     | 105832/216925 [02:16<02:11, 843.91 examples/s]Map:  51%|█████     | 110683/216925 [02:14<02:00, 878.91 examples/s]Map:  50%|█████     | 108985/216925 [02:14<02:00, 898.74 examples/s]Map:  51%|█████     | 109822/216925 [02:15<02:01, 882.61 examples/s]Map:  49%|████▉     | 105918/216925 [02:16<02:11, 847.05 examples/s]Map:  51%|█████     | 110773/216925 [02:14<02:00, 881.26 examples/s]Map:  51%|█████     | 109914/216925 [02:16<02:00, 891.63 examples/s]Map:  51%|█████     | 110864/216925 [02:14<01:59, 885.03 examples/s]Map:  50%|█████     | 109089/216925 [02:14<02:34, 699.56 examples/s]Map:  51%|█████     | 110956/216925 [02:15<01:59, 890.12 examples/s]Map:  50%|█████     | 109182/216925 [02:15<02:23, 752.22 examples/s]Map:  51%|█████     | 110042/216925 [02:16<02:27, 726.78 examples/s]Map:  49%|████▉     | 106031/216925 [02:16<02:58, 622.63 examples/s]Map:  50%|█████     | 109269/216925 [02:15<02:18, 777.72 examples/s]Map:  51%|█████     | 110126/216925 [02:16<02:22, 750.96 examples/s]Map:  51%|█████     | 111048/216925 [02:15<02:34, 686.10 examples/s]Map:  50%|█████     | 109357/216925 [02:15<02:14, 801.94 examples/s]Map:  49%|████▉     | 106124/216925 [02:16<02:58, 619.15 examples/s]Map:  51%|█████     | 110216/216925 [02:16<02:15, 786.38 examples/s]Map:  51%|█████     | 111141/216925 [02:15<02:22, 742.35 examples/s]Map:  50%|█████     | 109445/216925 [02:15<02:10, 821.44 examples/s]Map:  49%|████▉     | 106198/216925 [02:16<02:52, 642.43 examples/s]Map:  51%|█████     | 110304/216925 [02:16<02:12, 807.15 examples/s]Map:  51%|█████▏    | 111233/216925 [02:15<02:14, 783.63 examples/s]Map:  50%|█████     | 109531/216925 [02:15<02:09, 828.41 examples/s]Map:  49%|████▉     | 106268/216925 [02:16<02:49, 653.79 examples/s]Map:  51%|█████     | 110393/216925 [02:16<02:08, 829.00 examples/s]Map:  51%|█████▏    | 111323/216925 [02:15<02:09, 814.14 examples/s]Map:  49%|████▉     | 106352/216925 [02:16<02:38, 698.20 examples/s]Map:  51%|█████     | 110484/216925 [02:16<02:05, 849.51 examples/s]Map:  51%|█████     | 109657/216925 [02:15<02:09, 830.43 examples/s]Map:  51%|█████▏    | 111415/216925 [02:15<02:05, 841.11 examples/s]Map:  51%|█████     | 110572/216925 [02:16<02:04, 854.56 examples/s]Map:  51%|█████     | 109750/216925 [02:15<02:05, 851.06 examples/s]Map:  49%|████▉     | 106463/216925 [02:17<02:35, 710.10 examples/s]Map:  51%|█████     | 110667/216925 [02:16<02:01, 877.46 examples/s]Map:  51%|█████▏    | 111546/216925 [02:15<02:04, 848.95 examples/s]Map:  51%|█████     | 109840/216925 [02:15<02:04, 859.45 examples/s]Map:  49%|████▉     | 106542/216925 [02:17<02:31, 727.36 examples/s]Map:  51%|█████     | 110758/216925 [02:17<02:00, 883.32 examples/s]Map:  51%|█████▏    | 111633/216925 [02:15<02:03, 849.62 examples/s]Map:  51%|█████     | 109928/216925 [02:15<02:04, 860.93 examples/s]Map:  49%|████▉     | 106654/216925 [02:17<02:30, 730.55 examples/s]Map:  51%|█████     | 110848/216925 [02:17<01:59, 886.61 examples/s]Map:  52%|█████▏    | 111724/216925 [02:16<02:01, 863.43 examples/s]Map:  49%|████▉     | 106734/216925 [02:17<02:27, 747.08 examples/s]Map:  51%|█████     | 110942/216925 [02:17<01:57, 898.95 examples/s]Map:  52%|█████▏    | 111813/216925 [02:16<02:00, 870.43 examples/s]Map:  51%|█████     | 110041/216925 [02:16<02:37, 678.25 examples/s]Map:  49%|████▉     | 106815/216925 [02:17<02:24, 762.05 examples/s]Map:  51%|█████     | 110131/216925 [02:16<02:27, 725.20 examples/s]Map:  52%|█████▏    | 111943/216925 [02:16<02:01, 865.91 examples/s]Map:  49%|████▉     | 106894/216925 [02:17<02:23, 767.30 examples/s]Map:  51%|█████     | 111045/216925 [02:17<02:28, 711.77 examples/s]Map:  51%|█████     | 110220/216925 [02:16<02:19, 763.85 examples/s]Map:  49%|████▉     | 106974/216925 [02:17<02:21, 775.73 examples/s]Map:  51%|█████     | 111138/216925 [02:17<02:18, 763.01 examples/s]Map:  51%|█████     | 110313/216925 [02:16<02:12, 805.70 examples/s]Map:  52%|█████▏    | 112042/216925 [02:16<02:30, 698.99 examples/s]Map:  51%|█████▏    | 111223/216925 [02:17<02:15, 782.06 examples/s]Map:  52%|█████▏    | 112125/216925 [02:16<02:24, 726.41 examples/s]Map:  51%|█████▏    | 111308/216925 [02:17<02:12, 795.66 examples/s]Map:  51%|█████     | 110437/216925 [02:16<02:11, 809.66 examples/s]Map:  49%|████▉     | 107078/216925 [02:17<03:04, 594.40 examples/s]Map:  52%|█████▏    | 112215/216925 [02:16<02:16, 768.02 examples/s]Map:  51%|█████▏    | 111402/216925 [02:17<02:06, 834.10 examples/s]Map:  51%|���████     | 110528/216925 [02:16<02:07, 833.59 examples/s]Map:  49%|████▉     | 107164/216925 [02:18<02:48, 650.76 examples/s]Map:  52%|█████▏    | 112308/216925 [02:16<02:09, 807.41 examples/s]Map:  51%|█████▏    | 111498/216925 [02:18<02:01, 866.80 examples/s]Map:  51%|█████     | 110618/216925 [02:16<02:05, 848.23 examples/s]Map:  49%|████▉     | 107249/216925 [02:18<02:37, 696.41 examples/s]Map:  52%|█████▏    | 112399/216925 [02:16<02:05, 832.53 examples/s]Map:  51%|█████▏    | 111589/216925 [02:18<02:00, 876.21 examples/s]Map:  51%|█████     | 110707/216925 [02:16<02:03, 857.76 examples/s]Map:  52%|█████▏    | 112494/216925 [02:16<02:01, 862.52 examples/s]Map:  51%|█████▏    | 111682/216925 [02:18<01:58, 890.06 examples/s]Map:  51%|█████     | 110799/216925 [02:17<02:01, 872.02 examples/s]Map:  49%|████▉     | 107356/216925 [02:18<02:53, 631.05 examples/s]Map:  52%|█████▏    | 112588/216925 [02:17<01:58, 880.65 examples/s]Map:  52%|█████▏    | 111777/216925 [02:18<01:56, 903.49 examples/s]Map:  50%|████▉     | 107435/216925 [02:18<02:44, 665.17 examples/s]Map:  51%|█████     | 110934/216925 [02:17<02:00, 879.06 examples/s]Map:  52%|█████▏    | 112678/216925 [02:17<01:57, 884.45 examples/s]Map:  52%|█████▏    | 111871/216925 [02:18<01:55, 912.05 examples/s]Map:  52%|█████▏    | 112774/216925 [02:17<01:55, 902.08 examples/s]Map:  50%|████▉     | 107519/216925 [02:18<02:55, 623.82 examples/s]Map:  52%|█████▏    | 112867/216925 [02:17<01:54, 909.05 examples/s]Map:  51%|█████     | 111044/216925 [02:17<02:27, 717.00 examples/s]Map:  52%|█████▏    | 112000/216925 [02:18<02:23, 729.15 examples/s]Map:  51%|█████     | 111139/216925 [02:17<02:17, 767.22 examples/s]Map:  50%|████▉     | 107609/216925 [02:18<03:17, 552.97 examples/s]Map:  52%|█████▏    | 112090/216925 [02:18<02:16, 767.12 examples/s]Map:  51%|█████▏    | 111230/216925 [02:17<02:12, 798.62 examples/s]Map:  52%|█████▏    | 113000/216925 [02:17<02:24, 720.27 examples/s]Map:  50%|████▉     | 107680/216925 [02:18<03:27, 527.57 examples/s]Map:  52%|█████▏    | 112183/216925 [02:18<02:10, 803.02 examples/s]Map:  51%|█████▏    | 111320/216925 [02:17<02:08, 824.11 examples/s]Map:  52%|█████▏    | 113094/216925 [02:17<02:15, 768.16 examples/s]Map:  52%|█████▏    | 112271/216925 [02:18<02:07, 822.88 examples/s]Map:  51%|█████▏    | 111412/216925 [02:17<02:04, 848.03 examples/s]Map:  50%|████▉     | 107752/216925 [02:19<03:34, 509.39 examples/s]Map:  52%|█████▏    | 113186/216925 [02:17<02:09, 801.59 examples/s]Map:  52%|█████▏    | 112389/216925 [02:19<02:09, 805.27 examples/s]Map:  51%|█████▏    | 111539/216925 [02:17<02:04, 845.10 examples/s]Map:  50%|████▉     | 107823/216925 [02:19<03:39, 497.18 examples/s]Map:  52%|█████▏    | 113313/216925 [02:17<02:07, 810.83 examples/s]Map:  52%|█████▏    | 112476/216925 [02:19<02:07, 819.74 examples/s]Map:  52%|█████▏    | 113401/216925 [02:18<02:05, 826.38 examples/s]Map:  51%|█████▏    | 111662/216925 [02:18<02:06, 832.31 examples/s]Map:  52%|█████▏    | 112565/216925 [02:19<02:04, 836.25 examples/s]Map:  50%|████▉     | 107889/216925 [02:19<03:49, 475.70 examples/s]Map:  52%|█████▏    | 113494/216925 [02:18<02:01, 849.77 examples/s]Map:  52%|█████▏    | 111750/216925 [02:18<02:04, 841.42 examples/s]Map:  52%|█████▏    | 112652/216925 [02:19<02:03, 842.25 examples/s]Map:  50%|████▉     | 107959/216925 [02:19<03:52, 469.57 examples/s]Map:  52%|█████▏    | 113585/216925 [02:18<01:59, 863.56 examples/s]Map:  52%|█████▏    | 111845/216925 [02:18<02:01, 864.99 examples/s]Map:  52%|█████▏    | 112740/216925 [02:19<02:02, 850.14 examples/s]Map:  52%|█████▏    | 113682/216925 [02:18<01:55, 891.11 examples/s]Map:  52%|█████▏    | 112831/216925 [02:19<02:00, 865.27 examples/s]Map:  52%|█████▏    | 111974/216925 [02:18<02:01, 860.93 examples/s]Map:  52%|█████▏    | 113773/216925 [02:18<01:55, 893.72 examples/s]Map:  52%|█████▏    | 112960/216925 [02:19<02:01, 856.85 examples/s]Map:  50%|████▉     | 108022/216925 [02:19<05:21, 338.46 examples/s]Map:  53%|█████▎    | 113907/216925 [02:18<01:55, 889.85 examples/s]Map:  52%|█████▏    | 112083/216925 [02:18<02:29, 702.15 examples/s]Map:  50%|████▉     | 108068/216925 [02:20<05:03, 358.31 examples/s]Map:  53%|█████▎    | 113998/216925 [02:18<01:55, 894.39 examples/s]Map:  52%|█████▏    | 112172/216925 [02:18<02:21, 741.34 examples/s]Map:  50%|████▉     | 108138/216925 [02:20<04:16, 424.25 examples/s]Map:  52%|█████▏    | 113088/216925 [02:20<02:30, 692.19 examples/s]Map:  52%|█████▏    | 112262/216925 [02:18<02:14, 777.07 examples/s]Map:  50%|████▉     | 108222/216925 [02:20<03:31, 514.38 examples/s]Map:  52%|█████▏    | 113175/216925 [02:20<02:22, 728.74 examples/s]Map:  53%|█████▎    | 114092/216925 [02:18<02:23, 714.82 examples/s]Map:  52%|█████▏    | 112351/216925 [02:18<02:10, 803.01 examples/s]Map:  50%|████▉     | 108308/216925 [02:20<03:02, 595.44 examples/s]Map:  52%|█████▏    | 113264/216925 [02:20<02:15, 763.27 examples/s]Map:  53%|█████▎    | 114187/216925 [02:19<02:13, 767.72 examples/s]Map:  52%|█████▏    | 112443/216925 [02:19<02:05, 831.37 examples/s]Map:  50%|████▉     | 108387/216925 [02:20<02:48, 643.72 examples/s]Map:  52%|█████▏    | 113352/216925 [02:20<02:11, 790.45 examples/s]Map:  53%|█████▎    | 114282/216925 [02:19<02:06, 811.21 examples/s]Map:  52%|█████▏    | 112531/216925 [02:19<02:04, 840.33 examples/s]Map:  50%|█████     | 108467/216925 [02:20<02:38, 682.36 examples/s]Map:  52%|█████▏    | 113474/216925 [02:20<02:10, 794.56 examples/s]Map:  53%|█████▎    | 114402/216925 [02:19<02:07, 804.06 examples/s]Map:  50%|█████     | 108549/216925 [02:20<02:30, 718.49 examples/s]Map:  52%|█████▏    | 112646/216925 [02:19<02:08, 809.77 examples/s]Map:  52%|█████▏    | 113564/216925 [02:20<02:06, 820.14 examples/s]Map:  53%|█████▎    | 114496/216925 [02:19<02:02, 834.24 examples/s]Map:  50%|█████     | 108631/216925 [02:20<02:25, 742.24 examples/s]Map:  52%|█████▏    | 112738/216925 [02:19<02:04, 835.79 examples/s]Map:  52%|█████▏    | 113650/216925 [02:20<02:04, 828.91 examples/s]Map:  53%|█████▎    | 114587/216925 [02:19<01:59, 853.67 examples/s]Map:  50%|█████     | 108711/216925 [02:20<02:22, 757.18 examples/s]Map:  52%|█████▏    | 112831/216925 [02:19<02:01, 857.67 examples/s]Map:  52%|█████▏    | 113746/216925 [02:20<01:59, 861.61 examples/s]Map:  53%|█████▎    | 114675/216925 [02:19<01:59, 858.01 examples/s]Map:  50%|█████     | 108794/216925 [02:20<02:19, 776.10 examples/s]Map:  52%|█████▏    | 112919/216925 [02:19<02:00, 861.90 examples/s]Map:  52%|█████▏    | 113841/216925 [02:20<01:56, 884.93 examples/s]Map:  53%|█████▎    | 114769/216925 [02:19<01:56, 877.71 examples/s]Map:  50%|█████     | 108880/216925 [02:21<02:15, 795.14 examples/s]Map:  53%|█████▎    | 113932/216925 [02:20<01:55, 889.21 examples/s]Map:  53%|█████▎    | 114860/216925 [02:19<01:55, 883.49 examples/s]Map:  50%|█████     | 108965/216925 [02:21<02:13, 809.61 examples/s]Map:  52%|█████▏    | 113042/216925 [02:19<02:28, 697.83 examples/s]Map:  53%|█████▎    | 114956/216925 [02:19<01:52, 903.50 examples/s]Map:  52%|█████▏    | 113130/216925 [02:19<02:20, 737.35 examples/s]Map:  53%|█████▎    | 114044/216925 [02:21<02:26, 702.24 examples/s]Map:  50%|█████     | 109085/216925 [02:21<02:44, 653.82 examples/s]Map:  52%|█████▏    | 113220/216925 [02:20<02:13, 774.88 examples/s]Map:  53%|█████▎    | 114135/216925 [02:21<02:17, 748.30 examples/s]Map:  50%|█████     | 109171/216925 [02:21<02:34, 699.51 examples/s]Map:  53%|█████▎    | 115090/216925 [02:20<02:20, 723.60 examples/s]Map:  52%|█████▏    | 113306/216925 [02:20<02:10, 792.58 examples/s]Map:  53%|█████▎    | 114224/216925 [02:21<02:11, 780.69 examples/s]Map:  50%|█████     | 109256/216925 [02:21<02:26, 734.79 examples/s]Map:  53%|█████▎    | 115187/216925 [02:20<02:11, 776.24 examples/s]Map:  52%|█████▏    | 113395/216925 [02:20<02:06, 815.87 examples/s]Map:  53%|█████▎    | 114315/216925 [02:21<02:06, 812.54 examples/s]Map:  50%|█████     | 109346/216925 [02:21<02:18, 774.51 examples/s]Map:  53%|█████▎    | 115274/216925 [02:20<02:07, 798.39 examples/s]Map:  52%|█████▏    | 113483/216925 [02:20<02:04, 828.96 examples/s]Map:  53%|█████▎    | 114406/216925 [02:21<02:02, 838.40 examples/s]Map:  50%|█████     | 109436/216925 [02:21<02:13, 805.77 examples/s]Map:  53%|█████▎    | 115366/216925 [02:20<02:02, 827.92 examples/s]Map:  52%|█████▏    | 113573/216925 [02:20<02:02, 845.51 examples/s]Map:  53%|█████▎    | 114497/216925 [02:21<01:59, 856.32 examples/s]Map:  50%|█████     | 109527/216925 [02:21<02:09, 831.71 examples/s]Map:  53%|█████▎    | 115455/216925 [02:20<02:00, 843.35 examples/s]Map:  52%|█████▏    | 113695/216925 [02:20<02:04, 831.59 examples/s]Map:  53%|█████▎    | 114626/216925 [02:21<02:00, 849.77 examples/s]Map:  51%|█████     | 109654/216925 [02:22<02:08, 832.76 examples/s]Map:  53%|█████▎    | 115579/216925 [02:20<02:01, 833.24 examples/s]Map:  52%|█████▏    | 113786/216925 [02:20<02:01, 849.11 examples/s]Map:  53%|█████▎    | 114714/216925 [02:21<01:59, 853.27 examples/s]Map:  51%|█████     | 109741/216925 [02:22<02:07, 841.34 examples/s]Map:  53%|█████▎    | 115673/216925 [02:20<01:57, 858.34 examples/s]Map:  52%|█████▏    | 113884/216925 [02:20<01:57, 878.72 examples/s]Map:  53%|█████▎    | 114805/216925 [02:22<01:57, 866.21 examples/s]Map:  51%|█████     | 109833/216925 [02:22<02:04, 857.74 examples/s]Map:  53%|█████▎    | 115761/216925 [02:20<01:57, 861.09 examples/s]Map:  53%|█████▎    | 113976/216925 [02:20<01:56, 887.30 examples/s]Map:  53%|█████▎    | 114897/216925 [02:22<01:56, 876.71 examples/s]Map:  51%|█████     | 109922/216925 [02:22<02:03, 865.16 examples/s]Map:  53%|█████▎    | 115851/216925 [02:21<01:56, 870.28 examples/s]Map:  53%|█████▎    | 114991/216925 [02:22<01:54, 893.42 examples/s]Map:  53%|█████▎    | 115942/216925 [02:21<01:54, 878.61 examples/s]Map:  53%|█████▎    | 114085/216925 [02:21<02:27, 698.26 examples/s]Map:  51%|█████     | 110044/216925 [02:22<02:31, 704.05 examples/s]Map:  53%|█████▎    | 114174/216925 [02:21<02:18, 740.69 examples/s]Map:  53%|█████▎    | 115095/216925 [02:22<02:21, 717.70 examples/s]Map:  53%|█████▎    | 116045/216925 [02:21<02:24, 698.47 examples/s]Map:  51%|█████     | 110129/216925 [02:22<02:25, 735.32 examples/s]Map:  53%|█████▎    | 114263/216925 [02:21<02:12, 775.58 examples/s]Map:  53%|█████▎    | 115192/216925 [02:22<02:11, 774.12 examples/s]Map:  54%|█████▎    | 116138/216925 [02:21<02:14, 751.99 examples/s]Map:  51%|█████     | 110218/216925 [02:22<02:18, 768.15 examples/s]Map:  53%|█████▎    | 114355/216925 [02:21<02:06, 810.04 examples/s]Map:  53%|█████▎    | 115282/216925 [02:22<02:06, 804.89 examples/s]Map:  54%|█████▎    | 116233/216925 [02:21<02:05, 800.17 examples/s]Map:  51%|█████     | 110303/216925 [02:22<02:15, 786.89 examples/s]Map:  53%|█████▎    | 114446/216925 [02:21<02:02, 833.90 examples/s]Map:  53%|█████▎    | 115374/216925 [02:22<02:02, 830.86 examples/s]Map:  54%|█████▎    | 116325/216925 [02:21<02:01, 830.26 examples/s]Map:  51%|█████     | 110389/216925 [02:22<02:12, 803.96 examples/s]Map:  53%|█████▎    | 114533/216925 [02:21<02:01, 839.34 examples/s]Map:  53%|█████▎    | 115465/216925 [02:22<01:59, 852.18 examples/s]Map:  54%|█████▎    | 116422/216925 [02:21<01:56, 865.68 examples/s]Map:  51%|█████     | 110479/216925 [02:23<02:08, 827.69 examples/s]Map:  53%|█████▎    | 114626/216925 [02:21<01:58, 860.55 examples/s]Map:  53%|█████▎    | 115560/216925 [02:22<01:55, 876.26 examples/s]Map:  54%|█████▎    | 116517/216925 [02:21<01:53, 887.76 examples/s]Map:  51%|█████     | 110565/216925 [02:23<02:07, 831.22 examples/s]Map:  53%|█████▎    | 114715/216925 [02:21<01:57, 868.77 examples/s]Map:  53%|█████▎    | 115651/216925 [02:23<01:55, 879.41 examples/s]Map:  54%|█████▍    | 116644/216925 [02:21<01:55, 868.36 examples/s]Map:  51%|█████     | 110693/216925 [02:23<02:07, 834.49 examples/s]Map:  53%|█████▎    | 114841/216925 [02:22<01:59, 854.60 examples/s]Map:  53%|█████▎    | 115776/216925 [02:23<01:57, 858.52 examples/s]Map:  54%|█████▍    | 116734/216925 [02:22<01:54, 872.60 examples/s]Map:  51%|█████     | 110785/216925 [02:23<02:04, 853.60 examples/s]Map:  53%|█████▎    | 114930/216925 [02:22<01:58, 862.69 examples/s]Map:  53%|█████▎    | 115867/216925 [02:23<01:56, 869.62 examples/s]Map:  54%|█████▍    | 116823/216925 [02:22<01:54, 874.65 examples/s]Map:  51%|█████     | 110877/216925 [02:23<02:02, 867.15 examples/s]Map:  53%|█████▎    | 115961/216925 [02:23<01:54, 883.75 examples/s]Map:  54%|█████▍    | 116915/216925 [02:22<01:52, 885.44 examples/s]Map:  53%|█████▎    | 115041/216925 [02:22<02:27, 691.98 examples/s]Map:  51%|█████     | 111000/216925 [02:23<02:31, 697.64 examples/s]Map:  53%|█████▎    | 115133/216925 [02:22<02:17, 741.65 examples/s]Map:  54%|█████▎    | 116089/216925 [02:23<02:20, 717.27 examples/s]Map:  54%|█████▍    | 117047/216925 [02:22<02:16, 729.91 examples/s]Map:  51%|█████     | 111085/216925 [02:23<02:25, 728.14 examples/s]Map:  53%|█████▎    | 115222/216925 [02:22<02:11, 774.67 examples/s]Map:  54%|█████▎    | 116180/216925 [02:23<02:12, 758.48 examples/s]Map:  54%|█████▍    | 117139/216925 [02:22<02:09, 771.96 examples/s]Map:  51%|█████     | 111173/216925 [02:23<02:18, 761.34 examples/s]Map:  53%|█████▎    | 115312/216925 [02:22<02:06, 806.11 examples/s]Map:  54%|█████▎    | 116268/216925 [02:23<02:07, 786.71 examples/s]Map:  54%|█████▍    | 117230/216925 [02:22<02:04, 802.07 examples/s]Map:  51%|█████▏    | 111254/216925 [02:24<02:17, 770.87 examples/s]Map:  53%|█████▎    | 115400/216925 [02:22<02:03, 822.52 examples/s]Map:  54%|█████▎    | 116357/216925 [02:23<02:03, 811.22 examples/s]Map:  54%|█████▍    | 117325/216925 [02:22<01:58, 837.80 examples/s]Map:  51%|█████▏    | 111338/216925 [02:24<02:14, 786.32 examples/s]Map:  53%|█████▎    | 115493/216925 [02:22<01:59, 849.64 examples/s]Map:  54%|█████▎    | 116452/216925 [02:24<01:58, 845.76 examples/s]Map:  54%|█████▍    | 117415/216925 [02:22<01:56, 852.57 examples/s]Map:  51%|█████▏    | 111425/216925 [02:24<02:10, 805.60 examples/s]Map:  53%|█████▎    | 115590/216925 [02:22<01:55, 880.45 examples/s]Map:  54%|█████▎    | 116544/216925 [02:24<01:56, 862.77 examples/s]Map:  54%|█████▍    | 117505/216925 [02:23<01:55, 863.70 examples/s]Map:  51%|█████▏    | 111510/216925 [02:24<02:09, 815.18 examples/s]Map:  54%|█████▍    | 116638/216925 [02:24<01:53, 880.96 examples/s]Map:  53%|█████▎    | 115725/216925 [02:23<01:54, 881.99 examples/s]Map:  54%|█████▍    | 117596/216925 [02:23<01:53, 872.51 examples/s]Map:  51%|█████▏    | 111594/216925 [02:24<02:08, 820.63 examples/s]Map:  54%|█████▍    | 117686/216925 [02:23<01:52, 878.91 examples/s]Map:  54%|█████▍    | 116768/216925 [02:24<01:54, 872.53 examples/s]Map:  53%|█████▎    | 115854/216925 [02:23<01:55, 871.36 examples/s]Map:  51%|█████▏    | 111709/216925 [02:24<02:12, 795.39 examples/s]Map:  54%|█████▍    | 117809/216925 [02:23<01:56, 852.17 examples/s]Map:  54%|█████▍    | 116895/216925 [02:24<01:56, 859.78 examples/s]Map:  52%|█████▏    | 111792/216925 [02:24<02:11, 799.51 examples/s]Map:  53%|█████▎    | 115982/216925 [02:23<01:56, 863.68 examples/s]Map:  54%|█████▍    | 117899/216925 [02:23<01:54, 861.84 examples/s]Map:  54%|█████▍    | 116986/216925 [02:24<01:55, 868.25 examples/s]Map:  52%|█████▏    | 111883/216925 [02:24<02:06, 828.26 examples/s]Map:  54%|█████▍    | 117987/216925 [02:23<01:54, 865.58 examples/s]Map:  52%|█████▏    | 111969/216925 [02:24<02:06, 832.94 examples/s]Map:  54%|█████▎    | 116087/216925 [02:23<02:21, 713.32 examples/s]Map:  54%|█████▍    | 117090/216925 [02:24<02:21, 705.09 examples/s]Map:  54%|█████▎    | 116177/216925 [02:23<02:14, 751.39 examples/s]Map:  54%|█████▍    | 118091/216925 [02:23<02:22, 695.16 examples/s]Map:  54%|█████▍    | 117182/216925 [02:24<02:12, 752.35 examples/s]Map:  54%|█████▎    | 116266/216925 [02:23<02:08, 780.84 examples/s]Map:  52%|█████▏    | 112088/216925 [02:25<02:34, 679.70 examples/s]Map:  54%|█████▍    | 118185/216925 [02:23<02:11, 750.92 examples/s]Map:  54%|█████▍    | 117268/216925 [02:25<02:08, 776.92 examples/s]Map:  54%|█████▎    | 116360/216925 [02:23<02:03, 815.37 examples/s]Map:  52%|█████▏    | 112174/216925 [02:25<02:26, 717.39 examples/s]Map:  55%|█████▍    | 118278/216925 [02:23<02:04, 794.19 examples/s]Map:  54%|█████▍    | 117364/216925 [02:25<02:01, 820.69 examples/s]Map:  54%|█████▎    | 116452/216925 [02:24<01:59, 840.34 examples/s]Map:  52%|█████▏    | 112257/216925 [02:25<02:20, 743.77 examples/s]Map:  55%|█████▍    | 118372/216925 [02:24<01:58, 829.48 examples/s]Map:  54%|█████▍    | 117454/216925 [02:25<01:58, 841.04 examples/s]Map:  54%|█████▎    | 116545/216925 [02:24<01:56, 859.51 examples/s]Map:  52%|█████▏    | 112346/216925 [02:25<02:14, 779.22 examples/s]Map:  55%|█████▍    | 118465/216925 [02:24<01:55, 854.26 examples/s]Map:  54%|█████▍    | 117544/216925 [02:25<01:56, 854.75 examples/s]Map:  54%|█████▍    | 116636/216925 [02:24<01:55, 871.07 examples/s]Map:  52%|█████▏    | 112435/216925 [02:25<02:09, 806.10 examples/s]Map:  55%|█████▍    | 118557/216925 [02:24<01:52, 871.99 examples/s]Map:  54%|█████▍    | 117636/216925 [02:25<01:54, 870.27 examples/s]Map:  52%|█████▏    | 112521/216925 [02:25<02:08, 815.03 examples/s]Map:  54%|█████▍    | 116764/216925 [02:24<01:56, 862.09 examples/s]Map:  54%|█████▍    | 117730/216925 [02:25<01:51, 887.93 examples/s]Map:  55%|█████▍    | 118692/216925 [02:24<01:51, 878.26 examples/s]Map:  52%|█████▏    | 112607/216925 [02:25<02:06, 826.81 examples/s]Map:  54%|█████▍    | 116855/216925 [02:24<01:54, 872.76 examples/s]Map:  54%|█████▍    | 117826/216925 [02:25<01:49, 907.50 examples/s]Map:  55%|█████▍    | 118786/216925 [02:24<01:50, 891.50 examples/s]Map:  52%|█████▏    | 112693/216925 [02:25<02:05, 833.03 examples/s]Map:  54%|█████▍    | 116944/216925 [02:24<01:54, 873.46 examples/s]Map:  54%|█████▍    | 117954/216925 [02:25<01:52, 881.25 examples/s]Map:  55%|█████▍    | 118909/216925 [02:24<01:53, 861.82 examples/s]Map:  52%|█████▏    | 112803/216925 [02:26<02:11, 792.89 examples/s]Map:  54%|█████▍    | 117043/216925 [02:24<02:24, 693.35 examples/s]Map:  52%|█████▏    | 112886/216925 [02:26<02:09, 800.32 examples/s]Map:  54%|█████▍    | 118045/216925 [02:26<02:22, 694.24 examples/s]Map:  55%|█████▍    | 119000/216925 [02:24<02:19, 703.15 examples/s]Map:  54%|█████▍    | 117135/216925 [02:24<02:14, 744.49 examples/s]Map:  54%|█████▍    | 118137/216925 [02:26<02:12, 744.90 examples/s]Map:  55%|█████▍    | 119090/216925 [02:24<02:11, 745.72 examples/s]Map:  54%|█████▍    | 117226/216925 [02:25<02:07, 783.16 examples/s]Map:  52%|█████▏    | 113000/216925 [02:26<02:43, 634.60 examples/s]Map:  55%|█████▍    | 118228/216925 [02:26<02:06, 782.61 examples/s]Map:  55%|█████▍    | 119185/216925 [02:25<02:03, 791.26 examples/s]Map:  54%|█████▍    | 117318/216925 [02:25<02:02, 815.59 examples/s]Map:  52%|█████▏    | 113083/216925 [02:26<02:34, 674.11 examples/s]Map:  55%|█████▍    | 118322/216925 [02:26<02:00, 819.57 examples/s]Map:  55%|█████▍    | 119274/216925 [02:25<02:00, 813.15 examples/s]Map:  54%|█████▍    | 117413/216925 [02:25<01:57, 848.89 examples/s]Map:  52%|█████▏    | 113164/216925 [02:26<02:27, 703.25 examples/s]Map:  55%|█████▍    | 118410/216925 [02:26<01:58, 832.40 examples/s]Map:  55%|█████▌    | 119367/216925 [02:25<01:55, 843.18 examples/s]Map:  54%|█████▍    | 117501/216925 [02:25<01:56, 856.45 examples/s]Map:  52%|█████▏    | 113246/216925 [02:26<02:22, 729.21 examples/s]Map:  54%|█████▍    | 117591/216925 [02:25<01:54, 865.19 examples/s]Map:  55%|█████▍    | 118536/216925 [02:26<01:58, 831.97 examples/s]Map:  55%|█████▌    | 119499/216925 [02:25<01:54, 852.25 examples/s]Map:  52%|█████▏    | 113328/216925 [02:26<02:17, 752.09 examples/s]Map:  54%|█████▍    | 117684/216925 [02:25<01:52, 882.48 examples/s]Map:  55%|█████▍    | 118623/216925 [02:26<01:57, 838.08 examples/s]Map:  55%|█████▌    | 119592/216925 [02:25<01:52, 868.54 examples/s]Map:  52%|█████▏    | 113411/216925 [02:26<02:14, 770.60 examples/s]Map:  54%|█████▍    | 117775/216925 [02:25<01:51, 887.80 examples/s]Map:  55%|█████▌    | 119687/216925 [02:25<01:49, 886.75 examples/s]Map:  52%|█████▏    | 113494/216925 [02:26<02:11, 785.20 examples/s]Map:  55%|█████▍    | 118752/216925 [02:26<01:57, 837.15 examples/s]Map:  54%|█████▍    | 117865/216925 [02:25<01:51, 888.09 examples/s]Map:  55%|█████▌    | 119777/216925 [02:25<01:49, 886.95 examples/s]Map:  52%|█████▏    | 113576/216925 [02:27<02:10, 793.37 examples/s]Map:  55%|█████▍    | 118843/216925 [02:26<01:54, 853.39 examples/s]Map:  54%|█████▍    | 117998/216925 [02:25<01:52, 882.44 examples/s]Map:  52%|█████▏    | 113663/216925 [02:27<02:07, 812.59 examples/s]Map:  55%|█████▍    | 118933/216925 [02:27<01:53, 861.01 examples/s]Map:  55%|█████▌    | 119912/216925 [02:25<01:49, 887.83 examples/s]Map:  52%|█████▏    | 113784/216925 [02:27<02:08, 805.75 examples/s]Map:  54%|█████▍    | 118087/216925 [02:26<02:20, 703.04 examples/s]Map:  55%|█████▍    | 119045/216925 [02:27<02:21, 690.15 examples/s]Map:  52%|█████▏    | 113871/216925 [02:27<02:05, 821.02 examples/s]Map:  54%|█████▍    | 118180/216925 [02:26<02:11, 753.64 examples/s]Map:  55%|█████▌    | 120042/216925 [02:26<02:15, 714.55 examples/s]Map:  55%|█████▍    | 119126/216925 [02:27<02:16, 715.30 examples/s]Map:  55%|█████▌    | 120122/216925 [02:26<02:12, 729.45 examples/s]Map:  53%|█████▎    | 113990/216925 [02:27<02:07, 807.60 examples/s]Map:  55%|█████▍    | 118296/216925 [02:26<02:10, 758.35 examples/s]Map:  55%|█████▍    | 119208/216925 [02:27<02:12, 737.22 examples/s]Map:  55%|█████▌    | 120212/216925 [02:26<02:06, 764.26 examples/s]Map:  55%|█████▍    | 118389/216925 [02:26<02:03, 798.35 examples/s]Map:  55%|█████▍    | 119297/216925 [02:27<02:06, 774.28 examples/s]Map:  55%|█████▌    | 120301/216925 [02:26<02:01, 792.75 examples/s]Map:  53%|█████▎    | 114084/216925 [02:27<02:38, 650.35 examples/s]Map:  55%|█████▍    | 118479/216925 [02:26<01:59, 822.82 examples/s]Map:  55%|█████▌    | 119386/216925 [02:27<02:01, 804.09 examples/s]Map:  55%|█████▌    | 120392/216925 [02:26<01:58, 817.34 examples/s]Map:  53%|█████▎    | 114166/216925 [02:27<02:29, 686.36 examples/s]Map:  55%|█████▍    | 118569/216925 [02:26<01:57, 839.47 examples/s]Map:  55%|█████▌    | 119475/216925 [02:27<01:58, 824.49 examples/s]Map:  53%|█████▎    | 114250/216925 [02:28<02:22, 722.10 examples/s]Map:  55%|█████▌    | 119566/216925 [02:27<01:54, 847.43 examples/s]Map:  55%|█████▍    | 118661/216925 [02:26<01:54, 859.01 examples/s]Map:  56%|█████▌    | 120519/216925 [02:26<01:56, 824.27 examples/s]Map:  53%|█████▎    | 114335/216925 [02:28<02:16, 751.33 examples/s]Map:  55%|█████▌    | 119655/216925 [02:28<01:53, 856.05 examples/s]Map:  55%|█████▍    | 118749/216925 [02:26<01:54, 860.37 examples/s]Map:  56%|█████▌    | 120606/216925 [02:26<01:55, 835.46 examples/s]Map:  53%|█████▎    | 114421/216925 [02:28<02:11, 778.57 examples/s]Map:  55%|█████▌    | 119745/216925 [02:28<01:52, 864.94 examples/s]Map:  55%|█████▍    | 118841/216925 [02:26<01:52, 873.37 examples/s]Map:  56%|█████▌    | 120697/216925 [02:26<01:52, 854.55 examples/s]Map:  53%|█████▎    | 114511/216925 [02:28<02:06, 811.24 examples/s]Map:  56%|█████▌    | 120787/216925 [02:27<01:51, 863.20 examples/s]Map:  55%|█████▌    | 119875/216925 [02:28<01:52, 860.64 examples/s]Map:  55%|█████▍    | 118971/216925 [02:27<01:53, 865.96 examples/s]Map:  53%|█████▎    | 114601/216925 [02:28<02:02, 832.79 examples/s]Map:  56%|█████▌    | 120880/216925 [02:27<01:48, 881.25 examples/s]Map:  55%|█████▌    | 119965/216925 [02:28<01:51, 868.89 examples/s]Map:  53%|█████▎    | 114689/216925 [02:28<02:01, 843.29 examples/s]Map:  56%|█████▌    | 120976/216925 [02:27<01:46, 902.64 examples/s]Map:  53%|█████▎    | 114780/216925 [02:28<01:58, 859.94 examples/s]Map:  55%|█████▍    | 119092/216925 [02:27<02:17, 712.95 examples/s]Map:  53%|█████▎    | 114876/216925 [02:28<01:55, 885.41 examples/s]Map:  55%|█████▍    | 119182/216925 [02:27<02:09, 752.75 examples/s]Map:  55%|█████▌    | 120085/216925 [02:28<02:19, 694.05 examples/s]Map:  56%|█████▌    | 121088/216925 [02:27<02:15, 708.42 examples/s]Map:  53%|█████▎    | 114967/216925 [02:28<01:54, 890.10 examples/s]Map:  55%|█████▍    | 119274/216925 [02:27<02:03, 789.84 examples/s]Map:  55%|█████▌    | 120177/216925 [02:28<02:10, 741.33 examples/s]Map:  56%|█████▌    | 121181/216925 [02:27<02:06, 758.00 examples/s]Map:  55%|█████▌    | 119363/216925 [02:27<02:00, 812.68 examples/s]Map:  55%|█████▌    | 120264/216925 [02:28<02:05, 770.34 examples/s]Map:  56%|█████▌    | 121277/216925 [02:27<01:58, 805.81 examples/s]Map:  55%|█████▌    | 119449/216925 [02:27<01:58, 823.84 examples/s]Map:  55%|█████▌    | 120347/216925 [02:28<02:03, 783.73 examples/s]Map:  53%|█████▎    | 115086/216925 [02:29<02:22, 713.49 examples/s]Map:  56%|█████▌    | 121401/216925 [02:27<01:58, 808.38 examples/s]Map:  53%|█████▎    | 115181/216925 [02:29<02:12, 766.40 examples/s]Map:  55%|█████▌    | 119573/216925 [02:27<01:58, 823.25 examples/s]Map:  56%|█████▌    | 120471/216925 [02:29<02:01, 795.29 examples/s]Map:  56%|█████▌    | 121493/216925 [02:27<01:54, 832.51 examples/s]Map:  53%|█████▎    | 115271/216925 [02:29<02:07, 797.52 examples/s]Map:  55%|█████▌    | 119661/216925 [02:27<01:56, 833.47 examples/s]Map:  56%|█████▌    | 120562/216925 [02:29<01:57, 821.62 examples/s]Map:  56%|█████▌    | 121581/216925 [02:28<01:53, 839.94 examples/s]Map:  53%|█████▎    | 115362/216925 [02:29<02:03, 824.60 examples/s]Map:  55%|█████▌    | 119749/216925 [02:28<01:55, 843.83 examples/s]Map:  56%|█████▌    | 120654/216925 [02:29<01:53, 845.37 examples/s]Map:  56%|█████▌    | 121672/216925 [02:28<01:51, 856.14 examples/s]Map:  55%|█████▌    | 119836/216925 [02:28<01:54, 848.04 examples/s]Map:  53%|█████▎    | 115456/216925 [02:29<02:15, 748.38 examples/s]Map:  56%|█████▌    | 121762/216925 [02:28<01:49, 867.16 examples/s]Map:  56%|█████▌    | 120785/216925 [02:29<01:52, 852.48 examples/s]Map:  55%|█████▌    | 119926/216925 [02:28<01:52, 859.75 examples/s]Map:  53%|█████▎    | 115540/216925 [02:29<02:11, 769.75 examples/s]Map:  56%|█████▌    | 121853/216925 [02:28<01:48, 875.70 examples/s]Map:  56%|█████▌    | 120876/216925 [02:29<01:50, 865.31 examples/s]Map:  53%|█████▎    | 115627/216925 [02:29<02:07, 793.71 examples/s]Map:  56%|█████▌    | 121947/216925 [02:28<01:46, 890.95 examples/s]Map:  56%|█████▌    | 120967/216925 [02:29<01:49, 873.34 examples/s]Map:  53%|█████▎    | 115713/216925 [02:29<02:04, 810.17 examples/s]Map:  55%|█████▌    | 120042/216925 [02:28<02:20, 690.29 examples/s]Map:  53%|█████▎    | 115797/216925 [02:29<02:03, 816.10 examples/s]Map:  55%|█████▌    | 120132/216925 [02:28<02:11, 737.71 examples/s]Map:  56%|█████▋    | 122043/216925 [02:28<02:16, 693.96 examples/s]Map:  56%|█████▌    | 121093/216925 [02:29<02:13, 717.92 examples/s]Map:  53%|█████▎    | 115881/216925 [02:30<02:02, 822.33 examples/s]Map:  55%|█████▌    | 120221/216925 [02:28<02:05, 772.95 examples/s]Map:  56%|█████▋    | 122133/216925 [02:28<02:07, 742.20 examples/s]Map:  56%|█████▌    | 121185/216925 [02:29<02:05, 762.10 examples/s]Map:  53%|█████▎    | 115965/216925 [02:30<02:02, 823.83 examples/s]Map:  55%|█████▌    | 120311/216925 [02:28<02:00, 803.71 examples/s]Map:  56%|█████▋    | 122228/216925 [02:28<01:59, 791.08 examples/s]Map:  56%|█████▌    | 121274/216925 [02:30<02:00, 790.80 examples/s]Map:  56%|█████▌    | 120403/216925 [02:28<01:55, 832.17 examples/s]Map:  56%|█████▋    | 122327/216925 [02:28<01:52, 842.01 examples/s]Map:  56%|█████▌    | 121365/216925 [02:30<01:56, 819.92 examples/s]Map:  56%|█████▌    | 120493/216925 [02:28<01:53, 847.03 examples/s]Map:  56%|█████▋    | 122419/216925 [02:29<01:49, 860.15 examples/s]Map:  54%|█████▎    | 116088/216925 [02:30<02:34, 651.38 examples/s]Map:  56%|█████▌    | 121456/216925 [02:30<01:53, 842.87 examples/s]Map:  56%|█████▋    | 122511/216925 [02:29<01:48, 873.67 examples/s]Map:  54%|█████▎    | 116176/216925 [02:30<02:23, 701.05 examples/s]Map:  56%|█████▌    | 120620/216925 [02:29<01:54, 843.24 examples/s]Map:  56%|█████▌    | 121544/216925 [02:30<01:52, 848.92 examples/s]Map:  57%|█████▋    | 122611/216925 [02:29<01:59, 790.11 examples/s]Map:  54%|█████▎    | 116292/216925 [02:30<02:19, 721.24 examples/s]Map:  56%|█████▌    | 120739/216925 [02:29<01:57, 822.04 examples/s]Map:  56%|█████▌    | 121669/216925 [02:30<01:53, 841.00 examples/s]Map:  57%|█████▋    | 122700/216925 [02:29<01:55, 815.71 examples/s]Map:  54%|█████▎    | 116376/216925 [02:30<02:14, 747.13 examples/s]Map:  56%|█████▌    | 120825/216925 [02:29<01:55, 830.08 examples/s]Map:  56%|█████▌    | 121800/216925 [02:30<01:52, 848.96 examples/s]Map:  57%|█████▋    | 122788/216925 [02:29<01:53, 829.93 examples/s]Map:  54%|█████▎    | 116463/216925 [02:30<02:09, 774.92 examples/s]Map:  56%|█████▌    | 120913/216925 [02:29<01:54, 840.39 examples/s]Map:  56%|█████▌    | 121891/216925 [02:30<01:50, 860.83 examples/s]Map:  57%|█████▋    | 122877/216925 [02:29<01:51, 843.65 examples/s]Map:  54%|█████▎    | 116550/216925 [02:30<02:05, 797.81 examples/s]Map:  56%|█████▌    | 121983/216925 [02:30<01:48, 872.41 examples/s]Map:  56%|█████▌    | 121000/216925 [02:29<02:21, 679.70 examples/s]Map:  54%|█████▍    | 116636/216925 [02:31<02:03, 812.63 examples/s]Map:  56%|█████▌    | 121086/216925 [02:29<02:12, 720.83 examples/s]Map:  54%|█████▍    | 116722/216925 [02:31<02:01, 823.21 examples/s]Map:  57%|█████▋    | 123000/216925 [02:29<02:19, 675.44 examples/s]Map:  56%|█████▋    | 122090/216925 [02:31<02:17, 688.99 examples/s]Map:  56%|█████▌    | 121177/216925 [02:29<02:05, 765.70 examples/s]Map:  54%|█████▍    | 116812/216925 [02:31<01:58, 843.01 examples/s]Map:  57%|█████▋    | 123087/216925 [02:29<02:11, 716.06 examples/s]Map:  56%|█████▋    | 122176/216925 [02:31<02:10, 724.65 examples/s]Map:  56%|█████▌    | 121266/216925 [02:29<02:00, 796.51 examples/s]Map:  54%|█████▍    | 116899/216925 [02:31<01:58, 847.61 examples/s]Map:  57%|█████▋    | 123178/216925 [02:30<02:03, 761.72 examples/s]Map:  56%|█████▋    | 122263/216925 [02:31<02:04, 758.84 examples/s]Map:  56%|█████▌    | 121353/216925 [02:30<01:57, 814.18 examples/s]Map:  54%|█████▍    | 116986/216925 [02:31<01:57, 849.23 examples/s]Map:  57%|█████▋    | 123268/216925 [02:30<01:57, 794.65 examples/s]Map:  56%|█████▋    | 122353/216925 [02:31<01:59, 792.36 examples/s]Map:  56%|█████▌    | 121444/216925 [02:30<01:53, 840.00 examples/s]Map:  57%|█████▋    | 123358/216925 [02:30<01:53, 822.62 examples/s]Map:  56%|█████▋    | 122440/216925 [02:31<01:56, 812.35 examples/s]Map:  56%|█████▌    | 121535/216925 [02:30<01:51, 857.16 examples/s]Map:  54%|█████▍    | 117085/216925 [02:31<02:27, 678.93 examples/s]Map:  57%|█████▋    | 123445/216925 [02:30<01:52, 832.74 examples/s]Map:  56%|█████▋    | 122527/216925 [02:31<01:54, 824.84 examples/s]Map:  54%|█████▍    | 117178/216925 [02:31<02:14, 738.97 examples/s]Map:  57%|█████▋    | 123533/216925 [02:30<01:51, 841.21 examples/s]Map:  56%|█████▌    | 121662/216925 [02:30<01:52, 848.49 examples/s]Map:  57%|█████▋    | 122618/216925 [02:31<01:51, 846.19 examples/s]Map:  54%|█████▍    | 117268/216925 [02:31<02:08, 776.84 examples/s]Map:  57%|█████▋    | 123620/216925 [02:30<01:50, 844.31 examples/s]Map:  56%|█████▌    | 121753/216925 [02:30<01:50, 863.71 examples/s]Map:  57%|█████▋    | 122708/216925 [02:31<01:49, 859.70 examples/s]Map:  54%|█████▍    | 117355/216925 [02:31<02:04, 801.64 examples/s]Map:  57%|█████▋    | 123709/216925 [02:30<01:49, 853.66 examples/s]Map:  56%|█████▌    | 121878/216925 [02:30<01:51, 849.08 examples/s]Map:  57%|█████▋    | 122832/216925 [02:31<01:51, 842.15 examples/s]Map:  54%|█████▍    | 117485/216925 [02:32<02:01, 820.82 examples/s]Map:  57%|█████▋    | 123839/216925 [02:30<01:48, 854.12 examples/s]Map:  56%|█████▌    | 121972/216925 [02:30<01:49, 869.10 examples/s]Map:  57%|█████▋    | 122922/216925 [02:32<01:49, 855.91 examples/s]Map:  54%|█████▍    | 117573/216925 [02:32<01:58, 835.39 examples/s]Map:  57%|█████▋    | 123927/216925 [02:30<01:49, 847.42 examples/s]Map:  54%|█████▍    | 117664/216925 [02:32<01:56, 851.77 examples/s]Map:  56%|█████▋    | 122086/216925 [02:31<02:15, 702.18 examples/s]Map:  54%|█████▍    | 117757/216925 [02:32<01:53, 871.39 examples/s]Map:  57%|█████▋    | 123043/216925 [02:32<02:14, 698.41 examples/s]Map:  57%|█████▋    | 124046/216925 [02:31<02:11, 704.65 examples/s]Map:  56%|█████▋    | 122178/216925 [02:31<02:06, 748.11 examples/s]Map:  54%|█████▍    | 117850/216925 [02:32<01:52, 883.64 examples/s]Map:  57%|█████▋    | 123133/216925 [02:32<02:06, 741.45 examples/s]Map:  57%|█████▋    | 124138/216925 [02:31<02:03, 751.69 examples/s]Map:  56%|█████▋    | 122265/216925 [02:31<02:02, 775.16 examples/s]Map:  54%|█████▍    | 117945/216925 [02:32<01:50, 899.49 examples/s]Map:  57%|█████▋    | 123224/216925 [02:32<02:00, 780.31 examples/s]Map:  56%|█████▋    | 122353/216925 [02:31<01:58, 800.17 examples/s]Map:  57%|█████▋    | 123314/216925 [02:32<01:55, 807.90 examples/s]Map:  56%|█████▋    | 122440/216925 [02:31<01:55, 818.01 examples/s]Map:  54%|█████▍    | 118043/216925 [02:32<02:18, 712.94 examples/s]Map:  57%|█████▋    | 124250/216925 [02:31<02:31, 610.50 examples/s]Map:  57%|█████▋    | 123405/216925 [02:32<01:52, 831.87 examples/s]Map:  56%|█████▋    | 122528/216925 [02:31<01:53, 832.58 examples/s]Map:  54%|█████▍    | 118135/216925 [02:32<02:09, 761.58 examples/s]Map:  57%|█████▋    | 124342/216925 [02:31<02:18, 669.20 examples/s]Map:  57%|█████▋    | 123499/216925 [02:32<01:48, 859.32 examples/s]Map:  57%|█████▋    | 122615/216925 [02:31<01:52, 840.71 examples/s]Map:  54%|█████▍    | 118217/216925 [02:33<02:07, 773.50 examples/s]Map:  57%|█████▋    | 124435/216925 [02:31<02:07, 726.53 examples/s]Map:  57%|█████▋    | 123590/216925 [02:32<01:47, 869.10 examples/s]Map:  57%|█████▋    | 122710/216925 [02:31<01:48, 870.92 examples/s]Map:  55%|█████▍    | 118312/216925 [02:33<02:00, 819.52 examples/s]Map:  57%|█████▋    | 124525/216925 [02:31<02:00, 767.16 examples/s]Map:  57%|█████▋    | 123685/216925 [02:32<01:44, 889.33 examples/s]Map:  55%|█████▍    | 118403/216925 [02:33<01:57, 840.93 examples/s]Map:  57%|█████▋    | 124615/216925 [02:31<01:55, 796.79 examples/s]Map:  57%|█████▋    | 122846/216925 [02:31<01:47, 879.03 examples/s]Map:  57%|█████▋    | 123820/216925 [02:33<01:44, 889.30 examples/s]Map:  55%|��████▍    | 118497/216925 [02:33<01:53, 866.70 examples/s]Map:  57%|█████▋    | 124706/216925 [02:31<01:51, 825.63 examples/s]Map:  57%|█████▋    | 122975/216925 [02:32<01:47, 870.31 examples/s]Map:  55%|█████▍    | 118587/216925 [02:33<01:52, 874.22 examples/s]Map:  58%|█████▊    | 124797/216925 [02:32<01:48, 846.14 examples/s]Map:  57%|█████▋    | 123947/216925 [02:33<01:46, 873.02 examples/s]Map:  55%|█████▍    | 118676/216925 [02:33<01:52, 875.97 examples/s]Map:  58%|█████▊    | 124885/216925 [02:32<01:47, 853.84 examples/s]Map:  57%|█████▋    | 123083/216925 [02:32<02:14, 697.13 examples/s]Map:  55%|█████▍    | 118765/216925 [02:33<01:51, 878.62 examples/s]Map:  58%|█████▊    | 124975/216925 [02:32<01:46, 862.53 examples/s]Map:  57%|█████▋    | 124045/216925 [02:33<02:09, 715.12 examples/s]Map:  57%|█████▋    | 123172/216925 [02:32<02:07, 736.01 examples/s]Map:  55%|█████▍    | 118858/216925 [02:33<01:50, 891.08 examples/s]Map:  57%|█████▋    | 124138/216925 [02:33<02:02, 760.23 examples/s]Map:  57%|█████▋    | 123260/216925 [02:32<02:02, 766.74 examples/s]Map:  58%|█████▊    | 125086/216925 [02:32<02:15, 679.95 examples/s]Map:  55%|█████▍    | 118985/216925 [02:33<01:52, 870.73 examples/s]Map:  57%|█████▋    | 123351/216925 [02:32<01:57, 799.68 examples/s]Map:  58%|█████▊    | 125178/216925 [02:32<02:05, 733.83 examples/s]Map:  57%|█████▋    | 124248/216925 [02:33<02:29, 619.10 examples/s]Map:  57%|█████▋    | 123437/216925 [02:32<01:55, 812.72 examples/s]Map:  58%|█████▊    | 125270/216925 [02:32<01:57, 776.86 examples/s]Map:  55%|█████▍    | 119084/216925 [02:34<02:22, 685.41 examples/s]Map:  57%|█████▋    | 124341/216925 [02:33<02:16, 679.01 examples/s]Map:  57%|█████▋    | 123524/216925 [02:32<01:53, 824.55 examples/s]Map:  58%|█████▊    | 125358/216925 [02:32<01:54, 801.09 examples/s]Map:  55%|█████▍    | 119172/216925 [02:34<02:14, 726.25 examples/s]Map:  57%|█████▋    | 124432/216925 [02:34<02:06, 728.80 examples/s]Map:  58%|█████▊    | 125446/216925 [02:32<01:51, 819.22 examples/s]Map:  57%|█████▋    | 123650/216925 [02:32<01:53, 823.79 examples/s]Map:  55%|█████▍    | 119258/216925 [02:34<02:09, 757.08 examples/s]Map:  57%|█████▋    | 124524/216925 [02:34<01:59, 772.21 examples/s]Map:  58%|█████▊    | 125536/216925 [02:33<01:48, 838.62 examples/s]Map:  57%|█████▋    | 123738/216925 [02:33<01:51, 836.93 examples/s]Map:  55%|█████▌    | 119345/216925 [02:34<02:04, 785.07 examples/s]Map:  57%|█████▋    | 124618/216925 [02:34<01:53, 814.26 examples/s]Map:  58%|█████▊    | 125629/216925 [02:33<01:45, 862.77 examples/s]Map:  57%|█████▋    | 123826/216925 [02:33<01:49, 847.30 examples/s]Map:  55%|█████▌    | 119432/216925 [02:34<02:00, 807.29 examples/s]Map:  57%|█████▋    | 124711/216925 [02:34<01:49, 842.79 examples/s]Map:  58%|█████▊    | 125719/216925 [02:33<01:44, 871.10 examples/s]Map:  57%|█████▋    | 123913/216925 [02:33<01:49, 849.96 examples/s]Map:  55%|█████▌    | 119521/216925 [02:34<01:57, 826.89 examples/s]Map:  58%|█████▊    | 124801/216925 [02:34<01:47, 856.26 examples/s]Map:  58%|█████▊    | 125813/216925 [02:33<01:42, 888.39 examples/s]Map:  55%|█████▌    | 119609/216925 [02:34<01:56, 837.35 examples/s]Map:  58%|█████▊    | 124892/216925 [02:34<01:46, 868.20 examples/s]Map:  57%|█████▋    | 124000/216925 [02:33<02:17, 676.99 examples/s]Map:  58%|█████▊    | 125934/216925 [02:33<01:46, 854.47 examples/s]Map:  55%|█████▌    | 119722/216925 [02:34<02:01, 801.44 examples/s]Map:  57%|█████▋    | 124074/216925 [02:33<02:14, 691.34 examples/s]Map:  58%|█████▊    | 125000/216925 [02:34<02:17, 670.60 examples/s]Map:  57%|█████▋    | 124160/216925 [02:33<02:06, 732.91 examples/s]Map:  55%|█████▌    | 119846/216925 [02:34<02:00, 807.96 examples/s]Map:  58%|█████▊    | 125087/216925 [02:34<02:08, 714.62 examples/s]Map:  58%|█████▊    | 126043/216925 [02:33<02:15, 670.09 examples/s]Map:  58%|█████▊    | 125176/216925 [02:34<02:01, 754.41 examples/s]Map:  55%|█████▌    | 119968/216925 [02:35<02:00, 807.32 examples/s]Map:  58%|█████▊    | 126135/216925 [02:33<02:05, 722.70 examples/s]Map:  57%|█████▋    | 124247/216925 [02:33<02:41, 573.75 examples/s]Map:  58%|█████▊    | 125262/216925 [02:35<01:57, 778.41 examples/s]Map:  58%|█████▊    | 126227/216925 [02:33<01:57, 768.80 examples/s]Map:  57%|█████▋    | 124335/216925 [02:33<02:24, 639.76 examples/s]Map:  58%|█████▊    | 125350/216925 [02:35<01:54, 802.45 examples/s]Map:  58%|█████▊    | 126319/216925 [02:34<01:52, 802.79 examples/s]Map:  55%|█████▌    | 120080/216925 [02:35<02:28, 651.79 examples/s]Map:  57%|█████▋    | 124422/216925 [02:34<02:13, 694.27 examples/s]Map:  58%|█████▊    | 125436/216925 [02:35<01:52, 816.19 examples/s]Map:  58%|█████▊    | 126407/216925 [02:34<01:50, 819.16 examples/s]Map:  55%|█████▌    | 120163/216925 [02:35<02:20, 686.78 examples/s]Map:  57%|█████▋    | 124505/216925 [02:34<02:07, 724.75 examples/s]Map:  58%|█████▊    | 125528/216925 [02:35<01:48, 842.19 examples/s]Map:  58%|█████▊    | 126499/216925 [02:34<01:47, 841.13 examples/s]Map:  55%|█████▌    | 120245/216925 [02:35<02:15, 714.82 examples/s]Map:  57%|█████▋    | 124593/216925 [02:34<02:00, 765.31 examples/s]Map:  58%|█████▊    | 125618/216925 [02:35<01:46, 855.93 examples/s]Map:  58%|█████▊    | 126590/216925 [02:34<01:45, 857.25 examples/s]Map:  55%|█████▌    | 120327/216925 [02:35<02:11, 735.43 examples/s]Map:  57%|█████▋    | 124685/216925 [02:34<01:54, 805.34 examples/s]Map:  58%|█████▊    | 126681/216925 [02:34<01:43, 871.69 examples/s]Map:  58%|█████▊    | 125745/216925 [02:35<01:47, 846.67 examples/s]Map:  56%|█████▌    | 120408/216925 [02:35<02:08, 753.52 examples/s]Map:  58%|█████▊    | 124773/216925 [02:34<01:52, 821.71 examples/s]Map:  58%|█████▊    | 126774/216925 [02:34<01:41, 885.31 examples/s]Map:  58%|█████▊    | 125832/216925 [02:35<01:47, 848.39 examples/s]Map:  56%|█████▌    | 120493/216925 [02:35<02:03, 778.54 examples/s]Map:  58%|█████▊    | 124863/216925 [02:34<01:49, 841.12 examples/s]Map:  58%|█████▊    | 126865/216925 [02:34<01:41, 889.88 examples/s]Map:  56%|█████▌    | 120577/216925 [02:35<02:01, 790.31 examples/s]Map:  58%|█████▊    | 124954/216925 [02:34<01:47, 856.34 examples/s]Map:  58%|█████▊    | 125959/216925 [02:35<01:47, 845.41 examples/s]Map:  56%|█████▌    | 120662/216925 [02:36<01:59, 804.66 examples/s]Map:  59%|█████▊    | 127000/216925 [02:34<02:06, 709.83 examples/s]Map:  56%|█████▌    | 120778/216925 [02:36<02:01, 791.68 examples/s]Map:  58%|█████▊    | 125079/216925 [02:34<02:16, 674.81 examples/s]Map:  58%|█████▊    | 126074/216925 [02:36<02:14, 676.39 examples/s]Map:  59%|█████▊    | 127121/216925 [02:35<02:01, 737.00 examples/s]Map:  58%|█████▊    | 126151/216925 [02:36<02:10, 693.62 examples/s]Map:  56%|█████▌    | 120897/216925 [02:36<02:01, 787.21 examples/s]Map:  58%|█████▊    | 125200/216925 [02:35<02:08, 711.67 examples/s]Map:  59%|█████▊    | 127215/216925 [02:35<01:55, 779.70 examples/s]Map:  58%|█████▊    | 126237/216925 [02:36<02:04, 729.62 examples/s]Map:  56%|█████▌    | 120979/216925 [02:36<02:00, 793.16 examples/s]Map:  58%|█████▊    | 125287/216925 [02:35<02:03, 744.14 examples/s]Map:  59%|█████▊    | 127309/216925 [02:35<01:50, 814.44 examples/s]Map:  58%|█████▊    | 126329/216925 [02:36<01:56, 775.49 examples/s]Map:  58%|█████▊    | 125373/216925 [02:35<01:58, 770.22 examples/s]Map:  59%|█████▊    | 127403/216925 [02:35<01:46, 842.89 examples/s]Map:  58%|█████▊    | 126419/216925 [02:36<01:52, 807.12 examples/s]Map:  58%|█████▊    | 125463/216925 [02:35<01:54, 800.47 examples/s]Map:  56%|█████▌    | 121083/216925 [02:36<02:29, 642.99 examples/s]Map:  59%|█████▉    | 127492/216925 [02:35<01:44, 854.97 examples/s]Map:  58%|█████▊    | 126510/216925 [02:36<01:48, 832.76 examples/s]Map:  58%|█████▊    | 125549/216925 [02:35<01:52, 813.36 examples/s]Map:  56%|█████▌    | 121162/216925 [02:36<02:22, 673.76 examples/s]Map:  59%|█████▉    | 127587/216925 [02:35<01:41, 876.58 examples/s]Map:  58%|█████▊    | 126603/216925 [02:36<01:45, 856.92 examples/s]Map:  58%|█████▊    | 125638/216925 [02:35<01:49, 832.29 examples/s]Map:  56%|█████▌    | 121243/216925 [02:36<02:15, 704.08 examples/s]Map:  59%|█████▉    | 127681/216925 [02:35<01:39, 893.13 examples/s]Map:  58%|█████▊    | 126695/216925 [02:36<01:43, 872.16 examples/s]Map:  58%|█████▊    | 125729/216925 [02:35<01:47, 851.58 examples/s]Map:  56%|█████▌    | 121329/216925 [02:37<02:09, 738.08 examples/s]Map:  58%|█████▊    | 126787/216925 [02:36<01:41, 883.72 examples/s]Map:  58%|█████▊    | 125816/216925 [02:35<01:46, 854.77 examples/s]Map:  59%|█████▉    | 127818/216925 [02:35<01:39, 895.49 examples/s]Map:  56%|█████▌    | 121413/216925 [02:37<02:05, 760.94 examples/s]Map:  58%|█████▊    | 126879/216925 [02:37<01:40, 892.47 examples/s]Map:  58%|█████▊    | 125906/216925 [02:35<01:45, 865.47 examples/s]Map:  59%|█████▉    | 127912/216925 [02:35<01:38, 904.99 examples/s]Map:  56%|█████▌    | 121498/216925 [02:37<02:02, 781.08 examples/s]Map:  59%|█████▊    | 126970/216925 [02:37<01:40, 893.01 examples/s]Map:  58%|█████▊    | 125995/216925 [02:35<01:44, 869.61 examples/s]Map:  56%|█████▌    | 121619/216925 [02:37<02:01, 785.18 examples/s]Map:  59%|█████▉    | 128044/216925 [02:36<02:01, 733.42 examples/s]Map:  56%|█████▌    | 121704/216925 [02:37<01:59, 798.67 examples/s]Map:  58%|█████▊    | 126087/216925 [02:36<02:12, 683.47 examples/s]Map:  59%|█████▊    | 127089/216925 [02:37<02:05, 715.52 examples/s]Map:  59%|█████▉    | 128132/216925 [02:36<01:56, 764.31 examples/s]Map:  56%|█████▌    | 121787/216925 [02:37<01:58, 804.04 examples/s]Map:  58%|█████▊    | 126175/216925 [02:36<02:04, 728.73 examples/s]Map:  59%|█████▊    | 127179/216925 [02:37<01:58, 754.90 examples/s]Map:  59%|█████▉    | 128226/216925 [02:36<01:50, 803.52 examples/s]Map:  56%|█████▌    | 121872/216925 [02:37<01:56, 814.26 examples/s]Map:  58%|█████▊    | 126264/216925 [02:36<01:57, 768.33 examples/s]Map:  59%|█████▊    | 127270/216925 [02:37<01:53, 790.41 examples/s]Map:  59%|█████▉    | 128322/216925 [02:36<01:45, 842.14 examples/s]Map:  56%|█████▌    | 121959/216925 [02:37<01:55, 825.03 examples/s]Map:  58%|█████▊    | 126357/216925 [02:36<01:51, 809.71 examples/s]Map:  59%|█████▊    | 127361/216925 [02:37<01:49, 818.79 examples/s]Map:  59%|█████▉    | 128415/216925 [02:36<01:42, 862.65 examples/s]Map:  58%|█████▊    | 126445/216925 [02:36<01:49, 825.75 examples/s]Map:  59%|█████▉    | 127453/216925 [02:37<01:45, 845.38 examples/s]Map:  59%|█████▉    | 128507/216925 [02:36<01:40, 876.27 examples/s]Map:  58%|█████▊    | 126536/216925 [02:36<01:46, 846.34 examples/s]Map:  59%|█████▉    | 127544/216925 [02:37<01:43, 861.12 examples/s]Map:  56%|█████▋    | 122084/216925 [02:38<02:25, 652.82 examples/s]Map:  59%|█████▉    | 128642/216925 [02:36<01:39, 883.10 examples/s]Map:  58%|█████▊    | 126625/216925 [02:36<01:45, 854.69 examples/s]Map:  59%|█████▉    | 127634/216925 [02:37<01:42, 869.14 examples/s]Map:  56%|█████▋    | 122167/216925 [02:38<02:17, 689.06 examples/s]Map:  58%|█████▊    | 126715/216925 [02:36<01:44, 865.16 examples/s]Map:  59%|█████▉    | 127726/216925 [02:38<01:41, 880.93 examples/s]Map:  56%|█████▋    | 122250/216925 [02:38<02:11, 722.15 examples/s]Map:  59%|█████▉    | 128774/216925 [02:36<01:40, 876.95 examples/s]Map:  58%|█████▊    | 126807/216925 [02:36<01:42, 879.36 examples/s]Map:  59%|█████▉    | 127819/216925 [02:38<01:39, 892.52 examples/s]Map:  56%|█████▋    | 122332/216925 [02:38<02:06, 745.53 examples/s]Map:  59%|█████▉    | 128866/216925 [02:37<01:39, 883.90 examples/s]Map:  58%|█████▊    | 126898/216925 [02:37<01:41, 885.44 examples/s]Map:  56%|█████▋    | 122418/216925 [02:38<02:02, 770.98 examples/s]Map:  59%|█████▉    | 128960/216925 [02:37<01:38, 894.96 examples/s]Map:  59%|█████▉    | 127952/216925 [02:38<01:40, 886.59 examples/s]Map:  59%|█████▊    | 126989/216925 [02:37<01:40, 891.48 examples/s]Map:  56%|█████▋    | 122501/216925 [02:38<02:00, 785.30 examples/s]Map:  59%|█████▉    | 128043/216925 [02:38<02:05, 708.02 examples/s]Map:  57%|█████▋    | 122616/216925 [02:38<02:01, 775.13 examples/s]Map:  60%|█████▉    | 129082/216925 [02:37<02:03, 713.38 examples/s]Map:  59%|█████▉    | 128124/216925 [02:38<02:01, 729.96 examples/s]Map:  59%|█████▊    | 127116/216925 [02:37<02:11, 682.67 examples/s]Map:  57%|█████▋    | 122696/216925 [02:38<02:00, 780.84 examples/s]Map:  60%|█████▉    | 129170/216925 [02:37<01:57, 747.74 examples/s]Map:  59%|█████▉    | 128215/216925 [02:38<01:54, 771.80 examples/s]Map:  59%|█████▊    | 127202/216925 [02:37<02:04, 720.77 examples/s]Map:  57%|█████▋    | 122781/216925 [02:38<01:57, 798.70 examples/s]Map:  60%|█████▉    | 129263/216925 [02:37<01:51, 787.60 examples/s]Map:  59%|█████▉    | 128309/216925 [02:38<01:49, 812.07 examples/s]Map:  59%|█████▊    | 127285/216925 [02:37<02:00, 745.58 examples/s]Map:  57%|█████▋    | 122867/216925 [02:39<01:56, 810.69 examples/s]Map:  60%|█████▉    | 129359/216925 [02:37<01:45, 827.87 examples/s]Map:  59%|█████▉    | 128401/216925 [02:38<01:45, 839.30 examples/s]Map:  59%|█████▊    | 127369/216925 [02:37<01:56, 765.95 examples/s]Map:  57%|█████▋    | 122951/216925 [02:39<01:55, 815.45 examples/s]Map:  60%|█████▉    | 129452/216925 [02:37<01:42, 851.96 examples/s]Map:  59%|█████▉    | 128492/216925 [02:39<01:43, 857.60 examples/s]Map:  59%|█████▉    | 127454/216925 [02:37<01:53, 785.52 examples/s]Map:  60%|█████▉    | 129541/216925 [02:37<01:41, 860.70 examples/s]Map:  59%|█████▉    | 128581/216925 [02:39<01:42, 863.27 examples/s]Map:  59%|█████▉    | 127541/216925 [02:37<01:51, 804.46 examples/s]Map:  57%|█████▋    | 123043/216925 [02:39<02:26, 641.33 examples/s]Map:  60%|█████▉    | 129676/216925 [02:38<01:40, 871.67 examples/s]Map:  59%|█████▉    | 128671/216925 [02:39<01:41, 870.69 examples/s]Map:  57%|█████▋    | 123124/216925 [02:39<02:18, 677.47 examples/s]Map:  59%|█████▉    | 127663/216925 [02:38<01:51, 801.76 examples/s]Map:  60%|█████▉    | 129768/216925 [02:38<01:38, 881.75 examples/s]Map:  57%|█████▋    | 123210/216925 [02:39<02:10, 719.79 examples/s]Map:  59%|█████▉    | 128806/216925 [02:39<01:41, 871.84 examples/s]Map:  59%|█████▉    | 127748/216925 [02:38<01:49, 811.36 examples/s]Map:  60%|█████▉    | 129860/216925 [02:38<01:37, 891.70 examples/s]Map:  57%|█████▋    | 123294/216925 [02:39<02:05, 747.80 examples/s]Map:  59%|█████▉    | 128896/216925 [02:39<01:40, 877.49 examples/s]Map:  59%|█████▉    | 127834/216925 [02:38<01:48, 821.96 examples/s]Map:  60%|█████▉    | 129994/216925 [02:38<01:37, 889.90 examples/s]Map:  57%|█████▋    | 123375/216925 [02:39<02:02, 761.95 examples/s]Map:  59%|█████▉    | 128989/216925 [02:39<01:38, 888.42 examples/s]Map:  59%|█████▉    | 127959/216925 [02:38<01:48, 822.72 examples/s]Map:  57%|█████▋    | 123459/216925 [02:39<01:59, 782.63 examples/s]Map:  57%|█████▋    | 123540/216925 [02:39<01:58, 786.07 examples/s]Map:  60%|█████▉    | 129081/216925 [02:39<02:08, 686.19 examples/s]Map:  60%|█████▉    | 130116/216925 [02:38<02:04, 694.70 examples/s]Map:  57%|█████▋    | 123620/216925 [02:40<01:58, 786.29 examples/s]Map:  60%|█████▉    | 129165/216925 [02:39<02:01, 721.70 examples/s]Map:  59%|█████▉    | 128082/216925 [02:38<02:16, 651.32 examples/s]Map:  60%|██████    | 130209/216925 [02:38<01:56, 742.43 examples/s]Map:  57%|█████▋    | 123703/216925 [02:40<01:57, 796.05 examples/s]Map:  60%|█████▉    | 129257/216925 [02:40<01:53, 770.16 examples/s]Map:  59%|█████▉    | 128163/216925 [02:38<02:09, 683.16 examples/s]Map:  60%|██████    | 130302/216925 [02:38<01:50, 782.30 examples/s]Map:  57%|█████▋    | 123784/216925 [02:40<01:56, 798.49 examples/s]Map:  60%|█████▉    | 129346/216925 [02:40<01:49, 800.96 examples/s]Map:  59%|█████▉    | 128250/216925 [02:38<02:02, 722.97 examples/s]Map:  60%|██████    | 130395/216925 [02:38<01:46, 811.87 examples/s]Map:  57%|█████▋    | 123866/216925 [02:40<01:55, 803.54 examples/s]Map:  60%|█████▉    | 129440/216925 [02:40<01:44, 835.36 examples/s]Map:  59%|█████▉    | 128340/216925 [02:39<01:55, 763.84 examples/s]Map:  60%|██████    | 130485/216925 [02:39<01:44, 830.11 examples/s]Map:  60%|█████▉    | 129536/216925 [02:40<01:40, 868.19 examples/s]Map:  59%|█████▉    | 128425/216925 [02:39<01:52, 784.77 examples/s]Map:  60%|██████    | 130575/216925 [02:39<01:41, 847.52 examples/s]Map:  57%|█████▋    | 123985/216925 [02:40<01:56, 795.15 examples/s]Map:  60%|█████▉    | 129629/216925 [02:40<01:38, 882.98 examples/s]Map:  59%|█████▉    | 128508/216925 [02:39<01:51, 793.32 examples/s]Map:  60%|██████    | 130665/216925 [02:39<01:40, 856.84 examples/s]Map:  60%|█████▉    | 129721/216925 [02:40<01:37, 891.08 examples/s]Map:  59%|█████▉    | 128595/216925 [02:39<01:48, 812.27 examples/s]Map:  60%|██████    | 130757/216925 [02:39<01:38, 873.25 examples/s]Map:  57%|█████▋    | 124082/216925 [02:40<02:26, 633.46 examples/s]Map:  59%|█████▉    | 128681/216925 [02:39<01:47, 820.92 examples/s]Map:  60%|██████    | 130849/216925 [02:39<01:37, 884.15 examples/s]Map:  60%|█████▉    | 129855/216925 [02:40<01:37, 888.76 examples/s]Map:  57%|█████▋    | 124169/216925 [02:40<02:15, 684.37 examples/s]Map:  60%|██████    | 130941/216925 [02:39<01:36, 890.63 examples/s]Map:  60%|█████▉    | 129947/216925 [02:40<01:37, 892.57 examples/s]Map:  59%|█████▉    | 128803/216925 [02:39<01:48, 814.00 examples/s]Map:  59%|█████▉    | 128891/216925 [02:39<01:46, 828.67 examples/s]Map:  57%|█████▋    | 124247/216925 [02:41<03:10, 486.60 examples/s]Map:  60%|██████    | 131046/216925 [02:39<02:01, 705.04 examples/s]Map:  60%|█████▉    | 130044/216925 [02:40<02:01, 715.56 examples/s]Map:  57%|█████▋    | 124324/216925 [02:41<02:51, 538.66 examples/s]Map:  60%|██████    | 131127/216925 [02:39<01:57, 727.75 examples/s]Map:  59%|█████▉    | 129000/216925 [02:39<02:14, 651.46 examples/s]Map:  60%|██████    | 130164/216925 [02:41<01:57, 740.12 examples/s]Map:  57%|█████▋    | 124406/216925 [02:41<02:35, 596.85 examples/s]Map:  60%|██████    | 131219/216925 [02:39<01:50, 772.79 examples/s]Map:  60%|█████▉    | 129087/216925 [02:40<02:05, 697.16 examples/s]Map:  60%|██████    | 130257/216925 [02:41<01:50, 781.96 examples/s]Map:  57%|█████▋    | 124491/216925 [02:41<02:21, 653.75 examples/s]Map:  61%|██████    | 131305/216925 [02:40<01:47, 795.08 examples/s]Map:  60%|█████▉    | 129171/216925 [02:40<02:00, 729.35 examples/s]Map:  60%|██████    | 130350/216925 [02:41<01:46, 815.78 examples/s]Map:  61%|██████    | 131402/216925 [02:40<01:41, 840.10 examples/s]Map:  57%|█████▋    | 124577/216925 [02:41<02:11, 701.95 examples/s]Map:  60%|█████▉    | 129251/216925 [02:40<01:57, 745.76 examples/s]Map:  60%|██████    | 130441/216925 [02:41<01:43, 838.28 examples/s]Map:  61%|██████    | 131494/216925 [02:40<01:39, 861.78 examples/s]Map:  57%|█████▋    | 124662/216925 [02:41<02:04, 739.96 examples/s]Map:  60%|█████▉    | 129339/216925 [02:40<01:52, 778.88 examples/s]Map:  60%|██████    | 130530/216925 [02:41<01:41, 851.23 examples/s]Map:  61%|██████    | 131583/216925 [02:40<01:38, 867.10 examples/s]Map:  58%|█████▊    | 124748/216925 [02:41<01:59, 768.79 examples/s]Map:  61%|██████    | 131673/216925 [02:40<01:37, 872.01 examples/s]Map:  58%|█████▊    | 124834/216925 [02:41<01:56, 791.36 examples/s]Map:  60%|█████▉    | 129462/216925 [02:40<01:50, 789.97 examples/s]Map:  60%|██████    | 130662/216925 [02:41<01:40, 855.14 examples/s]Map:  58%|█████▊    | 124924/216925 [02:41<01:52, 817.44 examples/s]Map:  60%|██████    | 130751/216925 [02:41<01:40, 861.03 examples/s]Map:  61%|██████    | 131805/216925 [02:40<01:38, 868.28 examples/s]Map:  60%|█████▉    | 129584/216925 [02:40<01:49, 796.00 examples/s]Map:  60%|██████    | 130841/216925 [02:41<01:39, 868.78 examples/s]Map:  61%|██████    | 131897/216925 [02:40<01:36, 879.09 examples/s]Map:  60%|█████▉    | 129667/216925 [02:40<01:48, 802.04 examples/s]Map:  60%|██████    | 130932/216925 [02:41<01:38, 877.12 examples/s]Map:  58%|█████▊    | 125042/216925 [02:42<02:16, 670.97 examples/s]Map:  61%|██████    | 131986/216925 [02:40<01:36, 881.50 examples/s]Map:  60%|█████▉    | 129750/216925 [02:40<01:48, 805.95 examples/s]Map:  58%|█████▊    | 125135/216925 [02:42<02:05, 729.91 examples/s]Map:  60%|█████▉    | 129839/216925 [02:40<01:45, 824.60 examples/s]Map:  58%|█████▊    | 125227/216925 [02:42<01:58, 776.40 examples/s]Map:  60%|██████    | 131041/216925 [02:42<02:04, 689.21 examples/s]Map:  61%|██████    | 132086/216925 [02:41<02:02, 693.47 examples/s]Map:  60%|█████▉    | 129955/216925 [02:41<01:48, 801.87 examples/s]Map:  60%|██████    | 131124/216925 [02:42<01:59, 719.27 examples/s]Map:  61%|██████    | 132175/216925 [02:41<01:54, 737.09 examples/s]Map:  58%|█████▊    | 125356/216925 [02:42<01:54, 801.60 examples/s]Map:  60%|██████    | 131215/216925 [02:42<01:52, 764.88 examples/s]Map:  61%|██████    | 132268/216925 [02:41<01:48, 782.70 examples/s]Map:  58%|█████▊    | 125449/216925 [02:42<01:50, 831.38 examples/s]Map:  60%|█████▉    | 130040/216925 [02:41<02:15, 639.14 examples/s]Map:  61%|██████    | 131309/216925 [02:42<01:46, 804.50 examples/s]Map:  61%|██████    | 132361/216925 [02:41<01:43, 816.78 examples/s]Map:  58%|█████▊    | 125540/216925 [02:42<01:47, 851.30 examples/s]Map:  60%|█████▉    | 130129/216925 [02:41<02:05, 694.06 examples/s]Map:  61%|██████    | 131399/216925 [02:42<01:43, 827.44 examples/s]Map:  61%|██████    | 132448/216925 [02:41<01:42, 827.20 examples/s]Map:  58%|█████▊    | 125632/216925 [02:42<01:45, 867.43 examples/s]Map:  60%|██████    | 130214/216925 [02:41<01:58, 729.74 examples/s]Map:  61%|██████    | 131491/216925 [02:42<01:40, 851.19 examples/s]Map:  61%|██████    | 132536/216925 [02:41<01:40, 839.07 examples/s]Map:  58%|█████▊    | 125721/216925 [02:42<01:44, 873.22 examples/s]Map:  60%|██████    | 130297/216925 [02:41<01:55, 752.97 examples/s]Map:  61%|██████    | 131582/216925 [02:42<01:38, 866.95 examples/s]Map:  61%|██████    | 132628/216925 [02:41<01:38, 858.68 examples/s]Map:  58%|█████▊    | 125810/216925 [02:43<01:44, 875.94 examples/s]Map:  60%|██████    | 130381/216925 [02:41<01:51, 774.17 examples/s]Map:  61%|██████    | 132716/216925 [02:41<01:37, 863.49 examples/s]Map:  58%|█████▊    | 125902/216925 [02:43<01:43, 883.71 examples/s]Map:  61%|██████    | 131716/216925 [02:42<01:37, 871.69 examples/s]Map:  60%|██████    | 130469/216925 [02:41<01:48, 800.52 examples/s]Map:  61%|██████    | 132809/216925 [02:41<01:35, 881.57 examples/s]Map:  58%|█████▊    | 125996/216925 [02:43<01:41, 896.78 examples/s]Map:  61%|██████    | 131805/216925 [02:43<01:37, 872.66 examples/s]Map:  60%|██████    | 130556/216925 [02:41<01:45, 816.85 examples/s]Map:  61%|██████▏   | 132898/216925 [02:41<01:35, 883.61 examples/s]Map:  61%|██████    | 131897/216925 [02:43<01:36, 883.57 examples/s]Map:  60%|██████    | 130641/216925 [02:42<01:45, 821.53 examples/s]Map:  61%|██████▏   | 132990/216925 [02:42<01:34, 890.94 examples/s]Map:  61%|██████    | 131989/216925 [02:43<01:35, 888.89 examples/s]Map:  60%|██████    | 130730/216925 [02:42<01:42, 839.13 examples/s]Map:  58%|█████▊    | 126133/216925 [02:43<02:05, 724.29 examples/s]Map:  60%|██████    | 130819/216925 [02:42<01:41, 851.62 examples/s]Map:  58%|█████▊    | 126224/216925 [02:43<01:58, 765.81 examples/s]Map:  61%|██████▏   | 133089/216925 [02:42<02:00, 694.59 examples/s]Map:  61%|██████    | 132090/216925 [02:43<01:59, 708.57 examples/s]Map:  60%|██████    | 130907/216925 [02:42<01:40, 856.71 examples/s]Map:  58%|█████▊    | 126313/216925 [02:43<01:54, 794.75 examples/s]Map:  61%|██████▏   | 133178/216925 [02:42<01:53, 737.43 examples/s]Map:  61%|██████    | 132174/216925 [02:43<01:54, 737.71 examples/s]Map:  60%|██████    | 130994/216925 [02:42<01:40, 856.66 examples/s]Map:  58%|█████▊    | 126399/216925 [02:43<01:51, 808.43 examples/s]Map:  61%|██████▏   | 133269/216925 [02:42<01:47, 780.38 examples/s]Map:  61%|██████    | 132261/216925 [02:43<01:50, 769.65 examples/s]Map:  58%|█████▊    | 126488/216925 [02:43<01:49, 827.68 examples/s]Map:  61%|██████▏   | 133358/216925 [02:42<01:43, 806.23 examples/s]Map:  61%|██████    | 132349/216925 [02:43<01:46, 797.85 examples/s]Map:  60%|██████    | 131089/216925 [02:42<02:06, 679.75 examples/s]Map:  58%|█████▊    | 126577/216925 [02:43<01:47, 841.74 examples/s]Map:  62%|██████▏   | 133451/216925 [02:42<01:39, 836.56 examples/s]Map:  61%|██████    | 132440/216925 [02:43<01:42, 826.89 examples/s]Map:  60%|██████    | 131182/216925 [02:42<01:56, 737.91 examples/s]Map:  58%|█████▊    | 126667/216925 [02:44<01:45, 856.83 examples/s]Map:  62%|██████▏   | 133541/216925 [02:42<01:37, 852.37 examples/s]Map:  61%|██████    | 132532/216925 [02:43<01:39, 851.75 examples/s]Map:  61%|██████    | 131272/216925 [02:42<01:50, 777.13 examples/s]Map:  58%|█████▊    | 126757/216925 [02:44<01:44, 866.41 examples/s]Map:  62%|██████▏   | 133629/216925 [02:42<01:37, 856.56 examples/s]Map:  61%|██████    | 132626/216925 [02:44<01:36, 875.32 examples/s]Map:  61%|██████    | 131359/216925 [02:42<01:46, 801.59 examples/s]Map:  58%|█████▊    | 126847/216925 [02:44<01:43, 872.27 examples/s]Map:  62%|██████▏   | 133718/216925 [02:42<01:36, 863.61 examples/s]Map:  61%|██████    | 132720/216925 [02:44<01:34, 890.80 examples/s]Map:  61%|██████    | 131447/216925 [02:43<01:44, 821.70 examples/s]Map:  59%|█████▊    | 126936/216925 [02:44<01:42, 876.34 examples/s]Map:  62%|██████▏   | 133811/216925 [02:43<01:34, 881.12 examples/s]Map:  61%|██████    | 132811/216925 [02:44<01:34, 893.54 examples/s]Map:  61%|██████    | 131537/216925 [02:43<01:41, 841.81 examples/s]Map:  62%|██████▏   | 133905/216925 [02:43<01:32, 893.30 examples/s]Map:  61%|██████▏   | 132903/216925 [02:44<01:33, 897.66 examples/s]Map:  61%|██████    | 131627/216925 [02:43<01:39, 854.16 examples/s]Map:  59%|█████▊    | 127043/216925 [02:44<02:09, 694.25 examples/s]Map:  62%|██████▏   | 133996/216925 [02:43<01:32, 896.53 examples/s]Map:  61%|██████    | 131717/216925 [02:43<01:38, 863.90 examples/s]Map:  59%|█████▊    | 127136/216925 [02:44<02:00, 748.03 examples/s]Map:  61%|██████▏   | 133000/216925 [02:44<02:01, 691.37 examples/s]Map:  61%|██████    | 131806/216925 [02:43<01:38, 865.79 examples/s]Map:  59%|█████▊    | 127229/216925 [02:44<01:53, 789.03 examples/s]Map:  62%|██████▏   | 134091/216925 [02:43<01:58, 698.21 examples/s]Map:  61%|██████▏   | 133090/216925 [02:44<01:53, 739.70 examples/s]Map:  61%|██████    | 131895/216925 [02:43<01:37, 870.15 examples/s]Map:  59%|█████▊    | 127320/216925 [02:44<01:49, 820.01 examples/s]Map:  62%|██████▏   | 134188/216925 [02:43<01:48, 761.56 examples/s]Map:  61%|██████▏   | 133181/216925 [02:44<01:47, 782.02 examples/s]Map:  61%|██████    | 131984/216925 [02:43<01:37, 871.96 examples/s]Map:  62%|██████▏   | 134271/216925 [02:43<01:46, 778.09 examples/s]Map:  59%|█████▊    | 127428/216925 [02:45<01:54, 779.81 examples/s]Map:  61%|██████▏   | 133265/216925 [02:44<01:45, 793.91 examples/s]Map:  62%|██████▏   | 134362/216925 [02:43<01:41, 811.71 examples/s]Map:  59%|█████▉    | 127512/216925 [02:45<01:52, 792.62 examples/s]Map:  61%|██████▏   | 133354/216925 [02:45<01:41, 820.15 examples/s]Map:  61%|██████    | 132091/216925 [02:43<02:03, 686.79 examples/s]Map:  62%|██████▏   | 134450/216925 [02:43<01:39, 830.14 examples/s]Map:  59%|█████▉    | 127603/216925 [02:45<01:48, 820.85 examples/s]Map:  62%|██████▏   | 133445/216925 [02:45<01:39, 842.97 examples/s]Map:  61%|██████    | 132190/216925 [02:43<01:52, 755.33 examples/s]Map:  62%|██████▏   | 134540/216925 [02:43<01:37, 848.05 examples/s]Map:  59%|█████▉    | 127696/216925 [02:45<01:45, 847.78 examples/s]Map:  62%|██████▏   | 133537/216925 [02:45<01:36, 864.08 examples/s]Map:  61%|██████    | 132281/216925 [02:44<01:47, 790.56 examples/s]Map:  62%|██████▏   | 134634/216925 [02:44<01:34, 872.48 examples/s]Map:  59%|█████▉    | 127783/216925 [02:45<01:44, 851.54 examples/s]Map:  62%|██████▏   | 133628/216925 [02:45<01:35, 875.18 examples/s]Map:  61%|██████    | 132374/216925 [02:44<01:42, 822.85 examples/s]Map:  62%|██████▏   | 134725/216925 [02:44<01:33, 880.72 examples/s]Map:  59%|█████▉    | 127874/216925 [02:45<01:42, 867.94 examples/s]Map:  62%|██████▏   | 133723/216925 [02:45<01:33, 891.74 examples/s]Map:  61%|██████    | 132461/216925 [02:44<01:41, 832.42 examples/s]Map:  62%|██████▏   | 134817/216925 [02:44<01:32, 888.48 examples/s]Map:  59%|█████▉    | 127965/216925 [02:45<01:41, 876.05 examples/s]Map:  62%|██████▏   | 133815/216925 [02:45<01:32, 898.19 examples/s]Map:  61%|██████    | 132551/216925 [02:44<01:39, 847.29 examples/s]Map:  62%|██████▏   | 134953/216925 [02:44<01:31, 892.31 examples/s]Map:  61%|██████    | 132643/216925 [02:44<01:37, 866.23 examples/s]Map:  62%|██████▏   | 133952/216925 [02:45<01:32, 898.33 examples/s]Map:  59%|█████▉    | 128091/216925 [02:45<02:05, 709.73 examples/s]Map:  61%|██████    | 132733/216925 [02:44<01:36, 874.54 examples/s]Map:  59%|█████▉    | 128185/216925 [02:45<01:56, 760.43 examples/s]Map:  62%|██████▏   | 134044/216925 [02:45<01:56, 713.70 examples/s]Map:  62%|██████▏   | 135078/216925 [02:44<01:56, 705.56 examples/s]Map:  61%|██████    | 132856/216925 [02:44<01:38, 850.99 examples/s]Map:  59%|█████▉    | 128274/216925 [02:46<01:52, 791.35 examples/s]Map:  62%|██████▏   | 134136/216925 [02:45<01:49, 758.87 examples/s]Map:  61%|██████▏   | 132945/216925 [02:44<01:37, 857.72 examples/s]Map:  59%|█████▉    | 128365/216925 [02:46<01:48, 819.91 examples/s]Map:  62%|██████▏   | 135177/216925 [02:44<01:58, 689.42 examples/s]Map:  62%|██████▏   | 134225/216925 [02:46<01:44, 789.48 examples/s]Map:  62%|██████▏   | 134310/216925 [02:46<01:43, 799.86 examples/s]Map:  59%|█████▉    | 128491/216925 [02:46<01:47, 820.92 examples/s]Map:  62%|██████▏   | 135281/216925 [02:45<01:58, 687.88 examples/s]Map:  61%|██████▏   | 133042/216925 [02:45<02:03, 677.74 examples/s]Map:  62%|██████▏   | 134401/216925 [02:46<01:39, 828.32 examples/s]Map:  59%|█████▉    | 128581/216925 [02:46<01:45, 839.11 examples/s]Map:  62%|██████▏   | 135373/216925 [02:45<01:50, 735.69 examples/s]Map:  61%|██████▏   | 133135/216925 [02:45<01:54, 731.85 examples/s]Map:  62%|██████▏   | 134491/216925 [02:46<01:37, 845.89 examples/s]Map:  59%|█████▉    | 128670/216925 [02:46<01:43, 849.94 examples/s]Map:  62%|██████▏   | 135462/216925 [02:45<01:45, 770.05 examples/s]Map:  61%|██████▏   | 133223/216925 [02:45<01:49, 766.75 examples/s]Map:  62%|██████▏   | 134581/216925 [02:46<01:35, 859.26 examples/s]Map:  62%|██████▏   | 135553/216925 [02:45<01:41, 802.43 examples/s]Map:  59%|█████▉    | 128759/216925 [02:46<01:43, 853.73 examples/s]Map:  61%|██████▏   | 133312/216925 [02:45<01:44, 797.98 examples/s]Map:  62%|██████▏   | 134672/216925 [02:46<01:34, 871.80 examples/s]Map:  63%|██████▎   | 135644/216925 [02:45<01:38, 829.15 examples/s]Map:  59%|█████▉    | 128850/216925 [02:46<01:41, 864.43 examples/s]Map:  61%|██████▏   | 133399/216925 [02:45<01:42, 814.44 examples/s]Map:  63%|██████▎   | 135732/216925 [02:45<01:36, 841.27 examples/s]Map:  59%|█████▉    | 128943/216925 [02:46<01:39, 880.38 examples/s]Map:  62%|██████▏   | 134804/216925 [02:46<01:34, 871.98 examples/s]Map:  62%|██████▏   | 133490/216925 [02:45<01:39, 839.70 examples/s]Map:  63%|██████▎   | 135820/216925 [02:45<01:35, 849.95 examples/s]Map:  62%|██████▏   | 134898/216925 [02:46<01:32, 886.61 examples/s]Map:  62%|██████▏   | 133621/216925 [02:45<01:38, 847.37 examples/s]Map:  59%|█████▉    | 129045/216925 [02:47<02:05, 699.83 examples/s]Map:  62%|██████▏   | 134989/216925 [02:46<01:32, 889.82 examples/s]Map:  63%|██████▎   | 135945/216925 [02:45<01:36, 842.85 examples/s]Map:  62%|██████▏   | 133714/216925 [02:45<01:36, 866.43 examples/s]Map:  60%|█████▉    | 129132/216925 [02:47<01:58, 738.89 examples/s]Map:  62%|██████▏   | 133802/216925 [02:45<01:35, 868.14 examples/s]Map:  60%|█████▉    | 129225/216925 [02:47<01:51, 783.46 examples/s]Map:  62%|██████▏   | 135090/216925 [02:47<01:55, 706.57 examples/s]Map:  63%|██████▎   | 136043/216925 [02:45<01:59, 679.21 examples/s]Map:  62%|██████▏   | 133896/216925 [02:45<01:34, 883.06 examples/s]Map:  60%|█████▉    | 129314/216925 [02:47<01:48, 810.62 examples/s]Map:  62%|██████▏   | 135181/216925 [02:47<01:48, 752.56 examples/s]Map:  63%|██████▎   | 136132/216925 [02:46<01:51, 724.84 examples/s]Map:  60%|█████▉    | 129405/216925 [02:47<01:44, 837.22 examples/s]Map:  62%|██████▏   | 135273/216925 [02:47<01:43, 790.53 examples/s]Map:  63%|██████▎   | 136220/216925 [02:46<01:46, 760.22 examples/s]Map:  62%|██████▏   | 134000/216925 [02:46<01:58, 699.54 examples/s]Map:  60%|█████▉    | 129493/216925 [02:47<01:43, 848.54 examples/s]Map:  62%|██████▏   | 135361/216925 [02:47<01:40, 812.26 examples/s]Map:  63%|██████▎   | 136308/216925 [02:46<01:42, 789.64 examples/s]Map:  62%|██████▏   | 134088/216925 [02:46<01:51, 739.67 examples/s]Map:  60%|█████▉    | 129587/216925 [02:47<01:40, 871.45 examples/s]Map:  62%|██████▏   | 135455/216925 [02:47<01:36, 844.34 examples/s]Map:  63%|██████▎   | 136398/216925 [02:46<01:39, 813.07 examples/s]Map:  62%|██████▏   | 134178/216925 [02:46<01:46, 779.06 examples/s]Map:  60%|█████▉    | 129680/216925 [02:47<01:38, 887.29 examples/s]Map:  62%|██████▏   | 135545/216925 [02:47<01:34, 857.00 examples/s]Map:  63%|██████▎   | 136488/216925 [02:46<01:36, 835.71 examples/s]Map:  62%|██████▏   | 134270/216925 [02:46<01:41, 812.73 examples/s]Map:  60%|█████▉    | 129770/216925 [02:47<01:38, 885.03 examples/s]Map:  63%|██████▎   | 135635/216925 [02:47<01:33, 867.90 examples/s]Map:  63%|██████▎   | 136578/216925 [02:46<01:34, 850.35 examples/s]Map:  62%|██████▏   | 134357/216925 [02:46<01:39, 825.77 examples/s]Map:  60%|█████▉    | 129862/216925 [02:47<01:37, 893.52 examples/s]Map:  63%|██████▎   | 135727/216925 [02:47<01:32, 879.69 examples/s]Map:  63%|██████▎   | 136670/216925 [02:46<01:32, 865.99 examples/s]Map:  62%|██████▏   | 134445/216925 [02:46<01:38, 839.80 examples/s]Map:  63%|██████▎   | 135819/216925 [02:47<01:31, 887.72 examples/s]Map:  60%|█████▉    | 129997/216925 [02:48<01:37, 890.28 examples/s]Map:  63%|██████▎   | 136762/216925 [02:46<01:31, 876.94 examples/s]Map:  62%|██████▏   | 134534/216925 [02:46<01:36, 852.02 examples/s]Map:  63%|██████▎   | 136853/216925 [02:46<01:30, 882.28 examples/s]Map:  63%|██████▎   | 135951/216925 [02:48<01:31, 882.72 examples/s]Map:  62%|██████▏   | 134626/216925 [02:46<01:34, 867.61 examples/s]Map:  60%|█████▉    | 130091/216925 [02:48<02:01, 716.26 examples/s]Map:  63%|██████▎   | 136943/216925 [02:46<01:30, 884.26 examples/s]Map:  62%|██████▏   | 134715/216925 [02:47<01:34, 871.32 examples/s]Map:  60%|██████    | 130184/216925 [02:48<01:53, 762.59 examples/s]Map:  63%|██████▎   | 136045/216925 [02:48<01:55, 702.26 examples/s]Map:  62%|██████▏   | 134804/216925 [02:47<01:34, 870.98 examples/s]Map:  60%|██████    | 130278/216925 [02:48<01:47, 804.51 examples/s]Map:  63%|██████▎   | 137045/216925 [02:47<01:54, 697.93 examples/s]Map:  63%|██████▎   | 136132/216925 [02:48<01:49, 739.36 examples/s]Map:  62%|██████▏   | 134939/216925 [02:47<01:33, 879.72 examples/s]Map:  60%|██████    | 130369/216925 [02:48<01:44, 830.99 examples/s]Map:  63%|██████▎   | 137136/216925 [02:47<01:46, 747.05 examples/s]Map:  63%|██████▎   | 136222/216925 [02:48<01:43, 776.18 examples/s]Map:  63%|██████▎   | 137223/216925 [02:47<01:42, 776.03 examples/s]Map:  63%|██████▎   | 136304/216925 [02:48<01:42, 784.49 examples/s]Map:  60%|██████    | 130495/216925 [02:48<01:44, 829.23 examples/s]Map:  62%|██████▏   | 135043/216925 [02:47<01:58, 689.44 examples/s]Map:  63%|██████▎   | 136389/216925 [02:48<01:40, 801.17 examples/s]Map:  60%|██████    | 130583/216925 [02:48<01:42, 839.06 examples/s]Map:  63%|██████▎   | 137351/216925 [02:47<01:39, 801.17 examples/s]Map:  62%|██████▏   | 135131/216925 [02:47<01:52, 729.51 examples/s]Map:  63%|██████▎   | 136482/216925 [02:48<01:36, 834.63 examples/s]Map:  63%|██████▎   | 137442/216925 [02:47<01:36, 827.05 examples/s]Map:  60%|██████    | 130711/216925 [02:49<01:42, 840.62 examples/s]Map:  62%|██████▏   | 135220/216925 [02:47<01:46, 765.74 examples/s]Map:  63%|██████▎   | 136576/216925 [02:48<01:33, 860.36 examples/s]Map:  63%|██████▎   | 137533/216925 [02:47<01:33, 847.46 examples/s]Map:  60%|██████    | 130799/216925 [02:49<01:41, 846.47 examples/s]Map:  62%|██████▏   | 135312/216925 [02:47<01:41, 802.55 examples/s]Map:  63%|██████▎   | 136670/216925 [02:49<01:31, 881.49 examples/s]Map:  63%|██████▎   | 137626/216925 [02:47<01:31, 867.33 examples/s]Map:  62%|██████▏   | 135401/216925 [02:47<01:39, 822.90 examples/s]Map:  63%|██████▎   | 136764/216925 [02:49<01:29, 896.43 examples/s]Map:  60%|██████    | 130925/216925 [02:49<01:42, 840.86 examples/s]Map:  63%|██████▎   | 137718/216925 [02:47<01:30, 879.68 examples/s]Map:  62%|██████▏   | 135491/216925 [02:48<01:37, 838.74 examples/s]Map:  63%|██████▎   | 136858/216925 [02:49<01:28, 905.25 examples/s]Map:  64%|██████▎   | 137810/216925 [02:48<01:28, 889.36 examples/s]Map:  63%|██████▎   | 135582/216925 [02:48<01:34, 857.50 examples/s]Map:  63%|██████▎   | 136993/216925 [02:49<01:28, 901.18 examples/s]Map:  60%|██████    | 131042/216925 [02:49<02:07, 674.39 examples/s]Map:  64%|██████▎   | 137923/216925 [02:48<01:34, 832.14 examples/s]Map:  63%|██████▎   | 135711/216925 [02:48<01:34, 855.80 examples/s]Map:  60%|██████    | 131124/216925 [02:49<02:02, 701.44 examples/s]Map:  63%|██████▎   | 135800/216925 [02:48<01:34, 861.89 examples/s]Map:  63%|██████▎   | 137089/216925 [02:49<01:51, 716.19 examples/s]Map:  60%|██████    | 131206/216925 [02:49<01:57, 727.44 examples/s]Map:  63%|██████▎   | 135888/216925 [02:48<01:33, 864.85 examples/s]Map:  63%|██████▎   | 137185/216925 [02:49<01:43, 769.28 examples/s]Map:  64%|██████▎   | 138040/216925 [02:48<02:04, 633.84 examples/s]Map:  61%|██████    | 131288/216925 [02:49<01:54, 746.56 examples/s]Map:  63%|██████▎   | 135977/216925 [02:48<01:33, 869.52 examples/s]Map:  63%|██████▎   | 137270/216925 [02:49<01:41, 787.52 examples/s]Map:  64%|██████▎   | 138131/216925 [02:48<01:54, 689.56 examples/s]Map:  61%|██████    | 131375/216925 [02:49<01:50, 776.05 examples/s]Map:  63%|██████▎   | 137361/216925 [02:49<01:37, 817.94 examples/s]Map:  64%|██████▎   | 138218/216925 [02:48<01:47, 729.95 examples/s]Map:  61%|██████    | 131457/216925 [02:50<01:48, 785.78 examples/s]Map:  63%|██████▎   | 137454/216925 [02:49<01:33, 846.08 examples/s]Map:  63%|██████▎   | 136085/216925 [02:48<01:58, 682.42 examples/s]Map:  64%|██████▍   | 138312/216925 [02:48<01:41, 777.33 examples/s]Map:  61%|██████    | 131550/216925 [02:50<01:43, 824.93 examples/s]Map:  63%|██████▎   | 137546/216925 [02:50<01:32, 861.71 examples/s]Map:  63%|██████▎   | 136174/216925 [02:48<01:50, 730.04 examples/s]Map:  64%|██████▍   | 138399/216925 [02:48<01:38, 801.14 examples/s]Map:  61%|██████    | 131672/216925 [02:50<01:44, 818.57 examples/s]Map:  63%|██████▎   | 137670/216925 [02:50<01:33, 846.20 examples/s]Map:  64%|██████▍   | 138526/216925 [02:49<01:36, 814.03 examples/s]Map:  63%|██████▎   | 136298/216925 [02:49<01:46, 755.82 examples/s]Map:  61%|██████    | 131801/216925 [02:50<01:42, 830.89 examples/s]Map:  64%|██████▎   | 137760/216925 [02:50<01:32, 858.69 examples/s]Map:  64%|██████▍   | 138614/216925 [02:49<01:34, 830.51 examples/s]Map:  63%|██████▎   | 136385/216925 [02:49<01:43, 780.91 examples/s]Map:  61%|██████    | 131888/216925 [02:50<01:41, 839.99 examples/s]Map:  64%|██████▎   | 137848/216925 [02:50<01:31, 860.16 examples/s]Map:  64%|██████▍   | 138703/216925 [02:49<01:32, 843.96 examples/s]Map:  63%|██████▎   | 136479/216925 [02:49<01:38, 819.60 examples/s]Map:  61%|██████    | 131978/216925 [02:50<01:39, 852.67 examples/s]Map:  64%|██████▎   | 137938/216925 [02:50<01:30, 870.09 examples/s]Map:  64%|██████▍   | 138790/216925 [02:49<01:32, 847.05 examples/s]Map:  63%|██████▎   | 136565/216925 [02:49<01:37, 828.28 examples/s]Map:  64%|██████▍   | 138880/216925 [02:49<01:30, 858.53 examples/s]Map:  63%|██████▎   | 136655/216925 [02:49<01:34, 845.65 examples/s]Map:  61%|██████    | 132088/216925 [02:50<02:03, 685.40 examples/s]Map:  64%|██████▍   | 138969/216925 [02:49<01:30, 865.70 examples/s]Map:  63%|██████▎   | 136744/216925 [02:49<01:33, 856.62 examples/s]Map:  64%|██████▎   | 138045/216925 [02:50<01:53, 694.60 examples/s]Map:  61%|██████    | 132180/216925 [02:50<01:55, 733.21 examples/s]Map:  63%|██████▎   | 136834/216925 [02:49<01:32, 866.39 examples/s]Map:  64%|██████▎   | 138137/216925 [02:50<01:45, 743.77 examples/s]Map:  63%|██████▎   | 136926/216925 [02:49<01:31, 878.83 examples/s]Map:  64%|██████▎   | 138226/216925 [02:50<01:40, 779.26 examples/s]Map:  64%|██████▍   | 139086/216925 [02:49<01:54, 681.07 examples/s]Map:  61%|██████    | 132274/216925 [02:51<02:02, 693.11 examples/s]Map:  64%|██████▍   | 138318/216925 [02:51<01:36, 813.60 examples/s]Map:  64%|██████▍   | 139179/216925 [02:49<01:45, 735.52 examples/s]Map:  61%|██████    | 132353/216925 [02:51<01:58, 713.90 examples/s]Map:  64%|██████▍   | 138409/216925 [02:51<01:33, 836.18 examples/s]Map:  63%|██████▎   | 137044/216925 [02:49<01:54, 698.08 examples/s]Map:  64%|██████▍   | 139268/216925 [02:49<01:40, 770.07 examples/s]Map:  61%|██████    | 132437/216925 [02:51<01:53, 743.97 examples/s]Map:  64%|██████▍   | 138503/216925 [02:51<01:31, 860.76 examples/s]Map:  63%|██████▎   | 137135/216925 [02:50<01:46, 746.97 examples/s]Map:  64%|██████▍   | 139353/216925 [02:50<01:38, 788.97 examples/s]Map:  61%|██████    | 132524/216925 [02:51<01:49, 774.03 examples/s]Map:  63%|██████▎   | 137224/216925 [02:50<01:41, 781.46 examples/s]Map:  64%|██████▍   | 139440/216925 [02:50<01:35, 809.68 examples/s]Map:  61%|██████    | 132610/216925 [02:51<01:46, 794.96 examples/s]Map:  64%|██████▍   | 138639/216925 [02:51<01:29, 872.76 examples/s]Map:  63%|██████▎   | 137347/216925 [02:50<01:40, 792.93 examples/s]Map:  64%|██████▍   | 139557/216925 [02:50<01:37, 794.41 examples/s]Map:  61%|██████    | 132729/216925 [02:51<01:46, 792.66 examples/s]Map:  64%|██████▍   | 138763/216925 [02:51<01:31, 854.75 examples/s]Map:  63%|██████▎   | 137433/216925 [02:50<01:38, 806.38 examples/s]Map:  64%|██████▍   | 139645/216925 [02:50<01:35, 813.42 examples/s]Map:  61%|██████    | 132818/216925 [02:51<01:43, 816.13 examples/s]Map:  64%|██████▍   | 138855/216925 [02:51<01:29, 870.71 examples/s]Map:  63%|██████▎   | 137521/216925 [02:50<01:36, 823.07 examples/s]Map:  64%|██████▍   | 139730/216925 [02:50<01:33, 821.98 examples/s]Map:  61%|██████▏   | 132905/216925 [02:51<01:41, 828.40 examples/s]Map:  64%|██████▍   | 138945/216925 [02:51<01:29, 875.52 examples/s]Map:  63%|██████▎   | 137610/216925 [02:50<01:34, 838.92 examples/s]Map:  64%|██████▍   | 139816/216925 [02:50<01:32, 829.45 examples/s]Map:  61%|██████▏   | 132993/216925 [02:51<01:39, 839.50 examples/s]Map:  63%|██████▎   | 137703/216925 [02:50<01:31, 862.61 examples/s]Map:  64%|██████▍   | 139903/216925 [02:50<01:31, 839.68 examples/s]Map:  64%|██████▍   | 139044/216925 [02:51<01:50, 702.68 examples/s]Map:  64%|██████▎   | 137791/216925 [02:50<01:31, 866.19 examples/s]Map:  65%|██████▍   | 139991/216925 [02:50<01:30, 847.62 examples/s]Map:  61%|██████▏   | 133084/216925 [02:52<02:08, 654.45 examples/s]Map:  64%|██████▍   | 139137/216925 [02:52<01:43, 752.96 examples/s]Map:  64%|██████▎   | 137880/216925 [02:50<01:30, 869.44 examples/s]Map:  61%|██████▏   | 133175/216925 [02:52<01:57, 710.85 examples/s]Map:  64%|██████▍   | 139230/216925 [02:52<01:37, 793.36 examples/s]Map:  64%|██████▎   | 137969/216925 [02:51<01:30, 870.72 examples/s]Map:  65%|██████▍   | 140087/216925 [02:51<01:56, 660.46 examples/s]Map:  61%|██████▏   | 133261/216925 [02:52<01:51, 747.72 examples/s]Map:  64%|██████▍   | 139321/216925 [02:52<01:34, 821.06 examples/s]Map:  65%|██████▍   | 140178/216925 [02:51<01:46, 717.83 examples/s]Map:  61%|██████▏   | 133347/216925 [02:52<01:47, 776.05 examples/s]Map:  64%|██████▍   | 139412/216925 [02:52<01:32, 842.03 examples/s]Map:  65%|██████▍   | 140267/216925 [02:51<01:41, 758.12 examples/s]Map:  62%|██████▏   | 133432/216925 [02:52<01:45, 793.94 examples/s]Map:  64%|██████▎   | 138090/216925 [02:51<01:52, 700.21 examples/s]Map:  64%|██████▍   | 139504/216925 [02:52<01:29, 861.56 examples/s]Map:  65%|██████▍   | 140359/216925 [02:51<01:35, 798.45 examples/s]Map:  62%|██████▏   | 133519/216925 [02:52<01:42, 813.22 examples/s]Map:  64%|██████▎   | 138179/216925 [02:51<01:46, 741.09 examples/s]Map:  64%|██████▍   | 139595/216925 [02:52<01:28, 873.38 examples/s]Map:  65%|██████▍   | 140449/216925 [02:51<01:32, 823.18 examples/s]Map:  62%|██████▏   | 133605/216925 [02:52<01:41, 822.69 examples/s]Map:  64%|██████▎   | 138266/216925 [02:51<01:41, 771.65 examples/s]Map:  64%|██████▍   | 139684/216925 [02:52<01:28, 876.27 examples/s]Map:  62%|██████▏   | 133691/216925 [02:52<01:40, 831.11 examples/s]Map:  65%|██████▍   | 140536/216925 [02:51<01:31, 832.03 examples/s]Map:  64%|██████▍   | 138354/216925 [02:51<01:38, 797.51 examples/s]Map:  64%|██████▍   | 139812/216925 [02:52<01:29, 861.20 examples/s]Map:  62%|██████▏   | 133804/216925 [02:53<01:44, 796.32 examples/s]Map:  65%|██████▍   | 140658/216925 [02:51<01:32, 820.28 examples/s]Map:  64%|██████▍   | 138471/216925 [02:51<01:39, 787.88 examples/s]Map:  65%|██████▍   | 139943/216925 [02:52<01:29, 863.26 examples/s]Map:  65%|██████▍   | 140743/216925 [02:51<01:32, 826.29 examples/s]Map:  62%|██████▏   | 133892/216925 [02:53<01:41, 815.53 examples/s]Map:  64%|██████▍   | 138563/216925 [02:51<01:35, 817.37 examples/s]Map:  65%|██████▍   | 140831/216925 [02:51<01:30, 838.40 examples/s]Map:  62%|██████▏   | 133980/216925 [02:53<01:40, 827.23 examples/s]Map:  64%|██████▍   | 138653/216925 [02:51<01:33, 837.87 examples/s]Map:  65%|██████▍   | 140045/216925 [02:53<01:48, 707.09 examples/s]Map:  65%|██████▍   | 140921/216925 [02:52<01:29, 848.91 examples/s]Map:  64%|██████▍   | 138744/216925 [02:52<01:31, 855.33 examples/s]Map:  65%|██████▍   | 140132/216925 [02:53<01:43, 741.92 examples/s]Map:  64%|██████▍   | 138836/216925 [02:52<01:29, 872.24 examples/s]Map:  62%|██████▏   | 134081/216925 [02:53<02:07, 651.94 examples/s]Map:  65%|██████▍   | 140222/216925 [02:53<01:38, 778.79 examples/s]Map:  64%|██████▍   | 138925/216925 [02:52<01:29, 873.48 examples/s]Map:  62%|██████▏   | 134168/216925 [02:53<01:58, 700.56 examples/s]Map:  65%|██████▌   | 141040/216925 [02:52<01:50, 684.12 examples/s]Map:  65%|██████▍   | 140312/216925 [02:53<01:34, 806.80 examples/s]Map:  62%|██████▏   | 134254/216925 [02:53<01:51, 739.17 examples/s]Map:  65%|██████▌   | 141132/216925 [02:52<01:42, 736.45 examples/s]Map:  65%|██████▍   | 140401/216925 [02:53<01:32, 827.40 examples/s]Map:  62%|██████▏   | 134342/216925 [02:53<01:47, 770.46 examples/s]Map:  64%|██████▍   | 139044/216925 [02:52<01:50, 706.51 examples/s]Map:  65%|██████▌   | 141225/216925 [02:52<01:36, 782.42 examples/s]Map:  65%|██████▍   | 140497/216925 [02:53<01:28, 862.08 examples/s]Map:  62%|██████▏   | 134428/216925 [02:53<01:44, 791.40 examples/s]Map:  64%|██████▍   | 139135/216925 [02:52<01:43, 750.17 examples/s]Map:  65%|██████▌   | 141315/216925 [02:52<01:33, 811.19 examples/s]Map:  65%|██████▍   | 140586/216925 [02:53<01:27, 868.41 examples/s]Map:  62%|██████▏   | 134514/216925 [02:53<01:42, 807.10 examples/s]Map:  65%|██████▌   | 141403/216925 [02:52<01:31, 828.16 examples/s]Map:  64%|██████▍   | 139226/216925 [02:52<01:38, 786.61 examples/s]Map:  65%|██████▍   | 140679/216925 [02:53<01:26, 882.90 examples/s]Map:  62%|██████▏   | 134598/216925 [02:54<01:40, 815.52 examples/s]Map:  65%|██████▌   | 141494/216925 [02:52<01:28, 847.81 examples/s]Map:  64%|██████▍   | 139312/216925 [02:52<01:36, 804.10 examples/s]Map:  62%|██████▏   | 134687/216925 [02:54<01:38, 833.49 examples/s]Map:  65%|██████▍   | 140813/216925 [02:54<01:26, 883.83 examples/s]Map:  65%|██████▌   | 141582/216925 [02:52<01:28, 855.17 examples/s]Map:  64%|██████▍   | 139400/216925 [02:52<01:34, 822.46 examples/s]Map:  65%|██████▍   | 140903/216925 [02:54<01:26, 882.54 examples/s]Map:  65%|██████▌   | 141675/216925 [02:52<01:26, 874.33 examples/s]Map:  64%|██████▍   | 139485/216925 [02:52<01:33, 828.47 examples/s]Map:  62%|██████▏   | 134808/216925 [02:54<01:40, 817.77 examples/s]Map:  64%|██████▍   | 139570/216925 [02:53<01:33, 830.84 examples/s]Map:  62%|██████▏   | 134893/216925 [02:54<01:39, 822.28 examples/s]Map:  65%|██████▌   | 141807/216925 [02:53<01:26, 872.71 examples/s]Map:  65%|██████▍   | 141000/216925 [02:54<01:48, 701.30 examples/s]Map:  64%|██████▍   | 139660/216925 [02:53<01:31, 847.81 examples/s]Map:  62%|██████▏   | 134979/216925 [02:54<01:38, 831.15 examples/s]Map:  65%|██████▌   | 141899/216925 [02:53<01:25, 880.14 examples/s]Map:  65%|██████▌   | 141094/216925 [02:54<01:40, 754.83 examples/s]Map:  64%|██████▍   | 139749/216925 [02:53<01:30, 857.46 examples/s]Map:  65%|██████▌   | 141993/216925 [02:53<01:23, 894.95 examples/s]Map:  65%|██████▌   | 141188/216925 [02:54<01:34, 797.78 examples/s]Map:  64%|██████▍   | 139843/216925 [02:53<01:27, 878.13 examples/s]Map:  62%|██████▏   | 135087/216925 [02:54<02:02, 667.86 examples/s]Map:  65%|██████▌   | 141277/216925 [02:54<01:32, 820.56 examples/s]Map:  65%|██████▍   | 139976/216925 [02:53<01:27, 877.74 examples/s]Map:  66%|██████▌   | 142091/216925 [02:53<01:45, 710.21 examples/s]Map:  62%|██████▏   | 135175/216925 [02:54<01:54, 714.33 examples/s]Map:  65%|██████▌   | 141369/216925 [02:54<01:29, 846.23 examples/s]Map:  66%|██████▌   | 142186/216925 [02:53<01:37, 762.66 examples/s]Map:  62%|██████▏   | 135261/216925 [02:54<01:49, 748.05 examples/s]Map:  65%|██████▌   | 141500/216925 [02:54<01:28, 853.84 examples/s]Map:  66%|██████▌   | 142275/216925 [02:53<01:34, 790.53 examples/s]Map:  62%|██████▏   | 135343/216925 [02:55<01:46, 766.22 examples/s]Map:  65%|██████▍   | 140091/216925 [02:53<01:47, 717.99 examples/s]Map:  65%|██████▌   | 141590/216925 [02:55<01:27, 862.20 examples/s]Map:  66%|██████▌   | 142370/216925 [02:53<01:29, 831.37 examples/s]Map:  62%|██████▏   | 135432/216925 [02:55<01:42, 794.70 examples/s]Map:  65%|██████▍   | 140183/216925 [02:53<01:40, 761.23 examples/s]Map:  65%|██████▌   | 141681/216925 [02:55<01:26, 869.83 examples/s]Map:  66%|██████▌   | 142465/216925 [02:53<01:26, 859.61 examples/s]Map:  62%|██████▏   | 135515/216925 [02:55<01:41, 802.35 examples/s]Map:  65%|██████▍   | 140270/216925 [02:53<01:37, 786.06 examples/s]Map:  65%|██████▌   | 141771/216925 [02:55<01:25, 875.16 examples/s]Map:  66%|██████▌   | 142559/216925 [02:54<01:24, 880.25 examples/s]Map:  63%|██████▎   | 135601/216925 [02:55<01:39, 816.11 examples/s]Map:  65%|██████▍   | 140358/216925 [02:54<01:34, 808.94 examples/s]Map:  65%|██████▌   | 141860/216925 [02:55<01:25, 875.94 examples/s]Map:  66%|██████▌   | 142656/216925 [02:54<01:22, 903.69 examples/s]Map:  63%|██████▎   | 135689/216925 [02:55<01:37, 832.39 examples/s]Map:  65%|██████▍   | 140445/216925 [02:54<01:32, 823.96 examples/s]Map:  65%|██████▌   | 141953/216925 [02:55<01:24, 889.75 examples/s]Map:  65%|██████▍   | 140534/216925 [02:54<01:30, 839.59 examples/s]Map:  66%|██████▌   | 142792/216925 [02:54<01:22, 903.15 examples/s]Map:  63%|██████▎   | 135815/216925 [02:55<01:37, 831.57 examples/s]Map:  65%|██████▍   | 140620/216925 [02:54<01:30, 842.18 examples/s]Map:  65%|██████▌   | 142044/216925 [02:55<01:48, 692.60 examples/s]Map:  66%|██████▌   | 142926/216925 [02:54<01:22, 895.15 examples/s]Map:  63%|██████▎   | 135937/216925 [02:55<01:38, 819.52 examples/s]Map:  65%|██████▍   | 140713/216925 [02:54<01:28, 864.26 examples/s]Map:  66%|██████▌   | 142136/216925 [02:55<01:40, 745.20 examples/s]Map:  65%|██████▍   | 140848/216925 [02:54<01:27, 873.37 examples/s]Map:  66%|██████▌   | 142228/216925 [02:55<01:35, 785.20 examples/s]Map:  66%|██████▌   | 143046/216925 [02:54<01:41, 730.25 examples/s]Map:  63%|██████▎   | 136043/216925 [02:56<02:01, 666.43 examples/s]Map:  65%|██████▍   | 140937/216925 [02:54<01:26, 875.77 examples/s]Map:  66%|██████▌   | 142316/216925 [02:55<01:32, 809.67 examples/s]Map:  66%|██████▌   | 143138/216925 [02:54<01:35, 768.76 examples/s]Map:  63%|██████▎   | 136131/216925 [02:56<01:53, 710.33 examples/s]Map:  66%|██████▌   | 142407/216925 [02:56<01:29, 833.35 examples/s]Map:  66%|██████▌   | 143233/216925 [02:54<01:31, 808.11 examples/s]Map:  63%|██████▎   | 136215/216925 [02:56<01:49, 737.82 examples/s]Map:  65%|██████▌   | 141042/216925 [02:54<01:49, 693.82 examples/s]Map:  66%|██████▌   | 142497/216925 [02:56<01:27, 850.60 examples/s]Map:  66%|██████▌   | 143322/216925 [02:54<01:29, 826.59 examples/s]Map:  63%|██████▎   | 136304/216925 [02:56<01:44, 773.06 examples/s]Map:  65%|██████▌   | 141131/216925 [02:55<01:43, 735.26 examples/s]Map:  66%|██████▌   | 143412/216925 [02:55<01:27, 844.48 examples/s]Map:  63%|██████▎   | 136391/216925 [02:56<01:41, 794.25 examples/s]Map:  66%|██████▌   | 142629/216925 [02:56<01:26, 857.63 examples/s]Map:  65%|██████▌   | 141223/216925 [02:55<01:37, 777.91 examples/s]Map:  66%|██████▌   | 143503/216925 [02:55<01:25, 859.26 examples/s]Map:  63%|██████▎   | 136478/216925 [02:56<01:39, 812.35 examples/s]Map:  66%|██████▌   | 142717/216925 [02:56<01:26, 859.95 examples/s]Map:  65%|██████▌   | 141312/216925 [02:55<01:33, 804.78 examples/s]Map:  63%|██████▎   | 136563/216925 [02:56<01:38, 818.28 examples/s]Map:  66%|██████▌   | 142804/216925 [02:56<01:26, 860.57 examples/s]Map:  66%|██████▌   | 143635/216925 [02:55<01:24, 864.56 examples/s]Map:  65%|██████▌   | 141402/216925 [02:55<01:31, 828.30 examples/s]Map:  63%|██████▎   | 136649/216925 [02:56<01:37, 826.97 examples/s]Map:  66%|██████▋   | 143728/216925 [02:55<01:23, 876.18 examples/s]Map:  65%|██████▌   | 141492/216925 [02:55<01:29, 845.46 examples/s]Map:  66%|██████▌   | 142934/216925 [02:56<01:25, 860.54 examples/s]Map:  63%|██████▎   | 136734/216925 [02:56<01:36, 830.43 examples/s]Map:  66%|██████▋   | 143822/216925 [02:55<01:22, 891.45 examples/s]Map:  65%|██████▌   | 141584/216925 [02:55<01:27, 861.93 examples/s]Map:  63%|██████▎   | 136818/216925 [02:56<01:36, 832.70 examples/s]Map:  66%|██████▋   | 143945/216925 [02:55<01:24, 863.81 examples/s]Map:  66%|██████▌   | 143039/216925 [02:56<01:50, 666.49 examples/s]Map:  65%|██████▌   | 141707/216925 [02:55<01:29, 843.23 examples/s]Map:  63%|██████▎   | 136935/216925 [02:57<01:38, 808.96 examples/s]Map:  66%|██████▌   | 143125/216925 [02:56<01:44, 706.48 examples/s]Map:  65%|██████▌   | 141796/216925 [02:55<01:28, 852.66 examples/s]Map:  66%|██████▌   | 143215/216925 [02:57<01:38, 749.80 examples/s]Map:  65%|██████▌   | 141886/216925 [02:55<01:26, 863.24 examples/s]Map:  66%|██████▋   | 144042/216925 [02:55<01:44, 696.71 examples/s]Map:  63%|██████▎   | 137042/216925 [02:57<02:00, 661.75 examples/s]Map:  66%|██████▌   | 143305/216925 [02:57<01:33, 783.25 examples/s]Map:  65%|██████▌   | 141977/216925 [02:55<01:25, 873.56 examples/s]Map:  66%|██████▋   | 144134/216925 [02:55<01:37, 744.38 examples/s]Map:  63%|██████▎   | 137126/216925 [02:57<01:54, 699.64 examples/s]Map:  66%|██████▌   | 143391/216925 [02:57<01:31, 801.08 examples/s]Map:  66%|██████▋   | 144224/216925 [02:56<01:33, 779.69 examples/s]Map:  63%|██████▎   | 137213/216925 [02:57<01:48, 737.74 examples/s]Map:  66%|██████▌   | 143478/216925 [02:57<01:29, 816.70 examples/s]Map:  67%|██████▋   | 144313/216925 [02:56<01:30, 805.61 examples/s]Map:  66%|██████▌   | 142086/216925 [02:56<01:47, 692.98 examples/s]Map:  63%|██████▎   | 137299/216925 [02:57<01:43, 767.50 examples/s]Map:  66%|██████▌   | 143563/216925 [02:57<01:29, 823.64 examples/s]Map:  67%|██████▋   | 144405/216925 [02:56<01:26, 834.87 examples/s]Map:  66%|██████▌   | 142175/216925 [02:56<01:41, 736.84 examples/s]Map:  63%|██████▎   | 137382/216925 [02:57<01:41, 781.76 examples/s]Map:  67%|██████▋   | 144496/216925 [02:56<01:24, 854.01 examples/s]Map:  66%|██████▌   | 142262/216925 [02:56<01:37, 767.19 examples/s]Map:  66%|██████▌   | 143687/216925 [02:57<01:29, 821.92 examples/s]Map:  63%|██████▎   | 137469/216925 [02:57<01:39, 801.47 examples/s]Map:  67%|██████▋   | 144589/216925 [02:56<01:22, 873.36 examples/s]Map:  66%|██████▌   | 142354/216925 [02:56<01:32, 805.66 examples/s]Map:  66%|██████▋   | 143774/216925 [02:57<01:27, 832.96 examples/s]Map:  63%|██████▎   | 137555/216925 [02:57<01:37, 817.09 examples/s]Map:  67%|██████▋   | 144678/216925 [02:56<01:22, 873.41 examples/s]Map:  66%|██████▌   | 142444/216925 [02:56<01:29, 828.76 examples/s]Map:  66%|██████▋   | 143861/216925 [02:57<01:27, 838.59 examples/s]Map:  63%|██████▎   | 137645/216925 [02:57<01:34, 837.47 examples/s]Map:  67%|██████▋   | 144769/216925 [02:56<01:21, 882.24 examples/s]Map:  66%|██████▌   | 142538/216925 [02:56<01:26, 857.90 examples/s]Map:  66%|██████▋   | 143946/216925 [02:57<01:26, 839.75 examples/s]Map:  63%|██████▎   | 137733/216925 [02:58<01:33, 844.28 examples/s]Map:  67%|██████▋   | 144859/216925 [02:56<01:21, 884.27 examples/s]Map:  66%|██████▌   | 142630/216925 [02:56<01:25, 871.77 examples/s]Map:  64%|██████▎   | 137821/216925 [02:58<01:32, 851.03 examples/s]Map:  67%|██████▋   | 144951/216925 [02:56<01:20, 889.46 examples/s]Map:  66%|██████▌   | 142720/216925 [02:56<01:24, 877.71 examples/s]Map:  66%|██████▋   | 144040/216925 [02:58<01:50, 657.70 examples/s]Map:  64%|██████▎   | 137910/216925 [02:58<01:32, 857.37 examples/s]Map:  66%|██████▋   | 144118/216925 [02:58<01:46, 684.40 examples/s]Map:  66%|██████▌   | 142839/216925 [02:57<01:27, 843.56 examples/s]Map:  67%|██████▋   | 145047/216925 [02:57<01:46, 673.78 examples/s]Map:  66%|██████▋   | 144204/216925 [02:58<01:40, 727.18 examples/s]Map:  66%|██████▌   | 142929/216925 [02:57<01:26, 856.25 examples/s]Map:  64%|██████▎   | 138000/216925 [02:58<01:59, 662.95 examples/s]Map:  67%|██████▋   | 145137/216925 [02:57<01:39, 724.81 examples/s]Map:  67%|██████▋   | 144287/216925 [02:58<01:36, 750.11 examples/s]Map:  64%|██████▎   | 138088/216925 [02:58<01:50, 714.69 examples/s]Map:  67%|██████▋   | 145228/216925 [02:57<01:33, 770.36 examples/s]Map:  67%|██████▋   | 144372/216925 [02:58<01:33, 773.36 examples/s]Map:  64%|██████▎   | 138179/216925 [02:58<01:43, 763.07 examples/s]Map:  66%|██████▌   | 143042/216925 [02:57<01:46, 691.74 examples/s]Map:  67%|██████▋   | 145318/216925 [02:57<01:29, 800.98 examples/s]Map:  67%|██████▋   | 144455/216925 [02:58<01:32, 787.38 examples/s]Map:  64%|██████▎   | 138268/216925 [02:58<01:39, 792.01 examples/s]Map:  66%|██████▌   | 143133/216925 [02:57<01:39, 738.90 examples/s]Map:  67%|██████▋   | 145412/216925 [02:57<01:25, 838.32 examples/s]Map:  67%|██████▋   | 144541/216925 [02:58<01:29, 804.32 examples/s]Map:  64%|██████▍   | 138361/216925 [02:58<01:34, 827.86 examples/s]Map:  66%|██████▌   | 143222/216925 [02:57<01:35, 771.50 examples/s]Map:  67%|██████▋   | 145505/216925 [02:57<01:22, 863.56 examples/s]Map:  67%|██████▋   | 144626/216925 [02:58<01:28, 812.42 examples/s]Map:  66%|██████▌   | 143311/216925 [02:57<01:32, 799.48 examples/s]Map:  64%|██████▍   | 138486/216925 [02:59<01:35, 825.63 examples/s]Map:  67%|██████▋   | 144709/216925 [02:58<01:28, 813.83 examples/s]Map:  67%|██████▋   | 145635/216925 [02:57<01:22, 859.78 examples/s]Map:  66%|██████▌   | 143397/216925 [02:57<01:30, 811.51 examples/s]Map:  64%|██████▍   | 138577/216925 [02:59<01:32, 844.05 examples/s]Map:  67%|██████▋   | 145730/216925 [02:57<01:20, 881.89 examples/s]Map:  66%|██████��   | 143487/216925 [02:57<01:28, 833.02 examples/s]Map:  67%|██████▋   | 144833/216925 [02:59<01:28, 816.40 examples/s]Map:  64%|██████▍   | 138667/216925 [02:59<01:31, 856.93 examples/s]Map:  67%|██████▋   | 145824/216925 [02:57<01:19, 893.45 examples/s]Map:  67%|██████▋   | 144921/216925 [02:59<01:26, 830.41 examples/s]Map:  64%|██████▍   | 138755/216925 [02:59<01:30, 860.87 examples/s]Map:  66%|██████▌   | 143615/216925 [02:58<01:27, 836.26 examples/s]Map:  67%|██████▋   | 145956/216925 [02:58<01:20, 883.80 examples/s]Map:  64%|██████▍   | 138845/216925 [02:59<01:29, 871.24 examples/s]Map:  66%|██████▋   | 143740/216925 [02:58<01:27, 833.48 examples/s]Map:  64%|██████▍   | 138934/216925 [02:59<01:29, 875.05 examples/s]Map:  67%|██████▋   | 145043/216925 [02:59<01:48, 660.78 examples/s]Map:  66%|██████▋   | 143863/216925 [02:58<01:28, 826.85 examples/s]Map:  67%|██████▋   | 145125/216925 [02:59<01:43, 691.75 examples/s]Map:  67%|██████▋   | 146081/216925 [02:58<01:40, 705.02 examples/s]Map:  66%|██████▋   | 143947/216925 [02:58<01:28, 827.32 examples/s]Map:  67%|██████▋   | 145210/216925 [02:59<01:38, 727.61 examples/s]Map:  64%|██████▍   | 139040/216925 [02:59<01:56, 670.04 examples/s]Map:  67%|██████▋   | 146175/216925 [02:58<01:34, 752.65 examples/s]Map:  64%|██████▍   | 139130/216925 [02:59<01:47, 721.02 examples/s]Map:  67%|██████▋   | 145294/216925 [02:59<01:35, 752.83 examples/s]Map:  67%|██████▋   | 146268/216925 [02:58<01:29, 790.14 examples/s]Map:  66%|██████▋   | 144043/216925 [02:58<01:49, 668.05 examples/s]Map:  67%|██████▋   | 145378/216925 [02:59<01:32, 774.34 examples/s]Map:  64%|██████▍   | 139222/216925 [03:00<01:41, 767.85 examples/s]Map:  67%|██████▋   | 146362/216925 [02:58<01:25, 824.70 examples/s]Map:  66%|██████▋   | 144127/216925 [02:58<01:43, 703.52 examples/s]Map:  67%|██████▋   | 145467/216925 [02:59<01:28, 804.82 examples/s]Map:  64%|██████▍   | 139314/216925 [03:00<01:36, 803.37 examples/s]Map:  68%|██████▊   | 146450/216925 [02:58<01:24, 836.42 examples/s]Map:  66%|██████▋   | 144207/216925 [02:58<01:40, 723.33 examples/s]Map:  67%|██████▋   | 145552/216925 [03:00<01:27, 812.94 examples/s]Map:  64%|██████▍   | 139403/216925 [03:00<01:33, 824.81 examples/s]Map:  68%|██████▊   | 146543/216925 [02:58<01:21, 858.71 examples/s]Map:  67%|██████▋   | 144296/216925 [02:58<01:35, 761.40 examples/s]Map:  67%|██████▋   | 145639/216925 [03:00<01:26, 826.28 examples/s]Map:  64%|██████▍   | 139497/216925 [03:00<01:30, 854.72 examples/s]Map:  68%|██████▊   | 146677/216925 [02:59<01:20, 870.53 examples/s]Map:  67%|██████▋   | 144382/216925 [02:59<01:32, 783.18 examples/s]Map:  67%|██████▋   | 145725/216925 [03:00<01:25, 834.76 examples/s]Map:  64%|██████▍   | 139587/216925 [03:00<01:29, 864.79 examples/s]Map:  68%|██████▊   | 146771/216925 [02:59<01:19, 885.18 examples/s]Map:  67%|██████▋   | 144467/216925 [02:59<01:30, 800.27 examples/s]Map:  67%|██████▋   | 145853/216925 [03:00<01:24, 838.85 examples/s]Map:  64%|██████▍   | 139718/216925 [03:00<01:29, 865.66 examples/s]Map:  67%|██████▋   | 144554/216925 [02:59<01:28, 816.46 examples/s]Map:  68%|██████▊   | 146905/216925 [02:59<01:18, 886.68 examples/s]Map:  64%|██████▍   | 139807/216925 [03:00<01:28, 868.57 examples/s]Map:  67%|██████▋   | 145982/216925 [03:00<01:24, 844.14 examples/s]Map:  68%|██████▊   | 146997/216925 [02:59<01:18, 892.85 examples/s]Map:  67%|██████▋   | 144678/216925 [02:59<01:28, 818.00 examples/s]Map:  64%|██████▍   | 139896/216925 [03:00<01:28, 869.26 examples/s]Map:  65%|██████▍   | 139989/216925 [03:00<01:27, 882.79 examples/s]Map:  67%|██████▋   | 144800/216925 [02:59<01:28, 814.27 examples/s]Map:  68%|██████▊   | 147088/216925 [02:59<01:39, 704.26 examples/s]Map:  67%|██████▋   | 146084/216925 [03:00<01:44, 677.25 examples/s]Map:  68%|██████▊   | 147172/216925 [02:59<01:35, 731.71 examples/s]Map:  67%|██████▋   | 146165/216925 [03:00<01:40, 704.51 examples/s]Map:  67%|██████▋   | 144914/216925 [02:59<01:30, 793.18 examples/s]Map:  65%|██████▍   | 140090/216925 [03:01<01:53, 676.63 examples/s]Map:  68%|██████▊   | 147265/216925 [02:59<01:29, 778.04 examples/s]Map:  67%|██████▋   | 146253/216925 [03:01<01:34, 744.21 examples/s]Map:  67%|██████▋   | 144999/216925 [02:59<01:29, 805.19 examples/s]Map:  65%|██████▍   | 140185/216925 [03:01<01:44, 736.72 examples/s]Map:  68%|██████▊   | 147357/216925 [02:59<01:25, 811.96 examples/s]Map:  67%|██████▋   | 146335/216925 [03:01<01:32, 760.10 examples/s]Map:  65%|██████▍   | 140276/216925 [03:01<01:38, 778.38 examples/s]Map:  68%|██████▊   | 147447/216925 [02:59<01:23, 832.37 examples/s]Map:  67%|██████▋   | 146423/216925 [03:01<01:29, 786.71 examples/s]Map:  67%|██████▋   | 145084/216925 [03:00<01:51, 646.04 examples/s]Map:  65%|██████▍   | 140367/216925 [03:01<01:34, 812.17 examples/s]Map:  68%|██████▊   | 147543/216925 [03:00<01:20, 865.77 examples/s]Map:  68%|██████▊   | 146511/216925 [03:01<01:26, 811.39 examples/s]Map:  67%|██████▋   | 145168/216925 [03:00<01:44, 687.20 examples/s]Map:  65%|██████▍   | 140459/216925 [03:01<01:30, 841.22 examples/s]Map:  68%|██████▊   | 147633/216925 [03:00<01:19, 874.30 examples/s]Map:  68%|██████▊   | 146596/216925 [03:01<01:26, 817.54 examples/s]Map:  67%|██████▋   | 145250/216925 [03:00<01:40, 716.68 examples/s]Map:  65%|██████▍   | 140549/216925 [03:01<01:29, 854.26 examples/s]Map:  68%|██████▊   | 147726/216925 [03:00<01:18, 886.56 examples/s]Map:  68%|██████▊   | 146683/216925 [03:01<01:24, 830.95 examples/s]Map:  67%|██████▋   | 145337/216925 [03:00<01:35, 750.42 examples/s]Map:  65%|██████▍   | 140640/216925 [03:01<01:27, 868.39 examples/s]Map:  68%|██████▊   | 147819/216925 [03:00<01:17, 894.81 examples/s]Map:  68%|██████▊   | 146768/216925 [03:01<01:24, 835.18 examples/s]Map:  67%|██████▋   | 145419/216925 [03:00<01:33, 767.57 examples/s]Map:  68%|██████▊   | 146854/216925 [03:01<01:23, 840.96 examples/s]Map:  65%|██████▍   | 140773/216925 [03:01<01:27, 869.56 examples/s]Map:  67%|██████▋   | 145503/216925 [03:00<01:30, 786.00 examples/s]Map:  68%|██████▊   | 147947/216925 [03:00<01:18, 875.42 examples/s]Map:  68%|██████▊   | 146939/216925 [03:01<01:23, 841.50 examples/s]Map:  65%|██████▍   | 140864/216925 [03:01<01:26, 879.22 examples/s]Map:  67%|██████▋   | 145588/216925 [03:00<01:29, 796.83 examples/s]Map:  65%|██████▍   | 140953/216925 [03:02<01:26, 878.85 examples/s]Map:  67%|██████▋   | 145671/216925 [03:00<01:28, 803.10 examples/s]Map:  68%|██████▊   | 148044/216925 [03:00<01:38, 702.58 examples/s]Map:  68%|██████▊   | 147042/216925 [03:02<01:45, 660.09 examples/s]Map:  67%|██████▋   | 145757/216925 [03:00<01:27, 816.33 examples/s]Map:  68%|██████▊   | 148135/216925 [03:00<01:31, 749.13 examples/s]Map:  65%|██████▌   | 141042/216925 [03:02<01:49, 693.92 examples/s]Map:  68%|██████▊   | 147123/216925 [03:02<01:40, 693.15 examples/s]Map:  68%|██████▊   | 148220/216925 [03:00<01:28, 773.02 examples/s]Map:  67%|██████▋   | 145876/216925 [03:01<01:28, 802.41 examples/s]Map:  65%|██████▌   | 141132/216925 [03:02<01:42, 742.21 examples/s]Map:  68%|██████▊   | 147209/216925 [03:02<01:35, 733.35 examples/s]Map:  68%|██████▊   | 148309/216925 [03:01<01:25, 799.31 examples/s]Map:  67%|██████▋   | 145961/216925 [03:01<01:27, 812.77 examples/s]Map:  65%|██████▌   | 141225/216925 [03:02<01:36, 787.62 examples/s]Map:  68%|██████▊   | 147297/216925 [03:02<01:30, 766.05 examples/s]Map:  68%|██████▊   | 148400/216925 [03:01<01:22, 827.02 examples/s]Map:  65%|██████▌   | 141317/216925 [03:02<01:32, 819.73 examples/s]Map:  68%|██████▊   | 147384/216925 [03:02<01:28, 788.23 examples/s]Map:  68%|██████▊   | 148491/216925 [03:01<01:20, 846.44 examples/s]Map:  65%|██████▌   | 141408/216925 [03:02<01:29, 842.80 examples/s]Map:  68%|██████▊   | 147469/216925 [03:02<01:26, 802.94 examples/s]Map:  67%|██████▋   | 146083/216925 [03:01<01:48, 655.64 examples/s]Map:  68%|██████▊   | 148578/216925 [03:01<01:20, 850.15 examples/s]Map:  65%|██████▌   | 141501/216925 [03:02<01:27, 866.50 examples/s]Map:  68%|██████▊   | 147555/216925 [03:02<01:25, 814.14 examples/s]Map:  67%|██████▋   | 146174/216925 [03:01<01:40, 707.29 examples/s]Map:  69%|██████▊   | 148667/216925 [03:01<01:19, 860.49 examples/s]Map:  65%|██████▌   | 141593/216925 [03:02<01:25, 879.02 examples/s]Map:  68%|██████▊   | 147646/216925 [03:02<01:22, 837.14 examples/s]Map:  67%|██████▋   | 146259/216925 [03:01<01:35, 739.16 examples/s]Map:  69%|██████▊   | 148800/216925 [03:01<01:18, 865.59 examples/s]Map:  65%|██████▌   | 141685/216925 [03:02<01:24, 888.89 examples/s]Map:  68%|██████▊   | 147736/216925 [03:02<01:21, 849.55 examples/s]Map:  67%|██████▋   | 146341/216925 [03:01<01:33, 755.70 examples/s]Map:  69%|██████▊   | 148892/216925 [03:01<01:17, 877.64 examples/s]Map:  68%|██████▊   | 147825/216925 [03:02<01:20, 857.47 examples/s]Map:  68%|██████▊   | 146428/216925 [03:01<01:30, 783.27 examples/s]Map:  65%|██████▌   | 141820/216925 [03:03<01:24, 888.86 examples/s]Map:  69%|██████▊   | 148985/216925 [03:01<01:16, 888.46 examples/s]Map:  68%|██████▊   | 146511/216925 [03:01<01:28, 793.09 examples/s]Map:  65%|██████▌   | 141913/216925 [03:03<01:23, 898.33 examples/s]Map:  68%|██████▊   | 147951/216925 [03:03<01:21, 848.93 examples/s]Map:  68%|██████▊   | 146631/216925 [03:02<01:28, 793.95 examples/s]Map:  69%|██████▊   | 149086/216925 [03:02<01:38, 689.19 examples/s]Map:  68%|██████▊   | 146714/216925 [03:02<01:27, 800.06 examples/s]Map:  65%|██████▌   | 142045/216925 [03:03<01:42, 733.47 examples/s]Map:  68%|██████▊   | 148045/216925 [03:03<01:42, 673.19 examples/s]Map:  69%|██████▉   | 149180/216925 [03:02<01:30, 745.95 examples/s]Map:  66%|██████▌   | 142127/216925 [03:03<01:39, 749.42 examples/s]Map:  68%|██████▊   | 148130/216925 [03:03<01:37, 709.14 examples/s]Map:  68%|██████▊   | 146827/216925 [03:02<01:29, 779.57 examples/s]Map:  69%|██████▉   | 149303/216925 [03:02<01:28, 766.46 examples/s]Map:  66%|██████▌   | 142214/216925 [03:03<01:36, 774.53 examples/s]Map:  68%|██████▊   | 148212/216925 [03:03<01:33, 734.65 examples/s]Map:  68%|██████▊   | 146913/216925 [03:02<01:28, 794.62 examples/s]Map:  69%|██████▉   | 149396/216925 [03:02<01:24, 802.96 examples/s]Map:  66%|██████▌   | 142302/216925 [03:03<01:33, 799.53 examples/s]Map:  68%|██████▊   | 148303/216925 [03:03<01:28, 777.81 examples/s]Map:  68%|██████▊   | 146995/216925 [03:02<01:27, 799.71 examples/s]Map:  69%|██████▉   | 149488/216925 [03:02<01:21, 829.45 examples/s]Map:  68%|██████▊   | 148391/216925 [03:03<01:25, 802.56 examples/s]Map:  66%|██████▌   | 142428/216925 [03:03<01:31, 812.50 examples/s]Map:  69%|██████▉   | 149576/216925 [03:02<01:20, 840.59 examples/s]Map:  68%|██████▊   | 148478/216925 [03:03<01:23, 819.08 examples/s]Map:  66%|██████▌   | 142513/216925 [03:04<01:30, 820.75 examples/s]Map:  68%|██████▊   | 147088/216925 [03:02<01:48, 643.76 examples/s]Map:  69%|██████▉   | 149669/216925 [03:02<01:18, 859.70 examples/s]Map:  68%|██████▊   | 148562/216925 [03:03<01:23, 821.80 examples/s]Map:  66%|██████▌   | 142601/216925 [03:04<01:29, 831.72 examples/s]Map:  68%|██████▊   | 147172/216925 [03:02<01:41, 687.86 examples/s]Map:  69%|██████▉   | 149760/216925 [03:02<01:17, 870.65 examples/s]Map:  69%|██████▊   | 148653/216925 [03:04<01:20, 845.41 examples/s]Map:  66%|██████▌   | 142688/216925 [03:04<01:28, 838.61 examples/s]Map:  68%|██████▊   | 147253/216925 [03:02<01:37, 715.04 examples/s]Map:  69%|██████▉   | 149853/216925 [03:02<01:15, 885.97 examples/s]Map:  69%|██████▊   | 148740/216925 [03:04<01:20, 850.33 examples/s]Map:  66%|██████▌   | 142773/216925 [03:04<01:28, 837.20 examples/s]Map:  68%|██████▊   | 147337/216925 [03:02<01:33, 745.13 examples/s]Map:  69%|██████▊   | 148830/216925 [03:04<01:18, 862.21 examples/s]Map:  69%|██████▉   | 149990/216925 [03:03<01:15, 890.99 examples/s]Map:  66%|██████▌   | 142858/216925 [03:04<01:28, 838.74 examples/s]Map:  68%|██████▊   | 147418/216925 [03:03<01:31, 759.69 examples/s]Map:  69%|██████▊   | 148917/216925 [03:04<01:18, 863.29 examples/s]Map:  68%|██████▊   | 147500/216925 [03:03<01:29, 774.82 examples/s]Map:  66%|██████▌   | 142983/216925 [03:04<01:28, 831.63 examples/s]Map:  69%|██████▉   | 150089/216925 [03:03<01:34, 707.09 examples/s]Map:  68%|██████▊   | 147584/216925 [03:03<01:27, 789.96 examples/s]Map:  69%|██████▉   | 150180/216925 [03:03<01:28, 750.12 examples/s]Map:  69%|██████▊   | 149043/216925 [03:04<01:39, 680.08 examples/s]Map:  68%|██████▊   | 147670/216925 [03:03<01:25, 808.29 examples/s]Map:  66%|██████▌   | 143086/216925 [03:04<01:50, 667.58 examples/s]Map:  69%|██████▉   | 150268/216925 [03:03<01:25, 780.78 examples/s]Map:  69%|██████▊   | 149130/216925 [03:04<01:34, 719.55 examples/s]Map:  68%|██████▊   | 147754/216925 [03:03<01:25, 813.64 examples/s]Map:  66%|██████▌   | 143174/216925 [03:04<01:43, 711.84 examples/s]Map:  69%|██████▉   | 150356/216925 [03:03<01:22, 805.47 examples/s]Map:  69%|██████▉   | 149217/216925 [03:04<01:29, 753.10 examples/s]Map:  68%|██████▊   | 147841/216925 [03:03<01:23, 826.77 examples/s]Map:  66%|██████▌   | 143251/216925 [03:04<01:41, 723.62 examples/s]Map:  69%|██████▉   | 150476/216925 [03:03<01:23, 800.31 examples/s]Map:  69%|██████▉   | 149336/216925 [03:04<01:28, 765.13 examples/s]Map:  68%|██████▊   | 147955/216925 [03:03<01:26, 798.37 examples/s]Map:  66%|██████▌   | 143333/216925 [03:05<01:38, 745.66 examples/s]Map:  69%|██████▉   | 150566/216925 [03:03<01:20, 823.69 examples/s]Map:  69%|██████▉   | 149422/216925 [03:05<01:25, 785.00 examples/s]Map:  66%|██████▌   | 143419/216925 [03:05<01:34, 775.30 examples/s]Map:  69%|██████▉   | 150652/216925 [03:03<01:19, 831.20 examples/s]Map:  69%|██████▉   | 149507/216925 [03:05<01:24, 799.39 examples/s]Map:  68%|██████▊   | 148041/216925 [03:03<01:47, 643.08 examples/s]Map:  66%|██████▌   | 143504/216925 [03:05<01:32, 793.09 examples/s]Map:  69%|██████▉   | 150741/216925 [03:04<01:18, 845.07 examples/s]Map:  69%|██████▉   | 149592/216925 [03:05<01:22, 811.93 examples/s]Map:  68%|██████▊   | 148120/216925 [03:04<01:42, 674.29 examples/s]Map:  66%|██████▌   | 143589/216925 [03:05<01:30, 806.64 examples/s]Map:  70%|██████▉   | 150835/216925 [03:04<01:15, 870.66 examples/s]Map:  69%|██████▉   | 149680/216925 [03:05<01:21, 829.95 examples/s]Map:  68%|██████▊   | 148204/216925 [03:04<01:36, 713.65 examples/s]Map:  66%|██████▌   | 143673/216925 [03:05<01:29, 814.00 examples/s]Map:  70%|██████▉   | 150928/216925 [03:04<01:14, 881.91 examples/s]Map:  69%|██████▉   | 149768/216925 [03:05<01:19, 841.08 examples/s]Map:  68%|██████▊   | 148290/216925 [03:04<01:31, 749.34 examples/s]Map:  66%|██████▋   | 143797/216925 [03:05<01:29, 815.35 examples/s]Map:  69%|██████▉   | 149855/216925 [03:05<01:19, 847.41 examples/s]Map:  68%|██████▊   | 148375/216925 [03:04<01:28, 773.45 examples/s]Map:  66%|██████▋   | 143883/216925 [03:05<01:28, 824.25 examples/s]Map:  69%|██████▉   | 149943/216925 [03:05<01:18, 854.72 examples/s]Map:  68%|██████▊   | 148462/216925 [03:04<01:25, 796.69 examples/s]Map:  70%|██████▉   | 151044/216925 [03:04<01:34, 699.44 examples/s]Map:  68%|██████▊   | 148549/216925 [03:04<01:23, 814.61 examples/s]Map:  70%|██████▉   | 151132/216925 [03:04<01:28, 739.75 examples/s]Map:  69%|██████▊   | 148639/216925 [03:04<01:21, 834.17 examples/s]Map:  66%|██████▋   | 144000/216925 [03:05<01:49, 663.53 examples/s]Map:  70%|██████▉   | 151226/216925 [03:04<01:23, 786.90 examples/s]Map:  69%|██████▉   | 150042/216925 [03:05<01:41, 659.92 examples/s]Map:  69%|██████▊   | 148725/216925 [03:04<01:21, 839.08 examples/s]Map:  66%|██████▋   | 144088/216925 [03:06<01:42, 710.30 examples/s]Map:  70%|██████▉   | 151320/216925 [03:04<01:19, 823.35 examples/s]Map:  69%|██████▉   | 150132/216925 [03:05<01:33, 713.18 examples/s]Map:  69%|██████▊   | 148817/216925 [03:04<01:19, 858.72 examples/s]Map:  66%|██████▋   | 144179/216925 [03:06<01:36, 754.76 examples/s]Map:  70%|██████▉   | 151410/216925 [03:04<01:17, 842.04 examples/s]Map:  69%|██████▉   | 150219/216925 [03:06<01:28, 750.52 examples/s]Map:  69%|██████▊   | 148908/216925 [03:04<01:18, 870.69 examples/s]Map:  67%|██████▋   | 144269/216925 [03:06<01:31, 790.22 examples/s]Map:  70%|██████▉   | 151502/216925 [03:04<01:15, 861.43 examples/s]Map:  69%|██████▉   | 150307/216925 [03:06<01:25, 782.56 examples/s]Map:  67%|██████▋   | 144386/216925 [03:06<01:32, 784.52 examples/s]Map:  70%|██████▉   | 151625/216925 [03:05<01:17, 841.26 examples/s]Map:  69%|██████▉   | 150421/216925 [03:06<01:26, 769.80 examples/s]Map:  69%|██████▊   | 149000/216925 [03:05<01:43, 655.49 examples/s]Map:  67%|██████▋   | 144475/216925 [03:06<01:29, 808.03 examples/s]Map:  70%|██████▉   | 151714/216925 [03:05<01:16, 852.49 examples/s]Map:  69%|██████▉   | 150507/216925 [03:06<01:24, 788.18 examples/s]Map:  69%|██████▊   | 149089/216925 [03:05<01:35, 708.89 examples/s]Map:  70%|██████▉   | 151808/216925 [03:05<01:14, 875.04 examples/s]Map:  67%|██████▋   | 144567/216925 [03:06<01:26, 833.39 examples/s]Map:  69%|██████▉   | 150592/216925 [03:06<01:22, 801.12 examples/s]Map:  69%|██████▉   | 149181/216925 [03:05<01:29, 759.95 examples/s]Map:  70%|███████   | 151903/216925 [03:05<01:12, 894.09 examples/s]Map:  67%|██████▋   | 144654/216925 [03:06<01:25, 841.44 examples/s]Map:  69%|██████▉   | 150680/216925 [03:06<01:20, 818.65 examples/s]Map:  69%|██████▉   | 149269/216925 [03:05<01:25, 789.81 examples/s]Map:  70%|███████   | 151996/216925 [03:05<01:12, 899.04 examples/s]Map:  70%|██████▉   | 150767/216925 [03:06<01:19, 832.44 examples/s]Map:  67%|██████▋   | 144779/216925 [03:06<01:26, 834.18 examples/s]Map:  69%|██████▉   | 149357/216925 [03:05<01:23, 812.63 examples/s]Map:  70%|██████▉   | 150853/216925 [03:06<01:18, 836.78 examples/s]Map:  69%|██████▉   | 149447/216925 [03:05<01:21, 832.88 examples/s]Map:  67%|██████▋   | 144910/216925 [03:07<01:25, 842.32 examples/s]Map:  70%|███████   | 152094/216925 [03:05<01:31, 707.43 examples/s]Map:  70%|██████▉   | 150940/216925 [03:06<01:18, 842.84 examples/s]Map:  69%|██████▉   | 149534/216925 [03:05<01:19, 842.91 examples/s]Map:  67%|██████▋   | 144995/216925 [03:07<01:25, 844.05 examples/s]Map:  70%|███████   | 152190/216925 [03:05<01:24, 766.47 examples/s]Map:  69%|██████▉   | 149622/216925 [03:05<01:19, 848.77 examples/s]Map:  70%|███████   | 152283/216925 [03:05<01:20, 803.18 examples/s]Map:  70%|██████▉   | 151041/216925 [03:07<01:39, 660.69 examples/s]Map:  69%|██████▉   | 149713/216925 [03:05<01:17, 861.99 examples/s]Map:  67%|██████▋   | 145087/216925 [03:07<01:45, 678.19 examples/s]Map:  70%|███████   | 152375/216925 [03:06<01:17, 831.33 examples/s]Map:  70%|██████▉   | 151128/216925 [03:07<01:33, 707.32 examples/s]Map:  67%|██████▋   | 145180/216925 [03:07<01:37, 732.59 examples/s]Map:  69%|██████▉   | 149843/216925 [03:06<01:18, 858.62 examples/s]Map:  70%|██████▉   | 151215/216925 [03:07<01:28, 746.54 examples/s]Map:  70%|███████   | 152505/216925 [03:06<01:16, 841.06 examples/s]Map:  67%|██████▋   | 145268/216925 [03:07<01:33, 767.49 examples/s]Map:  69%|██████▉   | 149932/216925 [03:06<01:17, 866.51 examples/s]Map:  70%|██████▉   | 151301/216925 [03:07<01:24, 773.76 examples/s]Map:  70%|███████   | 152598/216925 [03:06<01:14, 862.78 examples/s]Map:  67%|██████▋   | 145358/216925 [03:07<01:29, 798.56 examples/s]Map:  70%|██████▉   | 151387/216925 [03:07<01:22, 792.52 examples/s]Map:  70%|███████   | 152718/216925 [03:06<01:16, 836.31 examples/s]Map:  69%|██████▉   | 150041/216925 [03:06<01:40, 666.28 examples/s]Map:  67%|██████▋   | 145482/216925 [03:07<01:29, 802.19 examples/s]Map:  70%|██████▉   | 151508/216925 [03:07<01:22, 795.18 examples/s]Map:  70%|███████   | 152804/216925 [03:06<01:16, 841.09 examples/s]Map:  69%|██████▉   | 150124/216925 [03:06<01:35, 700.22 examples/s]Map:  67%|██████▋   | 145566/216925 [03:07<01:28, 809.12 examples/s]Map:  70%|██████▉   | 151594/216925 [03:07<01:20, 808.94 examples/s]Map:  70%|███████   | 152898/216925 [03:06<01:14, 864.19 examples/s]Map:  69%|██████▉   | 150214/216925 [03:06<01:29, 745.84 examples/s]Map:  67%|██████▋   | 145654/216925 [03:08<01:26, 824.39 examples/s]Map:  70%|██████▉   | 151683/216925 [03:07<01:18, 827.48 examples/s]Map:  71%|███████   | 152986/216925 [03:06<01:13, 867.64 examples/s]Map:  69%|██████▉   | 150303/216925 [03:06<01:25, 780.67 examples/s]Map:  67%|██████▋   | 145742/216925 [03:08<01:24, 838.39 examples/s]Map:  70%|██████▉   | 151769/216925 [03:08<01:18, 835.22 examples/s]Map:  69%|██████▉   | 150386/216925 [03:06<01:24, 791.90 examples/s]Map:  70%|███████   | 151855/216925 [03:08<01:17, 839.86 examples/s]Map:  67%|██████▋   | 145864/216925 [03:08<01:26, 825.81 examples/s]Map:  71%|███████   | 153089/216925 [03:06<01:31, 695.52 examples/s]Map:  69%|██████▉   | 150474/216925 [03:06<01:21, 814.52 examples/s]Map:  70%|███████   | 151941/216925 [03:08<01:16, 844.59 examples/s]Map:  67%|██████▋   | 145948/216925 [03:08<01:25, 827.66 examples/s]Map:  71%|███████   | 153179/216925 [03:07<01:25, 742.20 examples/s]Map:  69%|██████▉   | 150564/216925 [03:07<01:19, 834.98 examples/s]Map:  71%|███████   | 153266/216925 [03:07<01:22, 772.85 examples/s]Map:  69%|██████▉   | 150650/216925 [03:07<01:18, 841.00 examples/s]Map:  70%|███████   | 152044/216925 [03:08<01:36, 672.41 examples/s]Map:  67%|██████▋   | 146044/216925 [03:08<01:45, 670.98 examples/s]Map:  71%|███████   | 153361/216925 [03:07<01:17, 817.18 examples/s]Map:  69%|██████▉   | 150736/216925 [03:07<01:18, 845.85 examples/s]Map:  70%|███████   | 152131/216925 [03:08<01:30, 715.83 examples/s]Map:  67%|██████▋   | 146133/216925 [03:08<01:38, 719.60 examples/s]Map:  71%|███████   | 153451/216925 [03:07<01:15, 836.10 examples/s]Map:  70%|██████▉   | 150825/216925 [03:07<01:17, 855.33 examples/s]Map:  70%|███████   | 152217/216925 [03:08<01:26, 751.06 examples/s]Map:  67%|██████▋   | 146217/216925 [03:08<01:34, 746.11 examples/s]Map:  71%|███████   | 153544/216925 [03:07<01:14, 855.73 examples/s]Map:  70%|███████   | 152300/216925 [03:08<01:24, 768.56 examples/s]Map:  70%|██████▉   | 150954/216925 [03:07<01:17, 853.42 examples/s]Map:  67%|██████▋   | 146299/216925 [03:08<01:32, 762.16 examples/s]Map:  71%|███████   | 153637/216925 [03:07<01:12, 874.57 examples/s]Map:  70%|███████   | 152391/216925 [03:08<01:20, 803.69 examples/s]Map:  67%|██████▋   | 146384/216925 [03:08<01:30, 783.08 examples/s]Map:  71%|███████   | 153728/216925 [03:07<01:11, 880.06 examples/s]Map:  70%|██████▉   | 151043/216925 [03:07<01:36, 681.47 examples/s]Map:  68%|██████▊   | 146469/216925 [03:09<01:28, 796.31 examples/s]Map:  70%|███████   | 152508/216925 [03:08<01:21, 790.57 examples/s]Map:  71%|███████   | 153857/216925 [03:07<01:12, 868.42 examples/s]Map:  70%|██████▉   | 151120/216925 [03:07<01:34, 699.15 examples/s]Map:  68%|██████▊   | 146588/216925 [03:09<01:28, 791.03 examples/s]Map:  71%|███████   | 153945/216925 [03:07<01:12, 869.02 examples/s]Map:  70%|███████   | 152630/216925 [03:09<01:21, 792.36 examples/s]Map:  70%|██████▉   | 151210/216925 [03:07<01:27, 747.54 examples/s]Map:  68%|██████▊   | 146675/216925 [03:09<01:26, 808.04 examples/s]Map:  70%|███████   | 152718/216925 [03:09<01:19, 811.40 examples/s]Map:  70%|██████▉   | 151299/216925 [03:08<01:24, 780.65 examples/s]Map:  68%|██████▊   | 146766/216925 [03:09<01:24, 833.93 examples/s]Map:  71%|███████   | 154042/216925 [03:08<01:30, 695.67 examples/s]Map:  70%|███████   | 152801/216925 [03:09<01:18, 813.49 examples/s]Map:  70%|██████▉   | 151385/216925 [03:08<01:22, 797.72 examples/s]Map:  68%|██████▊   | 146859/216925 [03:09<01:21, 856.85 examples/s]Map:  71%|███████   | 154134/216925 [03:08<01:24, 744.38 examples/s]Map:  70%|███████   | 152884/216925 [03:09<01:18, 811.34 examples/s]Map:  70%|██████▉   | 151473/216925 [03:08<01:19, 818.19 examples/s]Map:  68%|██████▊   | 146947/216925 [03:09<01:21, 861.12 examples/s]Map:  71%|███████   | 154221/216925 [03:08<01:21, 773.84 examples/s]Map:  71%|███████   | 152971/216925 [03:09<01:17, 823.68 examples/s]Map:  70%|██████▉   | 151562/216925 [03:08<01:18, 834.80 examples/s]Map:  71%|███████   | 154315/216925 [03:08<01:16, 815.73 examples/s]Map:  70%|██████▉   | 151652/216925 [03:08<01:16, 851.38 examples/s]Map:  68%|██████▊   | 147044/216925 [03:09<01:41, 686.08 examples/s]Map:  71%|███████   | 154405/216925 [03:08<01:14, 836.70 examples/s]Map:  70%|██████▉   | 151742/216925 [03:08<01:15, 863.07 examples/s]Map:  71%|███████   | 153092/216925 [03:09<01:35, 666.72 examples/s]Map:  68%|██████▊   | 147136/216925 [03:09<01:34, 739.02 examples/s]Map:  71%|███████   | 154496/216925 [03:08<01:13, 853.10 examples/s]Map:  71%|███████   | 153184/216925 [03:09<01:28, 720.71 examples/s]Map:  70%|███████   | 151875/216925 [03:08<01:14, 868.55 examples/s]Map:  68%|██████▊   | 147224/216925 [03:10<01:30, 772.83 examples/s]Map:  71%|███████▏  | 154591/216925 [03:08<01:10, 878.11 examples/s]Map:  71%|███████   | 153276/216925 [03:09<01:23, 766.67 examples/s]Map:  70%|███████   | 151964/216925 [03:08<01:14, 872.09 examples/s]Map:  68%|██████▊   | 147318/216925 [03:10<01:25, 814.26 examples/s]Map:  71%|███████▏  | 154686/216925 [03:08<01:09, 893.29 examples/s]Map:  71%|███████   | 153367/216925 [03:10<01:19, 803.24 examples/s]Map:  68%|██████▊   | 147407/216925 [03:10<01:23, 832.06 examples/s]Map:  71%|███████▏  | 154777/216925 [03:08<01:09, 895.29 examples/s]Map:  71%|███████   | 153463/216925 [03:10<01:15, 843.91 examples/s]Map:  71%|███████▏  | 154868/216925 [03:09<01:09, 895.56 examples/s]Map:  70%|███████   | 152084/216925 [03:09<01:32, 699.04 examples/s]Map:  68%|██████▊   | 147532/216925 [03:10<01:23, 832.29 examples/s]Map:  71%|███████   | 153588/216925 [03:10<01:15, 838.44 examples/s]Map:  70%|███████   | 152173/216925 [03:09<01:27, 739.30 examples/s]Map:  68%|██████▊   | 147618/216925 [03:10<01:22, 836.84 examples/s]Map:  71%|███████   | 153681/216925 [03:10<01:13, 860.92 examples/s]Map:  70%|███████   | 152259/216925 [03:09<01:24, 765.92 examples/s]Map:  68%|██████▊   | 147707/216925 [03:10<01:21, 847.45 examples/s]Map:  71%|███████▏  | 155000/216925 [03:09<01:27, 708.55 examples/s]Map:  71%|███████   | 153772/216925 [03:10<01:12, 872.14 examples/s]Map:  70%|███████   | 152347/216925 [03:09<01:21, 794.59 examples/s]Map:  68%|██████▊   | 147799/216925 [03:10<01:19, 866.22 examples/s]Map:  71%|███████▏  | 155089/216925 [03:09<01:22, 748.79 examples/s]Map:  71%|███████   | 153863/216925 [03:10<01:11, 882.21 examples/s]Map:  70%|███████   | 152436/216925 [03:09<01:18, 816.81 examples/s]Map:  72%|███████▏  | 155178/216925 [03:09<01:19, 780.89 examples/s]Map:  68%|██████▊   | 147926/216925 [03:10<01:20, 854.20 examples/s]Map:  71%|███████   | 153953/216925 [03:10<01:11, 883.95 examples/s]Map:  70%|███████   | 152526/216925 [03:09<01:17, 836.10 examples/s]Map:  72%|███████▏  | 155265/216925 [03:09<01:16, 801.96 examples/s]Map:  70%|███████   | 152614/216925 [03:09<01:15, 846.84 examples/s]Map:  72%|███████▏  | 155355/216925 [03:09<01:14, 824.98 examples/s]Map:  71%|███████   | 154044/216925 [03:10<01:30, 695.89 examples/s]Map:  70%|███████   | 152707/216925 [03:09<01:14, 867.81 examples/s]Map:  68%|██████▊   | 148047/216925 [03:11<01:37, 706.08 examples/s]Map:  72%|███████▏  | 155444/216925 [03:09<01:13, 838.91 examples/s]Map:  71%|███████   | 154136/216925 [03:11<01:23, 749.43 examples/s]Map:  68%|██████▊   | 148139/216925 [03:11<01:31, 750.65 examples/s]Map:  72%|███████▏  | 155534/216925 [03:09<01:11, 853.30 examples/s]Map:  70%|███████   | 152842/216925 [03:09<01:13, 875.31 examples/s]Map:  71%|███████   | 154227/216925 [03:11<01:19, 788.30 examples/s]Map:  68%|██████▊   | 148231/216925 [03:11<01:26, 789.75 examples/s]Map:  72%|███████▏  | 155625/216925 [03:09<01:10, 865.79 examples/s]Map:  71%|███████   | 154315/216925 [03:11<01:17, 809.92 examples/s]Map:  71%|███████   | 152974/216925 [03:10<01:13, 870.95 examples/s]Map:  68%|██████▊   | 148323/216925 [03:11<01:23, 820.21 examples/s]Map:  72%|███████▏  | 155716/216925 [03:10<01:09, 875.80 examples/s]Map:  71%|███████   | 154409/216925 [03:11<01:14, 843.72 examples/s]Map:  68%|██████▊   | 148412/216925 [03:11<01:21, 835.93 examples/s]Map:  72%|███████▏  | 155813/216925 [03:10<01:07, 898.86 examples/s]Map:  71%|███████   | 154501/216925 [03:11<01:12, 863.45 examples/s]Map:  68%|██████▊   | 148501/216925 [03:11<01:20, 845.05 examples/s]Map:  71%|███████   | 153081/216925 [03:10<01:30, 704.55 examples/s]Map:  72%|███████▏  | 155950/216925 [03:10<01:07, 901.97 examples/s]Map:  68%|██████▊   | 148593/216925 [03:11<01:19, 863.67 examples/s]Map:  71%|███████   | 153174/216925 [03:10<01:25, 749.61 examples/s]Map:  71%|███████▏  | 154635/216925 [03:11<01:11, 871.89 examples/s]Map:  69%|██████▊   | 148683/216925 [03:11<01:18, 872.53 examples/s]Map:  71%|███████   | 153268/216925 [03:10<01:20, 789.91 examples/s]Map:  71%|███████▏  | 154727/216925 [03:11<01:10, 883.65 examples/s]Map:  72%|███████▏  | 156043/216925 [03:10<01:24, 718.16 examples/s]Map:  69%|██████▊   | 148779/216925 [03:11<01:16, 894.13 examples/s]Map:  71%|███████   | 153355/216925 [03:10<01:18, 807.18 examples/s]Map:  71%|███████▏  | 154820/216925 [03:11<01:09, 892.23 examples/s]Map:  72%|███████▏  | 156138/216925 [03:10<01:18, 770.31 examples/s]Map:  71%|███████   | 153444/216925 [03:10<01:16, 824.72 examples/s]Map:  69%|██████▊   | 148912/216925 [03:12<01:16, 887.97 examples/s]Map:  72%|███████▏  | 156232/216925 [03:10<01:14, 809.40 examples/s]Map:  71%|███████▏  | 154954/216925 [03:11<01:10, 884.95 examples/s]Map:  71%|███████   | 153535/216925 [03:10<01:14, 845.76 examples/s]Map:  72%|███████▏  | 156323/216925 [03:10<01:12, 832.01 examples/s]Map:  71%|███████   | 153624/216925 [03:10<01:14, 853.81 examples/s]Map:  72%|███████▏  | 156411/216925 [03:10<01:11, 842.97 examples/s]Map:  71%|███████▏  | 155044/216925 [03:12<01:27, 709.70 examples/s]Map:  69%|██████▊   | 149044/216925 [03:12<01:33, 726.39 examples/s]Map:  71%|███████   | 153745/216925 [03:11<01:15, 832.41 examples/s]Map:  72%|███████▏  | 155135/216925 [03:12<01:21, 754.23 examples/s]Map:  69%|██████▉   | 149140/216925 [03:12<01:27, 773.85 examples/s]Map:  72%|███████▏  | 156534/216925 [03:11<01:12, 831.96 examples/s]Map:  71%|███████   | 153832/216925 [03:11<01:15, 838.49 examples/s]Map:  72%|███████▏  | 155224/216925 [03:12<01:18, 786.48 examples/s]Map:  69%|██████▉   | 149231/216925 [03:12<01:24, 803.34 examples/s]Map:  71%|███████   | 153919/216925 [03:11<01:14, 846.61 examples/s]Map:  72%|███████▏  | 156662/216925 [03:11<01:12, 835.44 examples/s]Map:  72%|███████▏  | 155312/216925 [03:12<01:16, 810.08 examples/s]Map:  69%|██████▉   | 149321/216925 [03:12<01:21, 825.73 examples/s]Map:  72%|███████▏  | 155403/216925 [03:12<01:13, 834.57 examples/s]Map:  69%|██████▉   | 149417/216925 [03:12<01:18, 857.33 examples/s]Map:  72%|███████▏  | 156791/216925 [03:11<01:11, 841.90 examples/s]Map:  72%|███████▏  | 155491/216925 [03:12<01:12, 842.47 examples/s]Map:  71%|███████   | 154041/216925 [03:11<01:31, 687.35 examples/s]Map:  69%|██████▉   | 149548/216925 [03:12<01:18, 860.58 examples/s]Map:  72%|███████▏  | 156915/216925 [03:11<01:11, 834.65 examples/s]Map:  71%|███████   | 154131/216925 [03:11<01:25, 732.58 examples/s]Map:  72%|███████▏  | 155620/216925 [03:12<01:12, 848.27 examples/s]Map:  69%|██████▉   | 149637/216925 [03:12<01:17, 866.30 examples/s]Map:  71%|███████   | 154221/216925 [03:11<01:21, 770.21 examples/s]Map:  72%|███████▏  | 155709/216925 [03:12<01:11, 855.42 examples/s]Map:  69%|██████▉   | 149726/216925 [03:13<01:17, 869.74 examples/s]Map:  72%|███████▏  | 157000/216925 [03:11<01:28, 679.33 examples/s]Map:  71%|███████   | 154310/216925 [03:11<01:18, 798.50 examples/s]Map:  72%|███████▏  | 155798/216925 [03:13<01:10, 863.71 examples/s]Map:  69%|██████▉   | 149816/216925 [03:13<01:16, 874.82 examples/s]Map:  72%|███████▏  | 157086/216925 [03:11<01:23, 716.17 examples/s]Map:  71%|███████   | 154400/216925 [03:11<01:15, 823.09 examples/s]Map:  72%|███████▏  | 155887/216925 [03:13<01:10, 869.53 examples/s]Map:  72%|███████▏  | 157177/216925 [03:11<01:18, 758.57 examples/s]Map:  69%|██████▉   | 149947/216925 [03:13<01:17, 867.21 examples/s]Map:  71%|███████   | 154492/216925 [03:11<01:13, 849.01 examples/s]Map:  72%|███████▏  | 155980/216925 [03:13<01:08, 884.79 examples/s]Map:  72%|███████▏  | 157270/216925 [03:12<01:14, 798.52 examples/s]Map:  71%|███████▏  | 154623/216925 [03:12<01:12, 854.87 examples/s]Map:  73%|███████▎  | 157363/216925 [03:12<01:11, 830.32 examples/s]Map:  69%|██████▉   | 150044/216925 [03:13<01:35, 700.96 examples/s]Map:  72%|███████▏  | 156094/216925 [03:13<01:25, 711.17 examples/s]Map:  71%|███████▏  | 154713/216925 [03:12<01:12, 862.25 examples/s]Map:  73%|███████▎  | 157451/216925 [03:12<01:10, 842.60 examples/s]Map:  69%|██████▉   | 150137/216925 [03:13<01:29, 748.79 examples/s]Map:  72%|███████▏  | 156187/216925 [03:13<01:19, 761.62 examples/s]Map:  71%|███████▏  | 154805/216925 [03:12<01:11, 872.35 examples/s]Map:  73%|███████▎  | 157544/216925 [03:12<01:08, 863.03 examples/s]Map:  69%|██████▉   | 150227/216925 [03:13<01:25, 782.56 examples/s]Map:  72%|███████▏  | 156278/216925 [03:13<01:16, 796.04 examples/s]Map:  71%|███████▏  | 154898/216925 [03:12<01:10, 886.09 examples/s]Map:  69%|██████▉   | 150317/216925 [03:13<01:22, 810.24 examples/s]Map:  73%|███████▎  | 157673/216925 [03:12<01:08, 858.87 examples/s]Map:  72%|███████▏  | 156373/216925 [03:13<01:12, 834.12 examples/s]Map:  69%|██████▉   | 150402/216925 [03:13<01:21, 819.19 examples/s]Map:  73%|███████▎  | 157763/216925 [03:12<01:08, 866.66 examples/s]Map:  72%|███████▏  | 156461/216925 [03:13<01:11, 843.55 examples/s]Map:  71%|███████▏  | 155000/216925 [03:12<01:28, 700.55 examples/s]Map:  69%|██████▉   | 150487/216925 [03:14<01:20, 827.57 examples/s]Map:  73%|███████▎  | 157854/216925 [03:12<01:07, 875.32 examples/s]Map:  71%|███████▏  | 155086/216925 [03:12<01:24, 735.34 examples/s]Map:  72%|███████▏  | 156592/216925 [03:13<01:10, 850.51 examples/s]Map:  69%|██████▉   | 150576/216925 [03:14<01:18, 840.50 examples/s]Map:  73%|███████▎  | 157945/216925 [03:12<01:06, 884.30 examples/s]Map:  72%|███████▏  | 155175/216925 [03:12<01:20, 771.16 examples/s]Map:  72%|███████▏  | 156680/216925 [03:14<01:10, 856.34 examples/s]Map:  69%|██████▉   | 150667/216925 [03:14<01:17, 857.96 examples/s]Map:  72%|███████▏  | 155261/216925 [03:12<01:17, 792.36 examples/s]Map:  72%|███████▏  | 156775/216925 [03:14<01:08, 878.40 examples/s]Map:  69%|██████▉   | 150761/216925 [03:14<01:15, 876.70 examples/s]Map:  73%|███████▎  | 158045/216925 [03:13<01:23, 701.64 examples/s]Map:  72%|███████▏  | 155350/216925 [03:13<01:15, 815.21 examples/s]Map:  72%|███████▏  | 156865/216925 [03:14<01:08, 881.81 examples/s]Map:  70%|██████▉   | 150855/216925 [03:14<01:14, 890.93 examples/s]Map:  73%|███████▎  | 158139/216925 [03:13<01:17, 757.07 examples/s]Map:  72%|███████▏  | 155438/216925 [03:13<01:14, 830.57 examples/s]Map:  72%|███████▏  | 156957/216925 [03:14<01:07, 890.71 examples/s]Map:  70%|██████▉   | 150947/216925 [03:14<01:13, 895.80 examples/s]Map:  73%|███████▎  | 158233/216925 [03:13<01:13, 801.47 examples/s]Map:  72%|███████▏  | 155526/216925 [03:13<01:12, 842.47 examples/s]Map:  73%|███████▎  | 158325/216925 [03:13<01:10, 831.51 examples/s]Map:  72%|███████▏  | 155615/216925 [03:13<01:12, 850.37 examples/s]Map:  70%|██████▉   | 151044/216925 [03:14<01:34, 698.31 examples/s]Map:  73%|███████▎  | 158415/216925 [03:13<01:08, 848.71 examples/s]Map:  72%|███████▏  | 157091/216925 [03:14<01:22, 721.94 examples/s]Map:  72%|███████▏  | 155705/216925 [03:13<01:11, 857.37 examples/s]Map:  70%|██████▉   | 151130/216925 [03:14<01:29, 735.29 examples/s]Map:  73%|███████▎  | 158512/216925 [03:13<01:06, 878.65 examples/s]Map:  72%|███████▏  | 157180/216925 [03:14<01:18, 757.65 examples/s]Map:  72%|███████▏  | 155798/216925 [03:13<01:09, 874.51 examples/s]Map:  70%|██████▉   | 151216/216925 [03:14<01:25, 765.36 examples/s]Map:  73%|███████▎  | 158603/216925 [03:13<01:06, 882.77 examples/s]Map:  72%|███████▏  | 157270/216925 [03:14<01:15, 789.90 examples/s]Map:  70%|██████▉   | 151310/216925 [03:15<01:20, 810.47 examples/s]Map:  72%|███████▏  | 155927/216925 [03:13<01:10, 866.17 examples/s]Map:  73%|███████▎  | 158699/216925 [03:13<01:04, 900.02 examples/s]Map:  73%|███████▎  | 157362/216925 [03:14<01:12, 821.43 examples/s]Map:  70%|██████▉   | 151401/216925 [03:15<01:18, 837.00 examples/s]Map:  73%|███████▎  | 157450/216925 [03:15<01:11, 834.42 examples/s]Map:  73%|███████▎  | 158823/216925 [03:13<01:06, 868.59 examples/s]Map:  70%|██████▉   | 151530/216925 [03:15<01:17, 840.59 examples/s]Map:  72%|███████▏  | 156043/216925 [03:13<01:28, 685.63 examples/s]Map:  73%|███████▎  | 158913/216925 [03:13<01:06, 875.34 examples/s]Map:  73%|███████▎  | 157575/216925 [03:15<01:11, 829.44 examples/s]Map:  70%|██████▉   | 151623/216925 [03:15<01:15, 861.59 examples/s]Map:  72%|███████▏  | 156134/216925 [03:14<01:22, 732.93 examples/s]Map:  73%|███████▎  | 157669/216925 [03:15<01:09, 856.30 examples/s]Map:  70%|██████▉   | 151712/216925 [03:15<01:15, 867.51 examples/s]Map:  72%|███████▏  | 156227/216925 [03:14<01:18, 775.90 examples/s]Map:  73%|███████▎  | 157758/216925 [03:15<01:08, 861.81 examples/s]Map:  73%|███████▎  | 159045/216925 [03:14<01:20, 721.49 examples/s]Map:  70%|██████▉   | 151802/216925 [03:15<01:14, 873.39 examples/s]Map:  72%|███████▏  | 156319/216925 [03:14<01:14, 809.79 examples/s]Map:  73%|███████▎  | 159139/216925 [03:14<01:15, 768.62 examples/s]Map:  73%|███████▎  | 157885/216925 [03:15<01:09, 853.38 examples/s]Map:  70%|���██████   | 151894/216925 [03:15<01:13, 884.28 examples/s]Map:  72%|███████▏  | 156407/216925 [03:14<01:13, 825.30 examples/s]Map:  73%|███████▎  | 159230/216925 [03:14<01:12, 799.83 examples/s]Map:  73%|███████▎  | 157978/216925 [03:15<01:07, 871.11 examples/s]Map:  70%|███████   | 151984/216925 [03:15<01:13, 886.47 examples/s]Map:  72%|███████▏  | 156498/216925 [03:14<01:11, 844.44 examples/s]Map:  73%|███████▎  | 159321/216925 [03:14<01:09, 824.92 examples/s]Map:  72%|███████▏  | 156589/216925 [03:14<01:10, 858.73 examples/s]Map:  73%|███████▎  | 159412/216925 [03:14<01:08, 844.62 examples/s]Map:  73%|███████▎  | 158090/216925 [03:15<01:23, 708.01 examples/s]Map:  72%|███████▏  | 156678/216925 [03:14<01:09, 863.49 examples/s]Map:  70%|███████   | 152086/216925 [03:16<01:35, 676.10 examples/s]Map:  74%|███████▎  | 159507/216925 [03:14<01:05, 872.00 examples/s]Map:  73%|███████▎  | 158175/216925 [03:15<01:19, 737.70 examples/s]Map:  70%|███████   | 152172/216925 [03:16<01:30, 716.31 examples/s]Map:  72%|███████▏  | 156805/216925 [03:14<01:10, 853.35 examples/s]Map:  74%|███████▎  | 159599/216925 [03:14<01:04, 883.05 examples/s]Map:  73%|███████▎  | 158268/216925 [03:16<01:15, 781.69 examples/s]Map:  70%|███████   | 152259/216925 [03:16<01:25, 753.29 examples/s]Map:  72%|███████▏  | 156892/216925 [03:14<01:10, 854.88 examples/s]Map:  73%|███████▎  | 158361/216925 [03:16<01:11, 816.59 examples/s]Map:  74%|███████▎  | 159736/216925 [03:14<01:04, 889.76 examples/s]Map:  70%|███████   | 152344/216925 [03:16<01:23, 774.81 examples/s]Map:  72%|███████▏  | 156980/216925 [03:15<01:09, 859.60 examples/s]Map:  73%|███████▎  | 158453/216925 [03:16<01:09, 839.21 examples/s]Map:  74%|███████▎  | 159828/216925 [03:15<01:03, 896.33 examples/s]Map:  70%|███████   | 152429/216925 [03:16<01:21, 793.84 examples/s]Map:  73%|███████▎  | 158579/216925 [03:16<01:09, 836.20 examples/s]Map:  74%|███████▎  | 159948/216925 [03:15<01:06, 858.60 examples/s]Map:  70%|███████   | 152557/216925 [03:16<01:19, 811.20 examples/s]Map:  72%|███████▏  | 157084/216925 [03:15<01:28, 675.35 examples/s]Map:  73%|███████▎  | 158673/216925 [03:16<01:07, 860.68 examples/s]Map:  70%|███████   | 152644/216925 [03:16<01:18, 823.62 examples/s]Map:  72%|███████▏  | 157174/216925 [03:15<01:22, 725.89 examples/s]Map:  73%|███████▎  | 158765/216925 [03:16<01:06, 873.72 examples/s]Map:  74%|███████▍  | 160045/216925 [03:15<01:22, 690.39 examples/s]Map:  70%|███████   | 152728/216925 [03:16<01:17, 825.27 examples/s]Map:  72%|███████▏  | 157260/216925 [03:15<01:18, 757.18 examples/s]Map:  73%|███████▎  | 158859/216925 [03:16<01:05, 888.96 examples/s]Map:  74%|███████▍  | 160138/216925 [03:15<01:16, 742.23 examples/s]Map:  70%|███████   | 152817/216925 [03:16<01:16, 840.09 examples/s]Map:  73%|███████▎  | 157349/216925 [03:15<01:15, 788.46 examples/s]Map:  74%|███████▍  | 160228/216925 [03:15<01:12, 778.35 examples/s]Map:  70%|███████   | 152903/216925 [03:16<01:15, 842.88 examples/s]Map:  73%|███████▎  | 157433/216925 [03:15<01:14, 801.09 examples/s]Map:  73%|███████▎  | 158992/216925 [03:16<01:05, 884.34 examples/s]Map:  74%|███████▍  | 160316/216925 [03:15<01:10, 799.29 examples/s]Map:  71%|███████   | 152989/216925 [03:17<01:15, 846.16 examples/s]Map:  73%|███████▎  | 157519/216925 [03:15<01:12, 814.72 examples/s]Map:  74%|███████▍  | 160405/216925 [03:15<01:08, 819.33 examples/s]Map:  73%|███████▎  | 157604/216925 [03:15<01:12, 822.09 examples/s]Map:  73%|███████▎  | 159087/216925 [03:17<01:21, 708.85 examples/s]Map:  74%|███████▍  | 160493/216925 [03:15<01:07, 832.58 examples/s]Map:  73%|███████▎  | 157697/216925 [03:15<01:09, 846.45 examples/s]Map:  71%|███████   | 153087/216925 [03:17<01:35, 669.78 examples/s]Map:  73%|███████▎  | 159177/216925 [03:17<01:16, 750.44 examples/s]Map:  74%|███████▍  | 160580/216925 [03:16<01:07, 840.04 examples/s]Map:  73%|███████▎  | 157786/216925 [03:16<01:09, 856.62 examples/s]Map:  71%|███████   | 153180/216925 [03:17<01:27, 729.97 examples/s]Map:  73%|███████▎  | 159268/216925 [03:17<01:13, 786.95 examples/s]Map:  74%|███████▍  | 160670/216925 [03:16<01:05, 854.55 examples/s]Map:  71%|███████   | 153266/216925 [03:17<01:23, 758.68 examples/s]Map:  73%|███████▎  | 159358/216925 [03:17<01:10, 812.07 examples/s]Map:  73%|███████▎  | 157916/216925 [03:16<01:08, 856.30 examples/s]Map:  74%|███████▍  | 160757/216925 [03:16<01:05, 854.35 examples/s]Map:  71%|███████   | 153358/216925 [03:17<01:19, 800.16 examples/s]Map:  74%|███████▎  | 159447/216925 [03:17<01:09, 830.35 examples/s]Map:  74%|███████▍  | 160844/216925 [03:16<01:05, 854.39 examples/s]Map:  71%|███████   | 153446/216925 [03:17<01:17, 817.24 examples/s]Map:  74%|███████▎  | 159538/216925 [03:17<01:07, 849.04 examples/s]Map:  73%|███████▎  | 158037/216925 [03:16<01:25, 691.85 examples/s]Map:  74%|███████▍  | 160964/216925 [03:16<01:07, 828.18 examples/s]Map:  71%|███████   | 153565/216925 [03:17<01:18, 804.21 examples/s]Map:  74%|███████▎  | 159661/216925 [03:17<01:08, 833.81 examples/s]Map:  73%|███████▎  | 158114/216925 [03:16<01:23, 708.28 examples/s]Map:  71%|███████   | 153651/216925 [03:17<01:17, 815.58 examples/s]Map:  74%|███████▎  | 159754/216925 [03:17<01:06, 857.53 examples/s]Map:  73%|███████▎  | 158205/216925 [03:16<01:18, 752.58 examples/s]Map:  71%|███████   | 153738/216925 [03:18<01:16, 827.83 examples/s]Map:  74%|███████▎  | 159847/216925 [03:17<01:05, 873.93 examples/s]Map:  73%|███████▎  | 158292/216925 [03:16<01:15, 779.62 examples/s]Map:  74%|███████▍  | 161083/216925 [03:16<01:25, 652.48 examples/s]Map:  71%|███████   | 153830/216925 [03:18<01:14, 850.19 examples/s]Map:  73%|███████▎  | 158380/216925 [03:16<01:13, 801.75 examples/s]Map:  74%|███████▍  | 161173/216925 [03:16<01:19, 702.44 examples/s]Map:  74%|███████▎  | 159977/216925 [03:18<01:05, 867.65 examples/s]Map:  71%|███████   | 153920/216925 [03:18<01:13, 859.59 examples/s]Map:  73%|███████▎  | 158468/216925 [03:16<01:11, 819.93 examples/s]Map:  74%|███████▍  | 161261/216925 [03:16<01:15, 741.58 examples/s]Map:  73%|███████▎  | 158554/216925 [03:17<01:10, 828.87 examples/s]Map:  74%|███████▍  | 161347/216925 [03:17<01:12, 767.02 examples/s]Map:  74%|███████▍  | 160088/216925 [03:18<01:19, 713.22 examples/s]Map:  73%|███████▎  | 158640/216925 [03:17<01:09, 837.37 examples/s]Map:  71%|███████   | 154045/216925 [03:18<01:29, 699.48 examples/s]Map:  74%|███████▍  | 161438/216925 [03:17<01:09, 802.12 examples/s]Map:  74%|███████▍  | 160180/216925 [03:18<01:15, 755.95 examples/s]Map:  73%|███████▎  | 158728/216925 [03:17<01:08, 846.50 examples/s]Map:  71%|███████   | 154134/216925 [03:18<01:24, 739.84 examples/s]Map:  74%|███████▍  | 160268/216925 [03:18<01:12, 783.50 examples/s]Map:  74%|███████▍  | 161565/216925 [03:17<01:08, 813.27 examples/s]Map:  73%|███████▎  | 158814/216925 [03:17<01:08, 845.94 examples/s]Map:  71%|███████   | 154221/216925 [03:18<01:21, 768.94 examples/s]Map:  74%|███████▍  | 160358/216925 [03:18<01:09, 809.86 examples/s]Map:  75%|███████▍  | 161656/216925 [03:17<01:06, 835.69 examples/s]Map:  73%|███████▎  | 158904/216925 [03:17<01:07, 859.92 examples/s]Map:  71%|███████   | 154312/216925 [03:18<01:18, 802.55 examples/s]Map:  74%|███████▍  | 160447/216925 [03:18<01:08, 827.08 examples/s]Map:  73%|███████▎  | 158994/216925 [03:17<01:06, 865.96 examples/s]Map:  71%|███████   | 154400/216925 [03:18<01:16, 821.32 examples/s]Map:  75%|███████▍  | 161781/216925 [03:17<01:06, 831.40 examples/s]Map:  74%|███████▍  | 160537/216925 [03:18<01:06, 844.33 examples/s]Map:  71%|███████   | 154489/216925 [03:18<01:14, 837.43 examples/s]Map:  75%|███████▍  | 161868/216925 [03:17<01:05, 838.95 examples/s]Map:  74%|███████▍  | 160629/216925 [03:18<01:05, 861.50 examples/s]Map:  73%|███████▎  | 159083/216925 [03:17<01:26, 670.18 examples/s]Map:  71%|███████▏  | 154576/216925 [03:19<01:13, 843.84 examples/s]Map:  75%|███████▍  | 161993/216925 [03:17<01:05, 835.76 examples/s]Map:  73%|███████▎  | 159162/216925 [03:17<01:22, 697.84 examples/s]Map:  74%|███████▍  | 160750/216925 [03:19<01:07, 831.83 examples/s]Map:  71%|███████▏  | 154695/216925 [03:19<01:15, 822.27 examples/s]Map:  73%|███████▎  | 159252/216925 [03:17<01:17, 747.26 examples/s]Map:  74%|████��██▍  | 160842/216925 [03:19<01:05, 854.60 examples/s]Map:  71%|███████▏  | 154780/216925 [03:19<01:15, 828.07 examples/s]Map:  75%|███████▍  | 162084/216925 [03:18<01:22, 661.57 examples/s]Map:  73%|███████▎  | 159342/216925 [03:18<01:13, 785.15 examples/s]Map:  74%|███████▍  | 160935/216925 [03:19<01:04, 874.13 examples/s]Map:  71%|███████▏  | 154871/216925 [03:19<01:13, 849.49 examples/s]Map:  75%|███████▍  | 162171/216925 [03:18<01:17, 705.32 examples/s]Map:  73%|███████▎  | 159429/216925 [03:18<01:11, 806.00 examples/s]Map:  75%|███████▍  | 162259/216925 [03:18<01:13, 744.69 examples/s]Map:  74%|███████▎  | 159519/216925 [03:18<01:09, 829.33 examples/s]Map:  71%|███████▏  | 154996/216925 [03:19<01:14, 835.41 examples/s]Map:  74%|███████▍  | 161045/216925 [03:19<01:18, 710.23 examples/s]Map:  75%|███████▍  | 162347/216925 [03:18<01:10, 776.22 examples/s]Map:  74%|███████▎  | 159605/216925 [03:18<01:08, 836.74 examples/s]Map:  74%|███████▍  | 161134/216925 [03:19<01:14, 750.71 examples/s]Map:  75%|███████▍  | 162430/216925 [03:18<01:09, 787.63 examples/s]Map:  74%|███████▎  | 159692/216925 [03:18<01:07, 842.72 examples/s]Map:  71%|███████▏  | 155088/216925 [03:19<01:31, 676.83 examples/s]Map:  74%|███████▍  | 161223/216925 [03:19<01:10, 784.60 examples/s]Map:  75%|███████▍  | 162521/216925 [03:18<01:06, 818.69 examples/s]Map:  72%|███████▏  | 155177/216925 [03:19<01:25, 722.95 examples/s]Map:  74%|███████▍  | 161313/216925 [03:19<01:08, 812.25 examples/s]Map:  74%|███████▎  | 159823/216925 [03:18<01:07, 850.33 examples/s]Map:  75%|███████▍  | 162608/216925 [03:18<01:05, 830.96 examples/s]Map:  72%|███████▏  | 155263/216925 [03:20<01:21, 752.84 examples/s]Map:  74%|███████▍  | 161399/216925 [03:19<01:07, 824.23 examples/s]Map:  74%|███████▎  | 159911/216925 [03:18<01:06, 854.59 examples/s]Map:  72%|███████▏  | 155349/216925 [03:20<01:18, 779.67 examples/s]Map:  74%|███████▍  | 161490/216925 [03:19<01:05, 846.11 examples/s]Map:  75%|███████▌  | 162735/216925 [03:18<01:05, 832.80 examples/s]Map:  72%|███████▏  | 155435/216925 [03:20<01:16, 798.86 examples/s]Map:  74%|███████▍  | 161579/216925 [03:20<01:04, 857.86 examples/s]Map:  75%|███████▌  | 162825/216925 [03:18<01:03, 846.68 examples/s]Map:  74%|███████▍  | 160000/216925 [03:18<01:22, 686.74 examples/s]Map:  72%|███████▏  | 155521/216925 [03:20<01:15, 813.27 examples/s]Map:  75%|███████▌  | 162913/216925 [03:19<01:03, 853.09 examples/s]Map:  74%|███████▍  | 160083/216925 [03:19<01:18, 719.78 examples/s]Map:  75%|███████▍  | 161712/216925 [03:20<01:03, 866.49 examples/s]Map:  72%|███████▏  | 155608/216925 [03:20<01:14, 825.78 examples/s]Map:  74%|███████▍  | 160167/216925 [03:19<01:15, 746.84 examples/s]Map:  75%|███████▍  | 161825/216925 [03:20<01:06, 824.48 examples/s]Map:  74%|███████▍  | 160249/216925 [03:19<01:14, 762.59 examples/s]Map:  75%|███████▌  | 163000/216925 [03:19<01:24, 636.94 examples/s]Map:  72%|███████▏  | 155727/216925 [03:20<01:15, 810.66 examples/s]Map:  75%|███████▍  | 161911/216925 [03:20<01:06, 832.43 examples/s]Map:  75%|███████▌  | 163086/216925 [03:19<01:18, 686.27 examples/s]Map:  74%|███████▍  | 160341/216925 [03:19<01:10, 802.91 examples/s]Map:  72%|███████▏  | 155816/216925 [03:20<01:13, 827.95 examples/s]Map:  75%|███████▌  | 163173/216925 [03:19<01:13, 728.46 examples/s]Map:  74%|███████▍  | 160435/216925 [03:19<01:07, 837.61 examples/s]Map:  72%|███████▏  | 155909/216925 [03:20<01:11, 852.19 examples/s]Map:  75%|███████▍  | 162000/216925 [03:20<01:22, 668.28 examples/s]Map:  75%|███████▌  | 163258/216925 [03:19<01:10, 758.31 examples/s]Map:  74%|███████▍  | 160525/216925 [03:19<01:06, 850.07 examples/s]Map:  75%|███████▍  | 162090/216925 [03:20<01:16, 719.67 examples/s]Map:  75%|███████▌  | 163344/216925 [03:19<01:08, 783.52 examples/s]Map:  72%|███████▏  | 156000/216925 [03:20<01:28, 689.76 examples/s]Map:  74%|███████▍  | 160654/216925 [03:19<01:06, 851.36 examples/s]Map:  75%|███████▍  | 162178/216925 [03:20<01:12, 758.49 examples/s]Map:  75%|███████▌  | 163433/216925 [03:19<01:05, 810.62 examples/s]Map:  72%|███████▏  | 156093/216925 [03:21<01:21, 746.87 examples/s]Map:  74%|███████▍  | 160743/216925 [03:19<01:05, 861.12 examples/s]Map:  75%|███████▍  | 162268/216925 [03:21<01:08, 793.64 examples/s]Map:  75%|███████▌  | 163524/216925 [03:19<01:04, 834.06 examples/s]Map:  72%|███████▏  | 156185/216925 [03:21<01:17, 786.22 examples/s]Map:  75%|███████▍  | 162359/216925 [03:21<01:06, 822.77 examples/s]Map:  74%|███████▍  | 160873/216925 [03:19<01:05, 859.75 examples/s]Map:  75%|███████▌  | 163618/216925 [03:19<01:01, 860.95 examples/s]Map:  72%|███████▏  | 156278/216925 [03:21<01:13, 822.09 examples/s]Map:  75%|███████▍  | 162445/216925 [03:21<01:05, 830.56 examples/s]Map:  75%|███████▌  | 163710/216925 [03:20<01:00, 874.66 examples/s]Map:  72%|███████▏  | 156369/216925 [03:21<01:11, 845.01 examples/s]Map:  75%|███████▍  | 162538/216925 [03:21<01:03, 855.96 examples/s]Map:  76%|███████▌  | 163802/216925 [03:20<00:59, 885.99 examples/s]Map:  72%|███████▏  | 156464/216925 [03:21<01:09, 871.64 examples/s]Map:  74%|███████▍  | 161000/216925 [03:20<01:19, 706.46 examples/s]Map:  75%|███████▍  | 162630/216925 [03:21<01:02, 872.89 examples/s]Map:  76%|███████▌  | 163894/216925 [03:20<00:59, 895.39 examples/s]Map:  72%|███████▏  | 156554/216925 [03:21<01:09, 874.66 examples/s]Map:  74%|███████▍  | 161087/216925 [03:20<01:15, 739.46 examples/s]Map:  76%|███████▌  | 163988/216925 [03:20<00:58, 903.20 examples/s]Map:  72%|███████▏  | 156645/216925 [03:21<01:08, 882.21 examples/s]Map:  75%|███████▌  | 162765/216925 [03:21<01:01, 878.70 examples/s]Map:  74%|███████▍  | 161179/216925 [03:20<01:11, 778.01 examples/s]Map:  74%|███████▍  | 161263/216925 [03:20<01:10, 790.92 examples/s]Map:  72%|███████▏  | 156780/216925 [03:21<01:07, 885.39 examples/s]Map:  75%|███████▌  | 162896/216925 [03:21<01:01, 873.70 examples/s]Map:  76%|███████▌  | 164091/216925 [03:20<01:16, 692.72 examples/s]Map:  74%|███████▍  | 161350/216925 [03:20<01:08, 808.98 examples/s]Map:  72%|███████▏  | 156872/216925 [03:21<01:07, 892.94 examples/s]Map:  75%|███████▌  | 162988/216925 [03:21<01:01, 879.96 examples/s]Map:  76%|███████▌  | 164182/216925 [03:20<01:10, 742.92 examples/s]Map:  74%|███████▍  | 161441/216925 [03:20<01:06, 834.45 examples/s]Map:  72%|███████▏  | 156963/216925 [03:22<01:06, 894.97 examples/s]Map:  76%|███████▌  | 164275/216925 [03:20<01:06, 789.84 examples/s]Map:  74%|███████▍  | 161531/216925 [03:20<01:05, 850.23 examples/s]Map:  75%|███████▌  | 163092/216925 [03:22<01:15, 713.09 examples/s]Map:  76%|███████▌  | 164366/216925 [03:20<01:04, 819.89 examples/s]Map:  75%|███████▍  | 161619/216925 [03:20<01:04, 853.33 examples/s]Map:  75%|███████▌  | 163184/216925 [03:22<01:10, 757.84 examples/s]Map:  72%|███████▏  | 157095/216925 [03:22<01:21, 737.69 examples/s]Map:  76%|███████▌  | 164458/216925 [03:20<01:02, 845.80 examples/s]Map:  75%|███████▍  | 161709/216925 [03:20<01:03, 864.83 examples/s]Map:  75%|███████▌  | 163271/216925 [03:22<01:08, 783.64 examples/s]Map:  72%|███████▏  | 157189/216925 [03:22<01:16, 781.22 examples/s]Map:  76%|███████▌  | 164551/216925 [03:21<01:00, 866.11 examples/s]Map:  75%|███████▌  | 163365/216925 [03:22<01:05, 820.93 examples/s]Map:  73%|███████▎  | 157281/216925 [03:22<01:13, 812.72 examples/s]Map:  75%|███████▍  | 161843/216925 [03:21<01:03, 868.56 examples/s]Map:  76%|███████▌  | 164643/216925 [03:21<00:59, 876.39 examples/s]Map:  75%|███████▌  | 163452/216925 [03:22<01:04, 832.65 examples/s]Map:  73%|███████▎  | 157373/216925 [03:22<01:10, 839.02 examples/s]Map:  75%|███████▍  | 161974/216925 [03:21<01:03, 865.92 examples/s]Map:  76%|███████▌  | 164773/216925 [03:21<01:00, 868.23 examples/s]Map:  75%|███████▌  | 163545/216925 [03:22<01:02, 858.33 examples/s]Map:  73%|███████▎  | 157461/216925 [03:22<01:10, 843.62 examples/s]Map:  76%|███████▌  | 164866/216925 [03:21<00:59, 877.60 examples/s]Map:  75%|███████▌  | 163636/216925 [03:22<01:01, 871.48 examples/s]Map:  73%|███████▎  | 157550/216925 [03:22<01:09, 850.27 examples/s]Map:  75%|███████▍  | 162083/216925 [03:21<01:18, 697.18 examples/s]Map:  73%|███████▎  | 157646/216925 [03:22<01:07, 878.84 examples/s]Map:  76%|███████▌  | 164999/216925 [03:21<00:59, 878.55 examples/s]Map:  75%|███████▌  | 163767/216925 [03:22<01:01, 869.29 examples/s]Map:  75%|███████▍  | 162168/216925 [03:21<01:15, 729.44 examples/s]Map:  73%|███████▎  | 157778/216925 [03:23<01:07, 877.08 examples/s]Map:  75%|███████▍  | 162256/216925 [03:21<01:11, 761.14 examples/s]Map:  76%|███████▌  | 163901/216925 [03:22<01:00, 874.90 examples/s]Map:  73%|███████▎  | 157870/216925 [03:23<01:06, 885.16 examples/s]Map:  75%|███████▍  | 162343/216925 [03:21<01:09, 785.15 examples/s]Map:  76%|███████▌  | 165134/216925 [03:21<01:12, 713.63 examples/s]Map:  76%|███████▌  | 163994/216925 [03:23<00:59, 884.56 examples/s]Map:  73%|███████▎  | 157965/216925 [03:23<01:05, 899.49 examples/s]Map:  75%|███████▍  | 162433/216925 [03:21<01:07, 809.56 examples/s]Map:  76%|███████▌  | 165229/216925 [03:21<01:07, 761.71 examples/s]Map:  75%|███████▍  | 162521/216925 [03:22<01:05, 826.34 examples/s]Map:  76%|███████▌  | 165318/216925 [03:22<01:05, 789.23 examples/s]Map:  76%|███████▌  | 164092/216925 [03:23<01:13, 714.72 examples/s]Map:  73%|███████▎  | 158095/216925 [03:23<01:20, 731.61 examples/s]Map:  75%|███████▍  | 162606/216925 [03:22<01:05, 831.09 examples/s]Map:  76%|███████▋  | 165410/216925 [03:22<01:03, 817.52 examples/s]Map:  76%|███████▌  | 164184/216925 [03:23<01:09, 759.71 examples/s]Map:  73%|███████▎  | 158187/216925 [03:23<01:16, 771.88 examples/s]Map:  75%|███████▌  | 162694/216925 [03:22<01:04, 841.54 examples/s]Map:  76%|███████▋  | 165502/216925 [03:22<01:01, 840.38 examples/s]Map:  76%|███████▌  | 164278/216925 [03:23<01:05, 800.98 examples/s]Map:  73%|███████▎  | 158280/216925 [03:23<01:12, 806.52 examples/s]Map:  75%|███████▌  | 162783/216925 [03:22<01:03, 852.77 examples/s]Map:  76%|███████▋  | 165593/216925 [03:22<01:00, 855.44 examples/s]Map:  76%|███████▌  | 164372/216925 [03:23<01:03, 833.73 examples/s]Map:  73%|███████▎  | 158372/216925 [03:23<01:10, 833.85 examples/s]Map:  75%|███████▌  | 162871/216925 [03:22<01:03, 856.53 examples/s]Map:  76%|███████▋  | 165689/216925 [03:22<00:58, 882.97 examples/s]Map:  76%|███████▌  | 164462/216925 [03:23<01:01, 848.95 examples/s]Map:  73%|███████▎  | 158463/216925 [03:23<01:08, 850.82 examples/s]Map:  75%|███████▌  | 162958/216925 [03:22<01:02, 856.71 examples/s]Map:  76%|███████▋  | 165781/216925 [03:22<00:57, 889.73 examples/s]Map:  76%|███████▌  | 164551/216925 [03:23<01:01, 857.00 examples/s]Map:  73%|███████▎  | 158556/216925 [03:23<01:06, 871.60 examples/s]Map:  76%|███████▋  | 165873/216925 [03:22<00:57, 893.65 examples/s]Map:  76%|███████▌  | 164643/216925 [03:23<00:59, 873.13 examples/s]Map:  73%|███████▎  | 158651/216925 [03:24<01:05, 892.33 examples/s]Map:  77%|███████▋  | 165966/216925 [03:22<00:56, 900.78 examples/s]Map:  75%|███████▌  | 163086/216925 [03:22<01:18, 683.65 examples/s]Map:  76%|███████▌  | 164775/216925 [03:23<00:59, 873.98 examples/s]Map:  75%|███████▌  | 163166/216925 [03:22<01:16, 706.30 examples/s]Map:  73%|███████▎  | 158782/216925 [03:24<01:06, 880.36 examples/s]Map:  76%|███████▌  | 164897/216925 [03:24<01:01, 850.52 examples/s]Map:  75%|███████▌  | 163256/216925 [03:22<01:11, 750.24 examples/s]Map:  73%|███████▎  | 158878/216925 [03:24<01:04, 896.76 examples/s]Map:  77%|███████▋  | 166090/216925 [03:22<01:12, 697.29 examples/s]Map:  76%|███████▌  | 164985/216925 [03:24<01:00, 854.62 examples/s]Map:  75%|███████▌  | 163345/216925 [03:23<01:08, 784.62 examples/s]Map:  73%|███████▎  | 158973/216925 [03:24<01:03, 908.85 examples/s]Map:  77%|███████▋  | 166184/216925 [03:23<01:07, 750.11 examples/s]Map:  75%|███████▌  | 163436/216925 [03:23<01:05, 815.11 examples/s]Map:  77%|███████▋  | 166274/216925 [03:23<01:04, 785.22 examples/s]Map:  76%|███████▌  | 165087/216925 [03:24<01:14, 693.47 examples/s]Map:  75%|███████▌  | 163525/216925 [03:23<01:04, 833.67 examples/s]Map:  77%|███████▋  | 166368/216925 [03:23<01:01, 821.92 examples/s]Map:  73%|███████▎  | 159091/216925 [03:24<01:18, 735.15 examples/s]Map:  76%|███████▌  | 165178/216925 [03:24<01:09, 740.61 examples/s]Map:  75%|███████▌  | 163618/216925 [03:23<01:02, 856.42 examples/s]Map:  77%|███████▋  | 166458/216925 [03:23<00:59, 841.14 examples/s]Map:  73%|███████▎  | 159185/216925 [03:24<01:14, 778.80 examples/s]Map:  76%|███████▌  | 165272/216925 [03:24<01:05, 787.01 examples/s]Map:  75%|███████▌  | 163708/216925 [03:23<01:01, 866.90 examples/s]Map:  77%|███████▋  | 166550/216925 [03:23<00:58, 859.62 examples/s]Map:  73%|███████▎  | 159276/216925 [03:24<01:11, 810.31 examples/s]Map:  76%|███████▌  | 165365/216925 [03:24<01:02, 820.55 examples/s]Map:  77%|███████▋  | 166640/216925 [03:23<00:57, 868.44 examples/s]Map:  73%|███████▎  | 159367/216925 [03:24<01:09, 833.50 examples/s]Map:  76%|███████▌  | 163842/216925 [03:23<01:00, 874.56 examples/s]Map:  76%|███████▋  | 165454/216925 [03:24<01:01, 835.62 examples/s]Map:  77%|███████▋  | 166730/216925 [03:23<00:57, 875.70 examples/s]Map:  74%|███████▎  | 159457/216925 [03:25<01:08, 844.98 examples/s]Map:  76%|███████▌  | 163932/216925 [03:23<01:00, 878.58 examples/s]Map:  76%|███████▋  | 165545/216925 [03:24<01:00, 853.41 examples/s]Map:  74%|███████▎  | 159549/216925 [03:25<01:06, 864.54 examples/s]Map:  77%|███████▋  | 166863/216925 [03:23<00:57, 875.68 examples/s]Map:  76%|███████▋  | 165634/216925 [03:25<00:59, 859.31 examples/s]Map:  74%|███████▎  | 159641/216925 [03:25<01:05, 879.11 examples/s]Map:  77%|███████▋  | 166953/216925 [03:23<00:56, 878.28 examples/s]Map:  76%|███████▌  | 164042/216925 [03:23<01:15, 703.18 examples/s]Map:  76%|███████▋  | 165726/216925 [03:25<00:58, 874.00 examples/s]Map:  74%|███████▎  | 159733/216925 [03:25<01:04, 889.70 examples/s]Map:  76%|███████▌  | 164129/216925 [03:24<01:11, 739.67 examples/s]Map:  76%|███████▋  | 165815/216925 [03:25<00:58, 873.72 examples/s]Map:  74%|███████▎  | 159826/216925 [03:25<01:03, 897.96 examples/s]Map:  76%|███████▌  | 164212/216925 [03:24<01:09, 758.94 examples/s]Map:  77%|███████▋  | 167085/216925 [03:24<01:11, 699.44 examples/s]Map:  76%|███████▋  | 165943/216925 [03:25<00:58, 864.42 examples/s]Map:  76%|███████▌  | 164295/216925 [03:24<01:07, 775.90 examples/s]Map:  74%|███████▎  | 159963/216925 [03:25<01:03, 897.27 examples/s]Map:  77%|███████▋  | 167174/216925 [03:24<01:07, 738.31 examples/s]Map:  77%|███████▋  | 167265/216925 [03:24<01:04, 775.79 examples/s]Map:  76%|███████▌  | 164391/216925 [03:24<01:12, 722.73 examples/s]Map:  77%|███████▋  | 166043/216925 [03:25<01:12, 699.42 examples/s]Map:  74%|███████▍  | 160088/216925 [03:25<01:18, 725.94 examples/s]Map:  77%|███████▋  | 167354/216925 [03:24<01:01, 801.84 examples/s]Map:  76%|███████▌  | 164472/216925 [03:24<01:10, 743.84 examples/s]Map:  77%|███████▋  | 166134/216925 [03:25<01:08, 746.58 examples/s]Map:  74%|███████▍  | 160180/216925 [03:25<01:14, 765.69 examples/s]Map:  77%|███████▋  | 167446/216925 [03:24<00:59, 830.41 examples/s]Map:  76%|███████▌  | 164560/216925 [03:24<01:07, 777.14 examples/s]Map:  77%|███████▋  | 166227/216925 [03:25<01:04, 788.22 examples/s]Map:  74%|███████▍  | 160273/216925 [03:26<01:10, 803.70 examples/s]Map:  76%|███████▌  | 164648/216925 [03:24<01:05, 803.23 examples/s]Map:  77%|███████▋  | 166317/216925 [03:25<01:02, 814.19 examples/s]Map:  77%|███████▋  | 167574/216925 [03:24<00:59, 833.35 examples/s]Map:  74%|███████▍  | 160366/216925 [03:26<01:07, 833.36 examples/s]Map:  76%|███████▌  | 164733/216925 [03:24<01:04, 813.19 examples/s]Map:  77%|███████▋  | 166411/216925 [03:26<00:59, 845.73 examples/s]Map:  77%|███████▋  | 167667/216925 [03:24<00:57, 855.28 examples/s]Map:  74%|███████▍  | 160456/216925 [03:26<01:06, 849.54 examples/s]Map:  76%|███████▌  | 164822/216925 [03:24<01:02, 833.69 examples/s]Map:  77%|███████▋  | 166502/216925 [03:26<00:58, 860.13 examples/s]Map:  77%|███████▋  | 167759/216925 [03:24<00:56, 868.41 examples/s]Map:  74%|███████▍  | 160550/216925 [03:26<01:04, 871.77 examples/s]Map:  76%|███████▌  | 164909/216925 [03:25<01:02, 837.66 examples/s]Map:  77%|███████▋  | 166591/216925 [03:26<00:58, 864.84 examples/s]Map:  77%|███████▋  | 167850/216925 [03:25<00:55, 877.22 examples/s]Map:  74%|███████▍  | 160644/216925 [03:26<01:03, 888.08 examples/s]Map:  76%|███████▌  | 164998/216925 [03:25<01:01, 850.06 examples/s]Map:  77%|███████▋  | 166683/216925 [03:26<00:57, 879.29 examples/s]Map:  77%|███████▋  | 167941/216925 [03:25<00:55, 882.40 examples/s]Map:  74%|███████▍  | 160736/216925 [03:26<01:02, 892.93 examples/s]Map:  77%|███████▋  | 166816/216925 [03:26<00:57, 876.39 examples/s]Map:  76%|███████▌  | 165087/216925 [03:25<01:17, 668.39 examples/s]Map:  74%|███████▍  | 160870/216925 [03:26<01:02, 890.96 examples/s]Map:  77%|███████▋  | 168042/216925 [03:25<01:10, 689.39 examples/s]Map:  77%|███████▋  | 166907/216925 [03:26<00:56, 882.79 examples/s]Map:  76%|███████▌  | 165169/216925 [03:25<01:13, 704.65 examples/s]Map:  78%|███████▊  | 168127/216925 [03:25<01:07, 725.28 examples/s]Map:  76%|███████▌  | 165259/216925 [03:25<01:08, 752.88 examples/s]Map:  78%|███████▊  | 168218/216925 [03:25<01:03, 768.77 examples/s]Map:  77%|███████▋  | 167000/216925 [03:26<01:11, 694.29 examples/s]Map:  74%|███████▍  | 161000/216925 [03:26<01:16, 730.00 examples/s]Map:  76%|███████▌  | 165345/216925 [03:25<01:06, 777.63 examples/s]Map:  78%|███████▊  | 168311/216925 [03:25<01:00, 808.09 examples/s]Map:  77%|███████▋  | 167087/216925 [03:26<01:07, 734.63 examples/s]Map:  74%|███████▍  | 161086/216925 [03:27<01:13, 757.68 examples/s]Map:  76%|███████▋  | 165430/216925 [03:25<01:04, 793.29 examples/s]Map:  78%|███████▊  | 168403/216925 [03:25<00:57, 837.01 examples/s]Map:  77%|███████▋  | 167177/216925 [03:26<01:04, 775.33 examples/s]Map:  74%|███████▍  | 161176/216925 [03:27<01:10, 788.61 examples/s]Map:  76%|███████▋  | 165522/216925 [03:25<01:02, 825.59 examples/s]Map:  78%|███████▊  | 168496/216925 [03:25<00:56, 860.63 examples/s]Map:  77%|███████▋  | 167267/216925 [03:27<01:01, 807.29 examples/s]Map:  74%|███████▍  | 161267/216925 [03:27<01:08, 814.61 examples/s]Map:  76%|███████▋  | 165608/216925 [03:25<01:01, 834.43 examples/s]Map:  77%|███████▋  | 167360/216925 [03:27<00:59, 837.27 examples/s]Map:  74%|███████▍  | 161364/216925 [03:27<01:05, 854.43 examples/s]Map:  76%|███████▋  | 165700/216925 [03:26<00:59, 856.62 examples/s]Map:  78%|███████▊  | 168628/216925 [03:26<00:55, 863.99 examples/s]Map:  77%|███████▋  | 167457/216925 [03:27<00:56, 873.90 examples/s]Map:  74%|███████▍  | 161460/216925 [03:27<01:03, 878.19 examples/s]Map:  76%|███████▋  | 165788/216925 [03:26<00:59, 861.38 examples/s]Map:  78%|███████▊  | 168717/216925 [03:26<00:55, 869.35 examples/s]Map:  77%|███████▋  | 167549/216925 [03:27<00:55, 884.91 examples/s]Map:  76%|███████▋  | 165876/216925 [03:26<00:59, 861.56 examples/s]Map:  78%|███████▊  | 168808/216925 [03:26<00:54, 876.24 examples/s]Map:  74%|███████▍  | 161596/216925 [03:27<01:02, 882.94 examples/s]Map:  77%|███████▋  | 165965/216925 [03:26<00:58, 868.61 examples/s]Map:  78%|███████▊  | 168899/216925 [03:26<00:54, 882.05 examples/s]Map:  77%|███████▋  | 167681/216925 [03:27<00:55, 880.67 examples/s]Map:  75%|███████▍  | 161692/216925 [03:27<01:01, 900.19 examples/s]Map:  78%|███████▊  | 168993/216925 [03:26<00:53, 893.84 examples/s]Map:  77%|███████▋  | 167773/216925 [03:27<00:55, 885.85 examples/s]Map:  75%|███████▍  | 161825/216925 [03:27<01:01, 891.29 examples/s]Map:  77%|███████▋  | 167864/216925 [03:27<00:55, 889.42 examples/s]Map:  77%|███████▋  | 166082/216925 [03:26<01:14, 684.90 examples/s]Map:  77%|███████▋  | 167955/216925 [03:27<00:54, 890.36 examples/s]Map:  78%|███████▊  | 169087/216925 [03:26<01:09, 691.83 examples/s]Map:  75%|███████▍  | 161950/216925 [03:28<01:03, 868.98 examples/s]Map:  77%|███████▋  | 166167/216925 [03:26<01:10, 721.08 examples/s]Map:  78%|███████▊  | 169178/216925 [03:26<01:04, 741.82 examples/s]Map:  77%|███████▋  | 166258/216925 [03:26<01:06, 767.58 examples/s]Map:  77%|███████▋  | 168046/216925 [03:28<01:09, 708.16 examples/s]Map:  78%|███████▊  | 169272/216925 [03:26<01:00, 789.60 examples/s]Map:  75%|███████▍  | 162045/216925 [03:28<01:16, 719.01 examples/s]Map:  77%|███████▋  | 166348/216925 [03:26<01:03, 799.31 examples/s]Map:  78%|███████▊  | 168139/216925 [03:28<01:04, 760.13 examples/s]Map:  78%|███████▊  | 169369/216925 [03:26<00:57, 833.52 examples/s]Map:  75%|███████▍  | 162135/216925 [03:28<01:12, 756.90 examples/s]Map:  77%|███████▋  | 166435/216925 [03:26<01:02, 813.83 examples/s]Map:  78%|███████▊  | 168229/216925 [03:28<01:01, 794.21 examples/s]Map:  78%|███████▊  | 169461/216925 [03:27<00:55, 855.49 examples/s]Map:  75%|███████▍  | 162222/216925 [03:28<01:09, 782.03 examples/s]Map:  77%|███████▋  | 166524/216925 [03:27<01:00, 829.63 examples/s]Map:  78%|███████▊  | 168323/216925 [03:28<00:58, 830.01 examples/s]Map:  78%|███████▊  | 169551/216925 [03:27<00:54, 865.52 examples/s]Map:  75%|███████▍  | 162315/216925 [03:28<01:06, 817.69 examples/s]Map:  77%|███████▋  | 166652/216925 [03:27<01:00, 836.29 examples/s]Map:  78%|███████▊  | 168416/216925 [03:28<00:56, 855.34 examples/s]Map:  78%|███████▊  | 169640/216925 [03:27<00:54, 869.24 examples/s]Map:  75%|███████▍  | 162410/216925 [03:28<01:04, 847.59 examples/s]Map:  77%|███████▋  | 166741/216925 [03:27<00:59, 847.37 examples/s]Map:  78%|███████▊  | 168508/216925 [03:28<00:55, 871.11 examples/s]Map:  78%|███████▊  | 169730/216925 [03:27<00:53, 876.22 examples/s]Map:  75%|███████▍  | 162504/216925 [03:28<01:02, 870.15 examples/s]Map:  77%|███████▋  | 166829/216925 [03:27<00:58, 852.57 examples/s]Map:  78%|███████▊  | 168598/216925 [03:28<00:55, 873.56 examples/s]Map:  78%|███████▊  | 169822/216925 [03:27<00:53, 886.65 examples/s]Map:  75%|███████▍  | 162595/216925 [03:28<01:01, 878.39 examples/s]Map:  77%|███████▋  | 166917/216925 [03:27<00:58, 856.90 examples/s]Map:  78%|███████▊  | 168689/216925 [03:28<00:54, 881.24 examples/s]Map:  78%|███████▊  | 169915/216925 [03:27<00:52, 898.89 examples/s]Map:  75%|███████▍  | 162685/216925 [03:28<01:01, 882.20 examples/s]Map:  78%|███████▊  | 168784/216925 [03:28<00:53, 899.81 examples/s]Map:  75%|███████▌  | 162777/216925 [03:29<01:00, 890.26 examples/s]Map:  75%|███████▌  | 162869/216925 [03:29<01:00, 895.91 examples/s]Map:  77%|███████▋  | 167041/216925 [03:27<01:12, 690.83 examples/s]Map:  78%|███████▊  | 170044/216925 [03:27<01:04, 721.26 examples/s]Map:  78%|███████▊  | 168919/216925 [03:29<00:53, 897.65 examples/s]Map:  77%|███████▋  | 167130/216925 [03:27<01:07, 733.74 examples/s]Map:  78%|███████▊  | 170137/216925 [03:27<01:00, 767.28 examples/s]Map:  77%|███████▋  | 167219/216925 [03:27<01:04, 770.58 examples/s]Map:  78%|███████▊  | 170226/216925 [03:28<00:58, 792.62 examples/s]Map:  75%|███████▌  | 163000/216925 [03:29<01:16, 709.49 examples/s]Map:  78%|███████▊  | 169040/216925 [03:29<01:05, 727.22 examples/s]Map:  77%|███████▋  | 167311/216925 [03:28<01:01, 804.87 examples/s]Map:  79%|███████▊  | 170315/216925 [03:28<00:57, 816.62 examples/s]Map:  75%|███████▌  | 163084/216925 [03:29<01:12, 738.57 examples/s]Map:  78%|███████▊  | 169129/216925 [03:29<01:02, 760.54 examples/s]Map:  77%|███████▋  | 167401/216925 [03:28<00:59, 828.62 examples/s]Map:  79%|███████▊  | 170404/216925 [03:28<00:55, 833.23 examples/s]Map:  75%|███████▌  | 163173/216925 [03:29<01:09, 774.85 examples/s]Map:  78%|███████▊  | 169221/216925 [03:29<00:59, 796.27 examples/s]Map:  77%|███████▋  | 167490/216925 [03:28<00:58, 843.57 examples/s]Map:  79%|███████▊  | 170494/216925 [03:28<00:54, 847.88 examples/s]Map:  75%|███████▌  | 163266/216925 [03:29<01:06, 811.67 examples/s]Map:  78%|███████▊  | 169310/216925 [03:29<00:58, 818.46 examples/s]Map:  77%|███████▋  | 167579/216925 [03:28<00:57, 852.71 examples/s]Map:  79%|███████▊  | 170586/216925 [03:28<00:53, 865.43 examples/s]Map:  75%|███████▌  | 163357/216925 [03:29<01:04, 836.17 examples/s]Map:  78%|███████▊  | 169399/216925 [03:29<00:56, 834.71 examples/s]Map:  77%|███████▋  | 167673/216925 [03:28<00:56, 875.78 examples/s]Map:  75%|███████▌  | 163447/216925 [03:29<01:02, 850.91 examples/s]Map:  78%|███████▊  | 169491/216925 [03:29<00:55, 856.35 examples/s]Map:  79%|███████▊  | 170721/216925 [03:28<00:52, 873.35 examples/s]Map:  77%|███████▋  | 167764/216925 [03:28<00:55, 881.64 examples/s]Map:  75%|███████▌  | 163538/216925 [03:29<01:01, 864.58 examples/s]Map:  78%|███████▊  | 169581/216925 [03:29<00:54, 865.63 examples/s]Map:  79%|███████▊  | 170813/216925 [03:28<00:52, 883.02 examples/s]Map:  77%|███████▋  | 167855/216925 [03:28<00:55, 886.46 examples/s]Map:  78%|███████▊  | 169675/216925 [03:29<00:53, 884.04 examples/s]Map:  79%|███████▉  | 170905/216925 [03:28<00:51, 888.46 examples/s]Map:  75%|███████▌  | 163672/216925 [03:30<01:01, 869.98 examples/s]Map:  77%|███████▋  | 167987/216925 [03:28<00:55, 882.37 examples/s]Map:  78%|███████▊  | 169766/216925 [03:30<00:53, 889.75 examples/s]Map:  79%|███████▉  | 170998/216925 [03:28<00:51, 897.70 examples/s]Map:  75%|███████▌  | 163766/216925 [03:30<01:00, 885.43 examples/s]Map:  76%|███████▌  | 163863/216925 [03:30<00:58, 905.08 examples/s]Map:  78%|███████▊  | 169901/216925 [03:30<00:52, 889.59 examples/s]Map:  77%|███████▋  | 168088/216925 [03:29<01:08, 709.12 examples/s]Map:  79%|███████▉  | 171090/216925 [03:29<01:05, 700.30 examples/s]Map:  78%|███████▊  | 169994/216925 [03:30<00:52, 897.11 examples/s]Map:  78%|███████▊  | 168178/216925 [03:29<01:05, 749.59 examples/s]Map:  79%|███████▉  | 171182/216925 [03:29<01:01, 749.42 examples/s]Map:  76%|███████▌  | 164000/216925 [03:30<01:12, 732.10 examples/s]Map:  78%|███████▊  | 168266/216925 [03:29<01:02, 778.82 examples/s]Map:  79%|███████▉  | 171275/216925 [03:29<00:57, 794.58 examples/s]Map:  78%|███████▊  | 170093/216925 [03:30<01:04, 720.68 examples/s]Map:  76%|███████▌  | 164091/216925 [03:30<01:08, 769.38 examples/s]Map:  78%|███████▊  | 168359/216925 [03:29<00:59, 814.54 examples/s]Map:  79%|███████▉  | 171366/216925 [03:29<00:55, 821.66 examples/s]Map:  78%|███████▊  | 170181/216925 [03:30<01:01, 756.30 examples/s]Map:  76%|███████▌  | 164181/216925 [03:30<01:06, 798.33 examples/s]Map:  78%|███████▊  | 168445/216925 [03:29<00:58, 823.95 examples/s]Map:  78%|███████▊  | 170271/216925 [03:30<00:59, 788.59 examples/s]Map:  79%|███████▉  | 171494/216925 [03:29<00:54, 830.18 examples/s]Map:  76%|███████▌  | 164270/216925 [03:30<01:04, 819.91 examples/s]Map:  78%|███████▊  | 168540/216925 [03:29<00:56, 855.76 examples/s]Map:  79%|███████▊  | 170360/216925 [03:30<00:57, 813.25 examples/s]Map:  79%|███████▉  | 171583/216925 [03:29<00:53, 843.65 examples/s]Map:  76%|███████▌  | 164368/216925 [03:30<01:01, 858.74 examples/s]Map:  79%|███████▊  | 170454/216925 [03:30<00:55, 843.41 examples/s]Map:  78%|███████▊  | 168665/216925 [03:29<00:57, 843.59 examples/s]Map:  79%|███████▉  | 171675/216925 [03:29<00:52, 861.45 examples/s]Map:  76%|███████▌  | 164458/216925 [03:31<01:00, 868.63 examples/s]Map:  79%|███████▊  | 170546/216925 [03:31<00:53, 860.82 examples/s]Map:  78%|███████▊  | 168753/216925 [03:29<00:56, 848.69 examples/s]Map:  79%|███████▉  | 171763/216925 [03:29<00:52, 863.98 examples/s]Map:  76%|███████▌  | 164550/216925 [03:31<00:59, 877.46 examples/s]Map:  79%|███████▊  | 170636/216925 [03:31<00:53, 868.54 examples/s]Map:  78%|███████▊  | 168843/216925 [03:29<00:55, 858.70 examples/s]Map:  79%|███████▉  | 171858/216925 [03:29<00:50, 884.68 examples/s]Map:  76%|███████▌  | 164643/216925 [03:31<00:58, 888.50 examples/s]Map:  79%|███████▊  | 170728/216925 [03:31<00:52, 879.24 examples/s]Map:  76%|███████▌  | 164735/216925 [03:31<00:58, 894.94 examples/s]Map:  78%|███████▊  | 168975/216925 [03:30<00:55, 861.78 examples/s]Map:  79%|███████▉  | 171992/216925 [03:30<00:51, 880.64 examples/s]Map:  79%|███████▊  | 170818/216925 [03:31<00:52, 882.56 examples/s]Map:  76%|███████▌  | 164827/216925 [03:31<00:58, 897.57 examples/s]Map:  79%|███████▉  | 170907/216925 [03:31<00:52, 881.14 examples/s]Map:  76%|███████▌  | 164920/216925 [03:31<00:57, 903.55 examples/s]Map:  78%|███████▊  | 169085/216925 [03:30<01:08, 701.79 examples/s]Map:  79%|███████▉  | 172093/216925 [03:30<01:02, 712.07 examples/s]Map:  79%|███████▉  | 170999/216925 [03:31<00:51, 891.15 examples/s]Map:  78%|███████▊  | 169179/216925 [03:30<01:03, 752.43 examples/s]Map:  79%|███████▉  | 172191/216925 [03:30<00:58, 770.60 examples/s]Map:  76%|███████▌  | 165044/216925 [03:31<01:12, 717.89 examples/s]Map:  78%|███████▊  | 169270/216925 [03:30<01:00, 786.25 examples/s]Map:  79%|███████▉  | 172286/216925 [03:30<00:55, 810.99 examples/s]Map:  79%|███████▉  | 171132/216925 [03:31<01:04, 707.68 examples/s]Map:  76%|███████▌  | 165134/216925 [03:31<01:08, 757.57 examples/s]Map:  78%|███████▊  | 169364/216925 [03:30<00:57, 821.20 examples/s]Map:  79%|███████▉  | 172381/216925 [03:30<00:52, 845.82 examples/s]Map:  79%|███████▉  | 171216/216925 [03:31<01:02, 734.16 examples/s]Map:  76%|███████▌  | 165219/216925 [03:32<01:06, 777.46 examples/s]Map:  78%|███████▊  | 169489/216925 [03:30<00:57, 821.06 examples/s]Map:  80%|███████▉  | 172504/216925 [03:30<00:53, 832.99 examples/s]Map:  79%|███████▉  | 171304/216925 [03:31<00:59, 767.72 examples/s]Map:  76%|███████▌  | 165306/216925 [03:32<01:04, 799.68 examples/s]Map:  80%|███████▉  | 172600/216925 [03:30<00:51, 864.05 examples/s]Map:  79%|███████▉  | 171399/216925 [03:32<00:56, 809.43 examples/s]Map:  76%|███████▌  | 165397/216925 [03:32<01:02, 827.13 examples/s]Map:  78%|███████▊  | 169616/216925 [03:30<00:57, 827.40 examples/s]Map:  80%|███████▉  | 172690/216925 [03:30<00:50, 872.16 examples/s]Map:  79%|███████▉  | 171489/216925 [03:32<00:54, 832.73 examples/s]Map:  76%|███████▋  | 165489/216925 [03:32<01:00, 850.70 examples/s]Map:  78%|███████▊  | 169708/216925 [03:30<00:55, 847.56 examples/s]Map:  80%|███████▉  | 172786/216925 [03:31<00:49, 892.22 examples/s]Map:  79%|███████▉  | 171579/216925 [03:32<00:53, 849.29 examples/s]Map:  76%|███████▋  | 165579/216925 [03:32<00:59, 862.99 examples/s]Map:  78%|███████▊  | 169797/216925 [03:31<00:54, 857.01 examples/s]Map:  80%|███████▉  | 172879/216925 [03:31<00:48, 900.74 examples/s]Map:  79%|███████▉  | 171670/216925 [03:32<00:52, 863.03 examples/s]Map:  76%|███████▋  | 165672/216925 [03:32<00:58, 877.59 examples/s]Map:  78%|███████▊  | 169888/216925 [03:31<00:54, 869.00 examples/s]Map:  80%|███████▉  | 172972/216925 [03:31<00:48, 907.43 examples/s]Map:  79%|███████▉  | 171759/216925 [03:32<00:52, 868.05 examples/s]Map:  76%|███████▋  | 165761/216925 [03:32<00:58, 878.91 examples/s]Map:  78%|███████▊  | 169977/216925 [03:31<00:53, 872.62 examples/s]Map:  76%|███████▋  | 165852/216925 [03:32<00:57, 886.02 examples/s]Map:  79%|███████▉  | 171888/216925 [03:32<00:52, 858.94 examples/s]Map:  80%|███████▉  | 173086/216925 [03:31<01:01, 707.55 examples/s]Map:  76%|███████▋  | 165944/216925 [03:32<00:57, 893.32 examples/s]Map:  78%|███████▊  | 170084/216925 [03:31<01:07, 693.83 examples/s]Map:  79%|███████▉  | 171977/216925 [03:32<00:52, 863.94 examples/s]Map:  80%|███████▉  | 173180/216925 [03:31<00:57, 760.73 examples/s]Map:  78%|███████▊  | 170173/216925 [03:31<01:03, 737.02 examples/s]Map:  80%|███████▉  | 173274/216925 [03:31<00:54, 803.05 examples/s]Map:  77%|███████▋  | 166043/216925 [03:33<01:12, 705.19 examples/s]Map:  78%|███████▊  | 170261/216925 [03:31<01:00, 769.45 examples/s]Map:  79%|███████▉  | 172090/216925 [03:32<01:03, 701.44 examples/s]Map:  80%|███████▉  | 173361/216925 [03:31<00:53, 819.80 examples/s]Map:  77%|███████▋  | 166138/216925 [03:33<01:06, 762.85 examples/s]Map:  79%|███████▊  | 170353/216925 [03:31<00:57, 805.38 examples/s]Map:  79%|███████▉  | 172184/216925 [03:33<00:59, 753.71 examples/s]Map:  77%|███████▋  | 166231/216925 [03:33<01:03, 803.30 examples/s]Map:  79%|███████▊  | 170442/216925 [03:31<00:56, 825.25 examples/s]Map:  80%|███████▉  | 173488/216925 [03:31<00:52, 825.00 examples/s]Map:  79%|███████▉  | 172273/216925 [03:33<00:57, 782.67 examples/s]Map:  77%|███████▋  | 166321/216925 [03:33<01:01, 825.21 examples/s]Map:  79%|███████▊  | 170529/216925 [03:32<00:55, 835.86 examples/s]Map:  80%|████████  | 173574/216925 [03:32<00:52, 831.26 examples/s]Map:  79%|███████▉  | 172366/216925 [03:33<00:54, 817.26 examples/s]Map:  77%|███████▋  | 166419/216925 [03:33<00:58, 863.01 examples/s]Map:  79%|███████▊  | 170619/216925 [03:32<00:54, 852.11 examples/s]Map:  80%|████████  | 173661/216925 [03:32<00:51, 840.83 examples/s]Map:  80%|███████▉  | 172457/216925 [03:33<00:52, 840.18 examples/s]Map:  77%|█���█████▋  | 166512/216925 [03:33<00:57, 877.48 examples/s]Map:  79%|███████▊  | 170708/216925 [03:32<00:53, 858.84 examples/s]Map:  80%|████████  | 173753/216925 [03:32<00:50, 858.51 examples/s]Map:  80%|███████▉  | 172552/216925 [03:33<00:51, 865.29 examples/s]Map:  77%|███████▋  | 166604/216925 [03:33<00:56, 887.48 examples/s]Map:  79%|███████▊  | 170800/216925 [03:32<00:52, 871.31 examples/s]Map:  80%|████████  | 173847/216925 [03:32<00:48, 879.27 examples/s]Map:  80%|███████▉  | 172647/216925 [03:33<00:50, 883.66 examples/s]Map:  77%|███████▋  | 166695/216925 [03:33<00:56, 891.50 examples/s]Map:  79%|███████▉  | 170889/216925 [03:32<00:52, 874.51 examples/s]Map:  80%|████████  | 173940/216925 [03:32<00:48, 889.17 examples/s]Map:  80%|███████▉  | 172786/216925 [03:33<00:49, 893.75 examples/s]Map:  79%|███████▉  | 170979/216925 [03:32<00:52, 877.96 examples/s]Map:  77%|███████▋  | 166830/216925 [03:33<00:56, 890.69 examples/s]Map:  80%|███████▉  | 172882/216925 [03:33<00:48, 908.16 examples/s]Map:  80%|████████  | 174044/216925 [03:32<01:01, 696.18 examples/s]Map:  77%|███████▋  | 166921/216925 [03:33<00:55, 893.18 examples/s]Map:  79%|███████▉  | 171082/216925 [03:32<01:07, 679.56 examples/s]Map:  80%|████████  | 174134/216925 [03:32<00:57, 744.07 examples/s]Map:  80%|███████▉  | 173000/216925 [03:34<01:00, 730.12 examples/s]Map:  79%|███████▉  | 171174/216925 [03:32<01:02, 735.91 examples/s]Map:  80%|████████  | 174227/216925 [03:32<00:54, 788.14 examples/s]Map:  77%|███████▋  | 167042/216925 [03:34<01:08, 727.60 examples/s]Map:  80%|███████▉  | 173091/216925 [03:34<00:57, 767.96 examples/s]Map:  79%|███████▉  | 171265/216925 [03:32<00:58, 777.39 examples/s]Map:  80%|████████  | 174320/216925 [03:32<00:51, 822.87 examples/s]Map:  77%|███████▋  | 167133/216925 [03:34<01:04, 766.07 examples/s]Map:  80%|███████▉  | 173185/216925 [03:34<00:54, 806.50 examples/s]Map:  79%|███████▉  | 171357/216925 [03:33<00:55, 814.13 examples/s]Map:  80%|████████  | 174412/216925 [03:33<00:50, 848.72 examples/s]Map:  77%|███████▋  | 167219/216925 [03:34<01:03, 786.74 examples/s]Map:  80%|███████▉  | 173279/216925 [03:34<00:52, 838.27 examples/s]Map:  79%|███████▉  | 171448/216925 [03:33<00:54, 838.01 examples/s]Map:  77%|███████▋  | 167308/216925 [03:34<01:01, 807.78 examples/s]Map:  80%|████████  | 174542/216925 [03:33<00:49, 853.56 examples/s]Map:  80%|███████▉  | 173370/216925 [03:34<00:50, 855.75 examples/s]Map:  79%|███████▉  | 171537/216925 [03:33<00:53, 847.53 examples/s]Map:  77%|███████▋  | 167400/216925 [03:34<00:59, 834.44 examples/s]Map:  81%|████████  | 174634/216925 [03:33<00:48, 867.79 examples/s]Map:  79%|███████▉  | 171627/216925 [03:33<00:52, 861.44 examples/s]Map:  77%|███████▋  | 167494/216925 [03:34<00:57, 860.92 examples/s]Map:  80%|███████▉  | 173505/216925 [03:34<00:49, 870.00 examples/s]Map:  81%|████████  | 174725/216925 [03:33<00:48, 877.05 examples/s]Map:  79%|███████▉  | 171717/216925 [03:33<00:52, 867.55 examples/s]Map:  77%|███████▋  | 167586/216925 [03:34<00:56, 875.29 examples/s]Map:  80%|████████  | 173595/216925 [03:34<00:49, 873.87 examples/s]Map:  81%|████████  | 174818/216925 [03:33<00:47, 889.95 examples/s]Map:  79%|███████▉  | 171806/216925 [03:33<00:51, 872.08 examples/s]Map:  77%|███████▋  | 167679/216925 [03:34<00:55, 887.85 examples/s]Map:  80%|████████  | 173688/216925 [03:34<00:48, 885.30 examples/s]Map:  81%|████████  | 174914/216925 [03:33<00:46, 907.44 examples/s]Map:  79%|███████▉  | 171895/216925 [03:33<00:51, 872.35 examples/s]Map:  77%|███████▋  | 167774/216925 [03:35<00:54, 902.44 examples/s]Map:  80%|████████  | 173780/216925 [03:34<00:48, 889.91 examples/s]Map:  80%|████████  | 173875/216925 [03:35<00:47, 905.37 examples/s]Map:  77%|███████▋  | 167912/216925 [03:35<00:54, 906.35 examples/s]Map:  81%|████████  | 175045/216925 [03:33<00:57, 725.89 examples/s]Map:  79%|███████▉  | 172000/216925 [03:33<01:04, 691.59 examples/s]Map:  81%|████████  | 175135/216925 [03:33<00:54, 763.90 examples/s]Map:  79%|███████▉  | 172085/216925 [03:33<01:01, 726.92 examples/s]Map:  80%|████████  | 174000/216925 [03:35<00:59, 724.95 examples/s]Map:  81%|████████  | 175229/216925 [03:34<00:51, 806.32 examples/s]Map:  79%|███████▉  | 172179/216925 [03:34<00:57, 778.51 examples/s]Map:  77%|███████▋  | 168042/216925 [03:35<01:06, 738.63 examples/s]Map:  80%|████████  | 174093/216925 [03:35<00:55, 768.59 examples/s]Map:  81%|████████  | 175321/216925 [03:34<00:50, 831.34 examples/s]Map:  79%|███████▉  | 172268/216925 [03:34<00:55, 805.07 examples/s]Map:  78%|███████▊  | 168133/216925 [03:35<01:02, 774.76 examples/s]Map:  80%|████████  | 174185/216925 [03:35<00:53, 802.30 examples/s]Map:  81%|████████  | 175415/216925 [03:34<00:48, 858.52 examples/s]Map:  79%|███████▉  | 172361/216925 [03:34<00:53, 836.16 examples/s]Map:  78%|███████▊  | 168222/216925 [03:35<01:00, 799.77 examples/s]Map:  80%|████████  | 174272/216925 [03:35<00:52, 815.92 examples/s]Map:  81%|████████  | 175508/216925 [03:34<00:47, 873.71 examples/s]Map:  79%|███████▉  | 172451/216925 [03:34<00:52, 852.40 examples/s]Map:  78%|███████▊  | 168313/216925 [03:35<00:58, 825.03 examples/s]Map:  80%|████████  | 174361/216925 [03:35<00:51, 832.17 examples/s]Map:  78%|███████▊  | 168404/216925 [03:35<00:57, 842.15 examples/s]Map:  81%|████████  | 175639/216925 [03:34<00:47, 869.53 examples/s]Map:  80%|███████▉  | 172582/216925 [03:34<00:51, 857.47 examples/s]Map:  80%|████████  | 174448/216925 [03:35<00:50, 839.51 examples/s]Map:  78%|███████▊  | 168495/216925 [03:35<00:56, 857.22 examples/s]Map:  81%|████████  | 175730/216925 [03:34<00:46, 878.12 examples/s]Map:  80%|███████▉  | 172670/216925 [03:34<00:51, 860.47 examples/s]Map:  80%|████████  | 174537/216925 [03:35<00:49, 851.88 examples/s]Map:  78%|███████▊  | 168586/216925 [03:36<00:55, 868.51 examples/s]Map:  80%|███████▉  | 172760/216925 [03:34<00:50, 867.91 examples/s]Map:  81%|████████  | 174628/216925 [03:35<00:48, 865.49 examples/s]Map:  81%|████████  | 175864/216925 [03:34<00:46, 877.50 examples/s]Map:  78%|███████▊  | 168677/216925 [03:36<00:54, 878.09 examples/s]Map:  81%|████████  | 174721/216925 [03:36<00:47, 882.85 examples/s]Map:  80%|███████▉  | 172888/216925 [03:34<00:51, 858.54 examples/s]Map:  78%|███████▊  | 168769/216925 [03:36<00:54, 888.49 examples/s]Map:  81%|████████  | 175998/216925 [03:34<00:46, 880.85 examples/s]Map:  81%|████████  | 174811/216925 [03:36<00:47, 882.95 examples/s]Map:  80%|███████▉  | 172978/216925 [03:34<00:50, 865.50 examples/s]Map:  78%|███████▊  | 168862/216925 [03:36<00:53, 897.86 examples/s]Map:  78%|███████▊  | 168955/216925 [03:36<00:52, 905.30 examples/s]Map:  81%|████████  | 174938/216925 [03:36<00:48, 865.73 examples/s]Map:  81%|████████  | 176090/216925 [03:35<00:57, 712.53 examples/s]Map:  80%|███████▉  | 173088/216925 [03:35<01:02, 702.61 examples/s]Map:  81%|████████  | 176182/216925 [03:35<00:53, 756.47 examples/s]Map:  78%|███████▊  | 169048/216925 [03:36<01:07, 707.28 examples/s]Map:  80%|███████▉  | 173182/216925 [03:35<00:58, 753.78 examples/s]Map:  81%|████████  | 175043/216925 [03:36<01:00, 697.50 examples/s]Map:  81%|████████▏ | 176275/216925 [03:35<00:51, 796.90 examples/s]Map:  78%|███████▊  | 169141/216925 [03:36<01:02, 759.30 examples/s]Map:  80%|███████▉  | 173273/216925 [03:35<00:55, 787.90 examples/s]Map:  81%|████████  | 175138/216925 [03:36<00:55, 751.07 examples/s]Map:  81%|████████▏ | 176367/216925 [03:35<00:49, 825.00 examples/s]Map:  78%|███████▊  | 169230/216925 [03:36<01:00, 791.37 examples/s]Map:  80%|███████▉  | 173367/216925 [03:35<00:52, 825.21 examples/s]Map:  81%|████████  | 175228/216925 [03:36<00:53, 785.85 examples/s]Map:  81%|████████▏ | 176459/216925 [03:35<00:47, 847.42 examples/s]Map:  78%|███████▊  | 169325/216925 [03:36<00:57, 832.76 examples/s]Map:  80%|███████▉  | 173456/216925 [03:35<00:51, 839.94 examples/s]Map:  81%|████████  | 175322/216925 [03:36<00:50, 823.37 examples/s]Map:  81%|████████▏ | 176555/216925 [03:35<00:46, 876.18 examples/s]Map:  80%|████████  | 173545/216925 [03:35<00:51, 850.20 examples/s]Map:  81%|████████  | 175412/216925 [03:36<00:49, 841.52 examples/s]Map:  81%|████████▏ | 176647/216925 [03:35<00:45, 886.30 examples/s]Map:  78%|███████▊  | 169457/216925 [03:37<00:56, 845.76 examples/s]Map:  80%|████████  | 173637/216925 [03:35<00:49, 867.15 examples/s]Map:  81%|████████  | 175505/216925 [03:37<00:48, 862.59 examples/s]Map:  78%|███████▊  | 169544/216925 [03:37<00:55, 850.18 examples/s]Map:  81%|████████▏ | 176780/216925 [03:35<00:45, 881.57 examples/s]Map:  80%|████████  | 173726/216925 [03:35<00:49, 870.21 examples/s]Map:  81%|████████  | 175596/216925 [03:37<00:47, 873.48 examples/s]Map:  78%|███████▊  | 169635/216925 [03:37<00:54, 866.13 examples/s]Map:  80%|████████  | 173815/216925 [03:36<00:49, 872.10 examples/s]Map:  81%|████████  | 175687/216925 [03:37<00:46, 883.12 examples/s]Map:  82%|████████▏ | 176915/216925 [03:36<00:45, 884.94 examples/s]Map:  78%|███████▊  | 169728/216925 [03:37<00:53, 880.05 examples/s]Map:  80%|████████  | 173906/216925 [03:36<00:48, 878.57 examples/s]Map:  81%|████████  | 175778/216925 [03:37<00:46, 888.22 examples/s]Map:  78%|███████▊  | 169820/216925 [03:37<00:52, 889.64 examples/s]Map:  80%|████████  | 173999/216925 [03:36<00:48, 891.20 examples/s]Map:  81%|████████  | 175871/216925 [03:37<00:45, 899.32 examples/s]Map:  78%|███████▊  | 169911/216925 [03:37<00:52, 893.89 examples/s]Map:  82%|████████▏ | 177045/216925 [03:36<00:54, 736.87 examples/s]Map:  81%|████████  | 175962/216925 [03:37<00:45, 900.47 examples/s]Map:  82%|████████▏ | 177137/216925 [03:36<00:51, 773.91 examples/s]Map:  80%|████████  | 174133/216925 [03:36<00:59, 717.59 examples/s]Map:  82%|████████▏ | 177227/216925 [03:36<00:49, 801.64 examples/s]Map:  78%|███████▊  | 170043/216925 [03:37<01:04, 726.60 examples/s]Map:  81%|████████  | 176087/216925 [03:37<00:57, 707.38 examples/s]Map:  80%|████████  | 174219/216925 [03:36<00:57, 746.13 examples/s]Map:  82%|████████▏ | 177318/216925 [03:36<00:47, 827.08 examples/s]Map:  78%|███████▊  | 170136/216925 [03:37<01:00, 772.02 examples/s]Map:  81%|████████  | 176178/216925 [03:37<00:54, 752.84 examples/s]Map:  80%|████████  | 174308/216925 [03:36<00:54, 778.07 examples/s]Map:  82%|████████▏ | 177412/216925 [03:36<00:46, 851.79 examples/s]Map:  78%|███████▊  | 170228/216925 [03:38<00:57, 806.29 examples/s]Map:  81%|████████▏ | 176265/216925 [03:37<00:52, 780.16 examples/s]Map:  80%|████████  | 174393/216925 [03:36<00:53, 793.46 examples/s]Map:  79%|███████▊  | 170321/216925 [03:38<00:55, 836.07 examples/s]Map:  82%|████████▏ | 177544/216925 [03:36<00:45, 860.22 examples/s]Map:  81%|████████▏ | 176354/216925 [03:38<00:50, 807.38 examples/s]Map:  80%|████████  | 174482/216925 [03:36<00:51, 816.92 examples/s]Map:  82%|████████▏ | 177632/216925 [03:36<00:45, 861.79 examples/s]Map:  79%|███████▊  | 170450/216925 [03:38<00:55, 842.21 examples/s]Map:  80%|████████  | 174574/216925 [03:36<00:50, 843.23 examples/s]Map:  81%|████████▏ | 176483/216925 [03:38<00:49, 820.46 examples/s]Map:  82%|████████▏ | 177724/216925 [03:37<00:44, 874.45 examples/s]Map:  79%|███████▊  | 170546/216925 [03:38<00:53, 867.40 examples/s]Map:  81%|████████  | 174664/216925 [03:37<00:49, 857.83 examples/s]Map:  81%|████████▏ | 176573/216925 [03:38<00:48, 837.68 examples/s]Map:  82%|████████▏ | 177818/216925 [03:37<00:44, 886.81 examples/s]Map:  81%|████████  | 174753/216925 [03:37<00:48, 864.97 examples/s]Map:  79%|███████▊  | 170681/216925 [03:38<00:52, 877.98 examples/s]Map:  81%|████████▏ | 176670/216925 [03:38<00:46, 868.15 examples/s]Map:  82%|████████▏ | 177912/216925 [03:37<00:43, 897.30 examples/s]Map:  79%|███████▊  | 170772/216925 [03:38<00:52, 884.73 examples/s]Map:  81%|████████  | 174884/216925 [03:37<00:48, 863.86 examples/s]Map:  82%|████████▏ | 176802/216925 [03:38<00:46, 864.79 examples/s]Map:  79%|███████▉  | 170864/216925 [03:38<00:51, 891.11 examples/s]Map:  81%|████████  | 174975/216925 [03:37<00:48, 872.34 examples/s]Map:  82%|████████▏ | 178047/216925 [03:37<00:53, 726.85 examples/s]Map:  82%|████████▏ | 176895/216925 [03:38<00:45, 878.54 examples/s]Map:  79%|███████▉  | 170955/216925 [03:38<00:51, 895.02 examples/s]Map:  82%|████��███▏ | 178140/216925 [03:37<00:50, 770.88 examples/s]Map:  82%|████████▏ | 176987/216925 [03:38<00:45, 886.56 examples/s]Map:  81%|████████  | 175087/216925 [03:37<00:59, 703.63 examples/s]Map:  82%|████████▏ | 178237/216925 [03:37<00:47, 816.12 examples/s]Map:  79%|███████▉  | 171090/216925 [03:39<01:02, 730.14 examples/s]Map:  81%|████████  | 175173/216925 [03:37<00:56, 736.64 examples/s]Map:  82%|████████▏ | 178328/216925 [03:37<00:45, 839.20 examples/s]Map:  82%|████████▏ | 177088/216925 [03:38<00:56, 708.34 examples/s]Map:  79%|███████▉  | 171182/216925 [03:39<00:59, 770.83 examples/s]Map:  81%|████████  | 175258/216925 [03:37<00:54, 762.78 examples/s]Map:  82%|████████▏ | 178421/216925 [03:37<00:44, 862.28 examples/s]Map:  82%|████████▏ | 177176/216925 [03:39<00:53, 744.18 examples/s]Map:  79%|███████▉  | 171275/216925 [03:39<00:56, 807.42 examples/s]Map:  81%|████████  | 175348/216925 [03:37<00:52, 795.60 examples/s]Map:  82%|████████▏ | 178517/216925 [03:37<00:43, 885.46 examples/s]Map:  82%|████████▏ | 177268/216925 [03:39<00:50, 784.16 examples/s]Map:  79%|███████▉  | 171367/216925 [03:39<00:54, 833.94 examples/s]Map:  81%|████████  | 175436/216925 [03:38<00:50, 817.02 examples/s]Map:  82%|████████▏ | 177359/216925 [03:39<00:48, 814.11 examples/s]Map:  82%|████████▏ | 178652/216925 [03:38<00:43, 885.31 examples/s]Map:  79%|███████▉  | 171456/216925 [03:39<00:53, 847.43 examples/s]Map:  81%|████████  | 175528/216925 [03:38<00:49, 843.81 examples/s]Map:  82%|████████▏ | 177483/216925 [03:39<00:48, 815.18 examples/s]Map:  82%|████████▏ | 178783/216925 [03:38<00:43, 876.17 examples/s]Map:  79%|███████▉  | 171584/216925 [03:39<00:53, 846.76 examples/s]Map:  81%|████████  | 175654/216925 [03:38<00:49, 835.78 examples/s]Map:  82%|████████▏ | 177573/216925 [03:39<00:47, 834.02 examples/s]Map:  82%|████████▏ | 178881/216925 [03:38<00:42, 895.86 examples/s]Map:  79%|███████▉  | 171677/216925 [03:39<00:52, 865.09 examples/s]Map:  81%|████████  | 175743/216925 [03:38<00:48, 846.67 examples/s]Map:  82%|████████▏ | 177665/216925 [03:39<00:46, 852.61 examples/s]Map:  83%|████████▎ | 178976/216925 [03:38<00:41, 907.51 examples/s]Map:  79%|███████▉  | 171770/216925 [03:39<00:51, 881.26 examples/s]Map:  81%|████████  | 175830/216925 [03:38<00:48, 851.05 examples/s]Map:  82%|████████▏ | 177760/216925 [03:39<00:44, 876.83 examples/s]Map:  79%|███████▉  | 171862/216925 [03:39<00:50, 891.38 examples/s]Map:  81%|████████  | 175921/216925 [03:38<00:47, 864.75 examples/s]Map:  82%|████████▏ | 177850/216925 [03:39<00:44, 880.66 examples/s]Map:  83%|████████▎ | 179089/216925 [03:38<00:51, 729.58 examples/s]Map:  79%|███████▉  | 171992/216925 [03:40<00:51, 877.96 examples/s]Map:  82%|████████▏ | 177941/216925 [03:39<00:43, 886.08 examples/s]Map:  83%|████████▎ | 179185/216925 [03:38<00:48, 779.08 examples/s]Map:  81%|████████  | 176042/216925 [03:38<00:58, 694.96 examples/s]Map:  83%|████████▎ | 179277/216925 [03:38<00:46, 809.63 examples/s]Map:  81%|████████  | 176130/216925 [03:38<00:55, 735.97 examples/s]Map:  79%|███████▉  | 172091/216925 [03:40<01:02, 718.50 examples/s]Map:  82%|████████▏ | 178044/216925 [03:40<00:56, 691.62 examples/s]Map:  83%|████████▎ | 179372/216925 [03:39<00:44, 843.60 examples/s]Map:  81%|████████  | 176222/216925 [03:39<00:52, 777.85 examples/s]Map:  79%|███████▉  | 172179/216925 [03:40<00:59, 753.41 examples/s]Map:  82%|████████▏ | 178136/216925 [03:40<00:52, 741.83 examples/s]Map:  83%|████████▎ | 179464/216925 [03:39<00:43, 859.54 examples/s]Map:  81%|████████▏ | 176311/216925 [03:39<00:50, 804.75 examples/s]Map:  79%|███████▉  | 172270/216925 [03:40<00:56, 790.04 examples/s]Map:  82%|████████▏ | 178227/216925 [03:40<00:49, 780.06 examples/s]Map:  83%|████████▎ | 179555/216925 [03:39<00:42, 872.49 examples/s]Map:  81%|████████▏ | 176396/216925 [03:39<00:49, 813.86 examples/s]Map:  79%|███████▉  | 172361/216925 [03:40<00:54, 817.91 examples/s]Map:  82%|████████▏ | 178321/216925 [03:40<00:47, 819.85 examples/s]Map:  81%|████████▏ | 176483/216925 [03:39<00:48, 827.47 examples/s]Map:  79%|███████▉  | 172452/216925 [03:40<00:53, 837.97 examples/s]Map:  83%|████████▎ | 179693/216925 [03:39<00:42, 886.42 examples/s]Map:  82%|████████▏ | 178411/216925 [03:40<00:46, 836.74 examples/s]Map:  81%|████████▏ | 176574/216925 [03:39<00:47, 849.52 examples/s]Map:  80%|███████▉  | 172543/216925 [03:40<00:52, 853.05 examples/s]Map:  83%|████████▎ | 179785/216925 [03:39<00:41, 891.30 examples/s]Map:  82%|████████▏ | 178500/216925 [03:40<00:45, 848.88 examples/s]Map:  81%|████████▏ | 176663/216925 [03:39<00:46, 858.67 examples/s]Map:  80%|███████▉  | 172636/216925 [03:40<00:50, 872.20 examples/s]Map:  83%|████████▎ | 179876/216925 [03:39<00:41, 895.40 examples/s]Map:  82%|████████▏ | 178593/216925 [03:40<00:44, 869.00 examples/s]Map:  80%|███████▉  | 172729/216925 [03:41<00:49, 884.11 examples/s]Map:  82%|████████▏ | 178682/216925 [03:40<00:43, 869.77 examples/s]Map:  81%|████████▏ | 176773/216925 [03:39<00:49, 808.12 examples/s]Map:  80%|███████▉  | 172823/216925 [03:41<00:49, 899.11 examples/s]Map:  82%|████████▏ | 178772/216925 [03:40<00:43, 875.21 examples/s]Map:  83%|████████▎ | 180000/216925 [03:39<00:51, 720.40 examples/s]Map:  82%|████████▏ | 176861/216925 [03:39<00:48, 825.24 examples/s]Map:  80%|███████▉  | 172917/216925 [03:41<00:48, 910.02 examples/s]Map:  82%|████████▏ | 178862/216925 [03:41<00:43, 875.74 examples/s]Map:  83%|████████▎ | 180092/216925 [03:39<00:48, 762.93 examples/s]Map:  82%|████████▏ | 176952/216925 [03:39<00:47, 845.69 examples/s]Map:  82%|████████▏ | 178951/216925 [03:41<00:43, 878.03 examples/s]Map:  83%|████████▎ | 180186/216925 [03:40<00:45, 800.49 examples/s]Map:  80%|███████▉  | 173043/216925 [03:41<01:00, 726.95 examples/s]Map:  83%|████████▎ | 180281/216925 [03:40<00:43, 835.75 examples/s]Map:  82%|████████▏ | 177043/216925 [03:40<00:59, 671.20 examples/s]Map:  83%|████████▎ | 179044/216925 [03:41<00:55, 684.44 examples/s]Map:  80%|███████▉  | 173133/216925 [03:41<00:57, 766.66 examples/s]Map:  83%|████████▎ | 180373/216925 [03:40<00:42, 855.83 examples/s]Map:  82%|████████▏ | 177134/216925 [03:40<00:54, 725.65 examples/s]Map:  83%|████████▎ | 179139/216925 [03:41<00:50, 747.80 examples/s]Map:  80%|███████▉  | 173224/216925 [03:41<00:54, 799.36 examples/s]Map:  83%|████████▎ | 180464/216925 [03:40<00:41, 869.22 examples/s]Map:  82%|████████▏ | 177224/216925 [03:40<00:51, 767.42 examples/s]Map:  83%|████████▎ | 179227/216925 [03:41<00:48, 779.93 examples/s]Map:  80%|███████▉  | 173317/216925 [03:41<00:52, 830.28 examples/s]Map:  83%|████████▎ | 180560/216925 [03:40<00:40, 892.27 examples/s]Map:  82%|████████▏ | 177315/216925 [03:40<00:49, 802.75 examples/s]Map:  83%|████████▎ | 179316/216925 [03:41<00:46, 807.53 examples/s]Map:  80%|███████▉  | 173406/216925 [03:41<00:51, 841.50 examples/s]Map:  83%|████████▎ | 180653/216925 [03:40<00:40, 898.57 examples/s]Map:  82%|████████▏ | 177401/216925 [03:40<00:48, 815.96 examples/s]Map:  83%|████████▎ | 179407/216925 [03:41<00:45, 830.77 examples/s]Map:  80%|███████▉  | 173499/216925 [03:41<00:50, 860.44 examples/s]Map:  82%|████████▏ | 177487/216925 [03:40<00:47, 827.68 examples/s]Map:  83%|████████▎ | 180787/216925 [03:40<00:40, 890.41 examples/s]Map:  83%|████████▎ | 179501/216925 [03:41<00:43, 856.59 examples/s]Map:  82%|████████▏ | 177575/216925 [03:40<00:46, 838.43 examples/s]Map:  80%|████████  | 173631/216925 [03:42<00:50, 865.78 examples/s]Map:  83%|████████▎ | 180924/216925 [03:40<00:40, 897.40 examples/s]Map:  82%|████████▏ | 177662/216925 [03:40<00:46, 844.32 examples/s]Map:  83%|████████▎ | 179632/216925 [03:42<00:43, 858.15 examples/s]Map:  80%|████████  | 173722/216925 [03:42<00:49, 874.17 examples/s]Map:  82%|████████▏ | 177749/216925 [03:40<00:46, 848.47 examples/s]Map:  83%|████████▎ | 179723/216925 [03:42<00:42, 868.72 examples/s]Map:  80%|████████  | 173855/216925 [03:42<00:49, 877.08 examples/s]Map:  82%|████████▏ | 177841/216925 [03:41<00:45, 864.71 examples/s]Map:  83%|████████▎ | 181043/216925 [03:41<00:48, 732.94 examples/s]Map:  83%|████████▎ | 179815/216925 [03:42<00:42, 880.90 examples/s]Map:  80%|████████  | 173947/216925 [03:42<00:48, 884.75 examples/s]Map:  82%|████████▏ | 177933/216925 [03:41<00:44, 876.11 examples/s]Map:  83%|████████▎ | 181131/216925 [03:41<00:46, 763.15 examples/s]Map:  83%|████████▎ | 179905/216925 [03:42<00:41, 882.16 examples/s]Map:  84%|████████▎ | 181220/216925 [03:41<00:45, 789.60 examples/s]Map:  83%|████████▎ | 179997/216925 [03:42<00:41, 889.89 examples/s]Map:  80%|████████  | 174045/216925 [03:42<01:00, 706.82 examples/s]Map:  82%|████████▏ | 178044/216925 [03:41<00:56, 692.47 examples/s]Map:  84%|████████▎ | 181312/216925 [03:41<00:43, 820.99 examples/s]Map:  80%|████████  | 174139/216925 [03:42<00:56, 756.59 examples/s]Map:  84%|████████▎ | 181403/216925 [03:41<00:42, 843.50 examples/s]Map:  82%|████████▏ | 178134/216925 [03:41<00:52, 740.41 examples/s]Map:  83%|████████▎ | 180091/216925 [03:42<00:52, 701.14 examples/s]Map:  80%|████████  | 174228/216925 [03:42<00:54, 787.14 examples/s]Map:  84%|████████▎ | 181495/216925 [03:41<00:41, 862.65 examples/s]Map:  82%|████████▏ | 178222/216925 [03:41<00:49, 774.37 examples/s]Map:  83%|████████▎ | 180183/216925 [03:42<00:48, 752.64 examples/s]Map:  80%|████████  | 174319/216925 [03:42<00:52, 817.48 examples/s]Map:  82%|████████▏ | 178312/216925 [03:41<00:47, 805.21 examples/s]Map:  84%|████████▎ | 181585/216925 [03:41<00:40, 869.83 examples/s]Map:  83%|████████▎ | 180272/216925 [03:42<00:46, 786.68 examples/s]Map:  80%|████████  | 174407/216925 [03:43<00:51, 830.45 examples/s]Map:  82%|████████▏ | 178399/216925 [03:41<00:46, 820.54 examples/s]Map:  84%|████████▍ | 181676/216925 [03:41<00:40, 877.35 examples/s]Map:  83%|████████▎ | 180364/216925 [03:42<00:44, 818.63 examples/s]Map:  80%|████████  | 174498/216925 [03:43<00:50, 848.42 examples/s]Map:  82%|████████▏ | 178487/216925 [03:41<00:46, 835.28 examples/s]Map:  84%|████████▍ | 181768/216925 [03:41<00:39, 886.51 examples/s]Map:  83%|████████▎ | 180458/216925 [03:43<00:43, 847.43 examples/s]Map:  82%|████████▏ | 178576/216925 [03:41<00:45, 846.53 examples/s]Map:  81%|████████  | 174630/216925 [03:43<00:49, 855.39 examples/s]Map:  84%|████████▍ | 181902/216925 [03:42<00:39, 885.10 examples/s]Map:  83%|████████▎ | 180592/216925 [03:43<00:42, 862.11 examples/s]Map:  82%|████████▏ | 178665/216925 [03:42<00:44, 855.44 examples/s]Map:  81%|████████  | 174722/216925 [03:43<00:48, 870.08 examples/s]Map:  84%|████████▍ | 181994/216925 [03:42<00:39, 891.14 examples/s]Map:  83%|████████▎ | 180681/216925 [03:43<00:41, 867.91 examples/s]Map:  82%|████████▏ | 178754/216925 [03:42<00:44, 862.42 examples/s]Map:  81%|████████  | 174815/216925 [03:43<00:47, 881.74 examples/s]Map:  82%|████████▏ | 178843/216925 [03:42<00:43, 869.30 examples/s]Map:  83%|████████▎ | 180814/216925 [03:43<00:41, 873.14 examples/s]Map:  81%|████████  | 174907/216925 [03:43<00:47, 888.95 examples/s]Map:  84%|████████▍ | 182088/216925 [03:42<00:49, 702.26 examples/s]Map:  83%|████████▎ | 180907/216925 [03:43<00:40, 883.19 examples/s]Map:  83%|████████▎ | 178974/216925 [03:42<00:43, 865.50 examples/s]Map:  84%|████████▍ | 182183/216925 [03:42<00:45, 758.08 examples/s]Map:  83%|████████▎ | 180997/216925 [03:43<00:40, 885.08 examples/s]Map:  81%|████████  | 175000/216925 [03:43<00:58, 714.63 examples/s]Map:  84%|████████▍ | 182276/216925 [03:42<00:43, 797.49 examples/s]Map:  81%|████████  | 175089/216925 [03:43<00:55, 756.69 examples/s]Map:  84%|████████▍ | 182370/216925 [03:42<00:41, 831.93 examples/s]Map:  83%|████████▎ | 179087/216925 [03:42<00:53, 703.80 examples/s]Map:  83%|████████▎ | 181089/216925 [03:43<00:51, 700.37 examples/s]Map:  81%|████████  | 175181/216925 [03:44<00:52, 797.33 examples/s]Map:  84%|████████▍ | 182460/216925 [03:42<00:40, 848.58 examples/s]Map:  83%|████████▎ | 179177/216925 [03:42<00:50, 745.94 examples/s]Map:  84%|████████▎ | 181183/216925 [03:43<00:47, 753.64 examples/s]Map:  81%|████████  | 175270/216925 [03:44<00:50, 820.14 examples/s]Map:  84%|��███████▍ | 182550/216925 [03:42<00:40, 858.79 examples/s]Map:  83%|████████▎ | 179269/216925 [03:42<00:48, 783.85 examples/s]Map:  84%|████████▎ | 181273/216925 [03:44<00:45, 789.44 examples/s]Map:  81%|████████  | 175362/216925 [03:44<00:49, 844.91 examples/s]Map:  84%|████████▍ | 182645/216925 [03:42<00:38, 882.73 examples/s]Map:  83%|████████▎ | 179360/216925 [03:42<00:46, 814.21 examples/s]Map:  84%|████████▎ | 181362/216925 [03:44<00:43, 814.19 examples/s]Map:  81%|████████  | 175452/216925 [03:44<00:48, 858.31 examples/s]Map:  83%|████████▎ | 179447/216925 [03:43<00:45, 827.78 examples/s]Map:  84%|████████▍ | 182780/216925 [03:43<00:38, 882.71 examples/s]Map:  84%|████████▎ | 181451/216925 [03:44<00:42, 831.76 examples/s]Map:  81%|████████  | 175546/216925 [03:44<00:47, 879.39 examples/s]Map:  83%|████████▎ | 179537/216925 [03:43<00:44, 844.02 examples/s]Map:  84%|████████▎ | 181538/216925 [03:44<00:42, 837.41 examples/s]Map:  84%|████████▍ | 182911/216925 [03:43<00:38, 875.11 examples/s]Map:  81%|████████  | 175672/216925 [03:44<00:47, 861.41 examples/s]Map:  83%|████████▎ | 179625/216925 [03:43<00:43, 853.20 examples/s]Map:  84%|████████▎ | 181627/216925 [03:44<00:41, 850.86 examples/s]Map:  81%|████████  | 175765/216925 [03:44<00:46, 877.15 examples/s]Map:  83%|████████▎ | 179714/216925 [03:43<00:43, 858.45 examples/s]Map:  84%|████████▍ | 181719/216925 [03:44<00:40, 866.93 examples/s]Map:  84%|████████▍ | 183000/216925 [03:43<00:47, 720.89 examples/s]Map:  81%|████████  | 175859/216925 [03:44<00:46, 891.85 examples/s]Map:  84%|████████▍ | 181807/216925 [03:44<00:40, 866.75 examples/s]Map:  83%|████████▎ | 179839/216925 [03:43<00:43, 846.97 examples/s]Map:  84%|████████▍ | 183088/216925 [03:43<00:44, 755.58 examples/s]Map:  84%|████████▍ | 181899/216925 [03:44<00:39, 879.84 examples/s]Map:  81%|████████  | 175995/216925 [03:44<00:45, 892.37 examples/s]Map:  84%|████████▍ | 183181/216925 [03:43<00:42, 794.80 examples/s]Map:  83%|████████▎ | 179965/216925 [03:43<00:43, 840.33 examples/s]Map:  84%|████████▍ | 181990/216925 [03:44<00:39, 884.72 examples/s]Map:  84%|████████▍ | 183271/216925 [03:43<00:40, 820.93 examples/s]Map:  81%|████████  | 176090/216925 [03:45<00:56, 719.32 examples/s]Map:  85%|████████▍ | 183358/216925 [03:43<00:40, 830.92 examples/s]Map:  83%|████████▎ | 180090/216925 [03:43<00:52, 708.30 examples/s]Map:  81%|████████  | 176186/216925 [03:45<00:52, 771.36 examples/s]Map:  84%|████████▍ | 182088/216925 [03:45<00:50, 688.24 examples/s]Map:  85%|████████▍ | 183448/216925 [03:43<00:39, 848.17 examples/s]Map:  83%|████████▎ | 180183/216925 [03:43<00:48, 753.80 examples/s]Map:  81%|████████▏ | 176276/216925 [03:45<00:50, 799.80 examples/s]Map:  84%|████████▍ | 182178/216925 [03:45<00:47, 736.49 examples/s]Map:  85%|████████▍ | 183544/216925 [03:44<00:38, 875.64 examples/s]Map:  83%|████████▎ | 180272/216925 [03:44<00:46, 781.20 examples/s]Map:  81%|████████▏ | 176369/216925 [03:45<00:48, 831.78 examples/s]Map:  84%|████████▍ | 182267/216925 [03:45<00:44, 770.69 examples/s]Map:  85%|████████▍ | 183639/216925 [03:44<00:37, 892.73 examples/s]Map:  83%|████████▎ | 180362/216925 [03:44<00:45, 807.08 examples/s]Map:  81%|████████▏ | 176465/216925 [03:45<00:46, 862.67 examples/s]Map:  84%|████████▍ | 182356/216925 [03:45<00:43, 799.92 examples/s]Map:  85%|████████▍ | 183778/216925 [03:44<00:36, 902.73 examples/s]Map:  83%|████████▎ | 180450/216925 [03:44<00:44, 822.16 examples/s]Map:  81%|████████▏ | 176555/216925 [03:45<00:46, 870.28 examples/s]Map:  84%|████████▍ | 182447/216925 [03:45<00:41, 827.24 examples/s]Map:  85%|████████▍ | 183871/216925 [03:44<00:36, 907.26 examples/s]Map:  83%|████████▎ | 180541/216925 [03:44<00:43, 843.62 examples/s]Map:  81%|████████▏ | 176645/216925 [03:45<00:45, 875.90 examples/s]Map:  84%|████████▍ | 182576/216925 [03:45<00:41, 836.73 examples/s]Map:  83%|████████▎ | 180632/216925 [03:44<00:42, 859.35 examples/s]Map:  85%|████████▍ | 183997/216925 [03:44<00:37, 877.86 examples/s]Map:  81%|██���█████▏ | 176778/216925 [03:45<00:45, 875.70 examples/s]Map:  84%|████████▍ | 182668/216925 [03:45<00:40, 855.36 examples/s]Map:  83%|████████▎ | 180762/216925 [03:44<00:42, 855.33 examples/s]Map:  84%|████████▍ | 182758/216925 [03:45<00:39, 864.00 examples/s]Map:  82%|████████▏ | 176905/216925 [03:46<00:46, 862.53 examples/s]Map:  85%|████████▍ | 184094/216925 [03:44<00:45, 715.44 examples/s]Map:  84%|████████▍ | 182847/216925 [03:45<00:39, 867.16 examples/s]Map:  83%|████████▎ | 180890/216925 [03:44<00:42, 850.76 examples/s]Map:  85%|████████▍ | 184188/216925 [03:44<00:42, 764.12 examples/s]Map:  83%|████████▎ | 180978/216925 [03:44<00:41, 856.00 examples/s]Map:  84%|████████▍ | 182981/216925 [03:46<00:38, 873.87 examples/s]Map:  82%|████████▏ | 177000/216925 [03:46<00:57, 691.49 examples/s]Map:  85%|████████▍ | 184279/216925 [03:44<00:40, 796.50 examples/s]Map:  82%|████████▏ | 177085/216925 [03:46<00:54, 725.40 examples/s]Map:  85%|████████▍ | 184370/216925 [03:45<00:39, 822.95 examples/s]Map:  82%|████████▏ | 177169/216925 [03:46<00:53, 749.52 examples/s]Map:  83%|████████▎ | 181090/216925 [03:45<00:50, 703.95 examples/s]Map:  84%|████████▍ | 183091/216925 [03:46<00:47, 713.23 examples/s]Map:  85%|████████▌ | 184462/216925 [03:45<00:38, 846.05 examples/s]Map:  82%|████████▏ | 177253/216925 [03:46<00:51, 769.48 examples/s]Map:  84%|████████▎ | 181178/216925 [03:45<00:48, 741.20 examples/s]Map:  84%|████████▍ | 183184/216925 [03:46<00:44, 760.62 examples/s]Map:  85%|████████▌ | 184556/216925 [03:45<00:37, 867.68 examples/s]Map:  82%|████████▏ | 177341/216925 [03:46<00:49, 796.97 examples/s]Map:  84%|████████▎ | 181268/216925 [03:45<00:45, 778.13 examples/s]Map:  84%|████████▍ | 183274/216925 [03:46<00:42, 791.64 examples/s]Map:  85%|████████▌ | 184652/216925 [03:45<00:36, 890.03 examples/s]Map:  82%|████████▏ | 177429/216925 [03:46<00:48, 816.17 examples/s]Map:  84%|████████▎ | 181355/216925 [03:45<00:44, 800.36 examples/s]Map:  85%|████████▍ | 183367/216925 [03:46<00:40, 824.68 examples/s]Map:  85%|████████▌ | 184788/216925 [03:45<00:35, 893.97 examples/s]Map:  82%|████████▏ | 177517/216925 [03:46<00:47, 829.22 examples/s]Map:  84%|████████▎ | 181443/216925 [03:45<00:43, 819.68 examples/s]Map:  85%|████████▍ | 183500/216925 [03:46<00:39, 842.83 examples/s]Map:  85%|████████▌ | 184880/216925 [03:45<00:35, 899.59 examples/s]Map:  84%|████████▎ | 181533/216925 [03:45<00:42, 840.87 examples/s]Map:  82%|████████▏ | 177640/216925 [03:47<00:47, 823.93 examples/s]Map:  85%|████████▌ | 184971/216925 [03:45<00:35, 900.69 examples/s]Map:  84%|████████▎ | 181620/216925 [03:45<00:41, 844.50 examples/s]Map:  85%|████████▍ | 183633/216925 [03:46<00:38, 853.81 examples/s]Map:  82%|████████▏ | 177726/216925 [03:47<00:47, 830.73 examples/s]Map:  84%|████████▍ | 181712/216925 [03:45<00:40, 863.06 examples/s]Map:  85%|████████▍ | 183724/216925 [03:47<00:38, 866.07 examples/s]Map:  82%|████████▏ | 177815/216925 [03:47<00:46, 841.29 examples/s]Map:  85%|████████▌ | 185089/216925 [03:45<00:44, 718.23 examples/s]Map:  84%|████████▍ | 181803/216925 [03:45<00:40, 872.65 examples/s]Map:  85%|████████▍ | 183818/216925 [03:47<00:37, 880.10 examples/s]Map:  82%|████████▏ | 177903/216925 [03:47<00:45, 848.50 examples/s]Map:  85%|████████▌ | 185181/216925 [03:46<00:41, 763.00 examples/s]Map:  84%|████████▍ | 181894/216925 [03:46<00:39, 879.28 examples/s]Map:  82%|████████▏ | 177990/216925 [03:47<00:45, 853.93 examples/s]Map:  85%|████████▍ | 183951/216925 [03:47<00:37, 877.16 examples/s]Map:  85%|████████▌ | 185274/216925 [03:46<00:39, 801.24 examples/s]Map:  84%|████████▍ | 181988/216925 [03:46<00:39, 893.21 examples/s]Map:  85%|████████▌ | 185364/216925 [03:46<00:38, 824.59 examples/s]Map:  82%|████████▏ | 178086/216925 [03:47<00:58, 668.42 examples/s]Map:  85%|████████▍ | 184044/216925 [03:47<00:46, 711.41 examples/s]Map:  85%|████████▌ | 185456/216925 [03:46<00:37, 846.23 examples/s]Map:  84%|████████▍ | 182087/216925 [03:46<00:49, 700.07 examples/s]Map:  82%|████████▏ | 178174/216925 [03:47<00:54, 716.28 examples/s]Map:  85%|████████▍ | 184140/216925 [03:47<00:42, 762.99 examples/s]Map:  86%|████████▌ | 185549/216925 [03:46<00:36, 865.17 examples/s]Map:  84%|████████▍ | 182175/216925 [03:46<00:46, 741.12 examples/s]Map:  82%|████████▏ | 178257/216925 [03:47<00:52, 741.51 examples/s]Map:  85%|████████▍ | 184230/216925 [03:47<00:41, 792.62 examples/s]Map:  86%|████████▌ | 185641/216925 [03:46<00:35, 876.68 examples/s]Map:  84%|████████▍ | 182261/216925 [03:46<00:45, 768.79 examples/s]Map:  85%|████████▍ | 184322/216925 [03:47<00:39, 823.73 examples/s]Map:  86%|████████▌ | 185731/216925 [03:46<00:35, 880.92 examples/s]Map:  84%|████████▍ | 182348/216925 [03:46<00:43, 794.42 examples/s]Map:  82%|████████▏ | 178373/216925 [03:47<00:51, 749.01 examples/s]Map:  85%|████████▌ | 184414/216925 [03:47<00:38, 845.73 examples/s]Map:  86%|████████▌ | 185822/216925 [03:46<00:35, 887.27 examples/s]Map:  84%|████████▍ | 182431/216925 [03:46<00:43, 800.67 examples/s]Map:  82%|████████▏ | 178458/216925 [03:48<00:49, 772.58 examples/s]Map:  85%|████████▌ | 184507/216925 [03:48<00:37, 865.02 examples/s]Map:  86%|████████▌ | 185912/216925 [03:46<00:35, 885.29 examples/s]Map:  82%|████████▏ | 178546/216925 [03:48<00:48, 799.01 examples/s]Map:  84%|████████▍ | 182555/216925 [03:46<00:42, 807.53 examples/s]Map:  85%|████████▌ | 184632/216925 [03:48<00:37, 849.95 examples/s]Map:  82%|████████▏ | 178662/216925 [03:48<00:48, 783.82 examples/s]Map:  84%|████████▍ | 182671/216925 [03:47<00:43, 791.78 examples/s]Map:  85%|████████▌ | 184721/216925 [03:48<00:37, 856.87 examples/s]Map:  86%|████████▌ | 186045/216925 [03:47<00:44, 689.76 examples/s]Map:  82%|████████▏ | 178749/216925 [03:48<00:47, 804.19 examples/s]Map:  84%|████████▍ | 182756/216925 [03:47<00:42, 803.64 examples/s]Map:  85%|████████▌ | 184812/216925 [03:48<00:37, 867.72 examples/s]Map:  86%|████████▌ | 186134/216925 [03:47<00:42, 731.72 examples/s]Map:  82%|████████▏ | 178836/216925 [03:48<00:46, 818.10 examples/s]Map:  84%|████████▍ | 182841/216925 [03:47<00:41, 812.33 examples/s]Map:  85%|████████▌ | 184907/216925 [03:48<00:36, 887.49 examples/s]Map:  86%|████████▌ | 186222/216925 [03:47<00:40, 764.93 examples/s]Map:  82%|████████▏ | 178922/216925 [03:48<00:45, 828.14 examples/s]Map:  84%|████████▍ | 182924/216925 [03:47<00:41, 813.69 examples/s]Map:  85%|████████▌ | 184997/216925 [03:48<00:35, 887.40 examples/s]Map:  86%|████████▌ | 186314/216925 [03:47<00:38, 803.88 examples/s]Map:  86%|████████▌ | 186406/216925 [03:47<00:36, 831.21 examples/s]Map:  83%|████████▎ | 179042/216925 [03:48<00:56, 668.73 examples/s]Map:  85%|████████▌ | 185091/216925 [03:48<00:45, 699.27 examples/s]Map:  84%|████████▍ | 183038/216925 [03:47<00:52, 648.25 examples/s]Map:  86%|████████▌ | 186500/216925 [03:47<00:35, 858.40 examples/s]Map:  83%|████████▎ | 179128/216925 [03:48<00:53, 710.71 examples/s]Map:  85%|████████▌ | 185185/216925 [03:48<00:42, 755.71 examples/s]Map:  84%|████████▍ | 183123/216925 [03:47<00:48, 691.93 examples/s]Map:  86%|████████▌ | 186591/216925 [03:47<00:34, 868.79 examples/s]Map:  83%|████████▎ | 179218/216925 [03:49<00:50, 753.82 examples/s]Map:  85%|████████▌ | 185276/216925 [03:48<00:40, 791.04 examples/s]Map:  84%|████████▍ | 183205/216925 [03:47<00:46, 721.09 examples/s]Map:  86%|████████▌ | 186680/216925 [03:47<00:34, 872.13 examples/s]Map:  83%|████████▎ | 179303/216925 [03:49<00:48, 775.48 examples/s]Map:  85%|████████▌ | 185369/216925 [03:49<00:38, 825.09 examples/s]Map:  84%|████████▍ | 183288/216925 [03:47<00:45, 745.63 examples/s]Map:  86%|████████▌ | 186772/216925 [03:47<00:34, 883.77 examples/s]Map:  83%|████████▎ | 179391/216925 [03:49<00:46, 800.22 examples/s]Map:  85%|████████▌ | 185459/216925 [03:49<00:37, 842.43 examples/s]Map:  85%|████████▍ | 183374/216925 [03:47<00:43, 774.40 examples/s]Map:  86%|████████▌ | 186866/216925 [03:48<00:33, 896.05 examples/s]Map:  83%|████████▎ | 179476/216925 [03:49<00:46, 810.68 examples/s]Map:  86%|████████▌ | 185551/216925 [03:49<00:36, 861.06 examples/s]Map:  85%|████████▍ | 183462/216925 [03:48<00:41, 800.16 examples/s]Map:  86%|████████▌ | 186960/216925 [03:48<00:33, 906.14 examples/s]Map:  83%|████████▎ | 179560/216925 [03:49<00:45, 816.86 examples/s]Map:  86%|████████▌ | 185644/216925 [03:49<00:35, 877.20 examples/s]Map:  85%|████████▍ | 183548/216925 [03:48<00:40, 815.54 examples/s]Map:  83%|████████▎ | 179646/216925 [03:49<00:45, 827.04 examples/s]Map:  86%|████████▌ | 185770/216925 [03:49<00:36, 853.01 examples/s]Map:  85%|████████▍ | 183665/216925 [03:48<00:41, 798.47 examples/s]Map:  86%|████████▌ | 187080/216925 [03:48<00:42, 697.78 examples/s]Map:  83%|████████▎ | 179764/216925 [03:49<00:46, 806.92 examples/s]Map:  86%|████████▋ | 187169/216925 [03:48<00:40, 740.25 examples/s]Map:  86%|████████▌ | 185898/216925 [03:49<00:36, 850.22 examples/s]Map:  85%|████████▍ | 183786/216925 [03:48<00:41, 799.60 examples/s]Map:  83%|████████▎ | 179851/216925 [03:49<00:45, 822.79 examples/s]Map:  86%|████████▋ | 187260/216925 [03:48<00:38, 780.00 examples/s]Map:  86%|████████▌ | 185990/216925 [03:49<00:35, 865.58 examples/s]Map:  85%|████████▍ | 183871/216925 [03:48<00:40, 808.44 examples/s]Map:  83%|████████▎ | 179936/216925 [03:49<00:44, 828.09 examples/s]Map:  86%|████████▋ | 187352/216925 [03:48<00:36, 813.12 examples/s]Map:  85%|████████▍ | 183993/216925 [03:48<00:40, 806.05 examples/s]Map:  86%|████████▌ | 186093/216925 [03:49<00:43, 705.29 examples/s]Map:  86%|████████▋ | 187484/216925 [03:48<00:35, 833.47 examples/s]Map:  83%|████████▎ | 180042/216925 [03:50<00:55, 659.26 examples/s]Map:  86%|████████▌ | 186187/216925 [03:50<00:40, 755.62 examples/s]Map:  86%|████████▋ | 187573/216925 [03:48<00:34, 843.58 examples/s]Map:  83%|████████▎ | 180128/216925 [03:50<00:52, 700.88 examples/s]Map:  85%|████████▍ | 184083/216925 [03:48<00:49, 658.20 examples/s]Map:  86%|████████▌ | 186276/216925 [03:50<00:39, 785.74 examples/s]Map:  87%|████████▋ | 187667/216925 [03:49<00:33, 865.52 examples/s]Map:  83%|████████▎ | 180211/216925 [03:50<00:50, 730.02 examples/s]Map:  85%|████████▍ | 184169/216925 [03:49<00:46, 699.76 examples/s]Map:  86%|████████▌ | 186365/216925 [03:50<00:37, 810.76 examples/s]Map:  87%|████████▋ | 187757/216925 [03:49<00:33, 870.35 examples/s]Map:  83%|████████▎ | 180298/216925 [03:50<00:48, 763.05 examples/s]Map:  85%|████████▍ | 184251/216925 [03:49<00:44, 726.97 examples/s]Map:  86%|████████▌ | 186453/216925 [03:50<00:36, 826.40 examples/s]Map:  87%|████████▋ | 187850/216925 [03:49<00:32, 885.53 examples/s]Map:  83%|████████▎ | 180382/216925 [03:50<00:46, 781.60 examples/s]Map:  85%|████████▍ | 184336/216925 [03:49<00:43, 755.05 examples/s]Map:  86%|████████▌ | 186542/216925 [03:50<00:36, 843.01 examples/s]Map:  87%|████████▋ | 187941/216925 [03:49<00:32, 887.46 examples/s]Map:  83%|████████▎ | 180467/216925 [03:50<00:45, 797.93 examples/s]Map:  85%|████████▌ | 184422/216925 [03:49<00:41, 780.86 examples/s]Map:  86%|████████▌ | 186633/216925 [03:50<00:35, 858.14 examples/s]Map:  83%|████████▎ | 180557/216925 [03:50<00:44, 825.03 examples/s]Map:  86%|████████▌ | 186726/216925 [03:50<00:34, 876.47 examples/s]Map:  85%|████████▌ | 184544/216925 [03:49<00:41, 788.83 examples/s]Map:  87%|████████▋ | 188044/216925 [03:49<00:41, 693.21 examples/s]Map:  83%|████████▎ | 180645/216925 [03:50<00:43, 839.93 examples/s]Map:  86%|████████▌ | 186822/216925 [03:50<00:33, 900.16 examples/s]Map:  85%|████████▌ | 184625/216925 [03:49<00:40, 791.94 examples/s]Map:  87%|████████▋ | 188133/216925 [03:49<00:39, 736.92 examples/s]Map:  83%|████████▎ | 180731/216925 [03:50<00:42, 842.04 examples/s]Map:  86%|████████▌ | 186939/216925 [03:50<00:35, 849.69 examples/s]Map:  85%|████████▌ | 184737/216925 [03:49<00:41, 771.38 examples/s]Map:  87%|████████▋ | 188251/216925 [03:49<00:38, 751.16 examples/s]Map:  83%|████████▎ | 180848/216925 [03:51<00:44, 811.62 examples/s]Map:  85%|████████▌ | 184821/216925 [03:49<00:40, 785.80 examples/s]Map:  87%|████████▋ | 188341/216925 [03:49<00:36, 786.60 examples/s]Map:  83%|████████▎ | 180932/216925 [03:51<00:44, 816.12 examples/s]Map:  86%|████████▌ | 187045/216925 [03:51<00:42, 697.35 examples/s]Map:  85%|████████▌ | 184907/216925 [03:49<00:39, 803.48 examples/s]Map:  87%|████████▋ | 188430/216925 [03:49<00:35, 811.83 examples/s]Map:  86%|████████▋ | 187136/216925 [03:51<00:40, 744.28 examples/s]Map:  85%|████████▌ | 184989/216925 [03:50<00:39, 807.34 examples/s]Map:  87%|████████▋ | 188518/216925 [03:50<00:34, 827.57 examples/s]Map:  83%|████████▎ | 181042/216925 [03:51<00:54, 658.43 examples/s]Map:  86%|████████▋ | 187223/216925 [03:51<00:38, 772.59 examples/s]Map:  87%|████████▋ | 188607/216925 [03:50<00:33, 841.89 examples/s]Map:  83%|████████▎ | 181130/216925 [03:51<00:50, 707.17 examples/s]Map:  86%|████████▋ | 187314/216925 [03:51<00:36, 806.27 examples/s]Map:  85%|████████▌ | 185083/216925 [03:50<00:49, 639.57 examples/s]Map:  87%|████████▋ | 188699/216925 [03:50<00:32, 862.32 examples/s]Map:  84%|████████▎ | 181213/216925 [03:51<00:48, 736.43 examples/s]Map:  86%|████████▋ | 187407/216925 [03:51<00:35, 837.11 examples/s]Map:  85%|████████▌ | 185167/216925 [03:50<00:46, 684.38 examples/s]Map:  84%|████████▎ | 181301/216925 [03:51<00:46, 769.96 examples/s]Map:  87%|████████▋ | 188827/216925 [03:50<00:32, 857.96 examples/s]Map:  86%|████████▋ | 187495/216925 [03:51<00:34, 846.85 examples/s]Map:  85%|████████▌ | 185250/216925 [03:50<00:44, 718.12 examples/s]Map:  84%|████████▎ | 181386/216925 [03:51<00:45, 786.42 examples/s]Map:  87%|████████▋ | 188920/216925 [03:50<00:32, 874.10 examples/s]Map:  86%|████████▋ | 187590/216925 [03:51<00:33, 873.21 examples/s]Map:  85%|████████▌ | 185337/216925 [03:50<00:41, 754.02 examples/s]Map:  84%|████████▎ | 181472/216925 [03:51<00:44, 805.45 examples/s]Map:  87%|████████▋ | 187684/216925 [03:51<00:32, 888.46 examples/s]Map:  85%|████████▌ | 185421/216925 [03:50<00:40, 774.31 examples/s]Map:  87%|████████▋ | 187776/216925 [03:51<00:32, 895.49 examples/s]Map:  87%|████████▋ | 189042/216925 [03:50<00:39, 705.41 examples/s]Map:  84%|████████▎ | 181596/216925 [03:52<00:43, 810.27 examples/s]Map:  86%|████████▌ | 185513/216925 [03:50<00:38, 812.81 examples/s]Map:  87%|████████▋ | 187868/216925 [03:52<00:32, 900.15 examples/s]Map:  87%|████████▋ | 189127/216925 [03:50<00:37, 736.34 examples/s]Map:  84%|████████▍ | 181679/216925 [03:52<00:43, 813.36 examples/s]Map:  86%|████████▌ | 185604/216925 [03:50<00:37, 836.20 examples/s]Map:  87%|████████▋ | 189217/216925 [03:50<00:35, 774.41 examples/s]Map:  84%|████████▍ | 181765/216925 [03:52<00:42, 823.85 examples/s]Map:  86%|████████▌ | 185693/216925 [03:51<00:36, 847.65 examples/s]Map:  87%|████████▋ | 187998/216925 [03:52<00:32, 881.86 examples/s]Map:  87%|████████▋ | 189337/216925 [03:51<00:35, 778.03 examples/s]Map:  84%|████████▍ | 181886/216925 [03:52<00:43, 811.39 examples/s]Map:  86%|████████▌ | 185810/216925 [03:51<00:38, 818.79 examples/s]Map:  87%|████████▋ | 188093/216925 [03:52<00:41, 698.41 examples/s]Map:  87%|████████▋ | 189422/216925 [03:51<00:34, 793.47 examples/s]Map:  86%|████████▌ | 185900/216925 [03:51<00:37, 838.23 examples/s]Map:  87%|████████▋ | 188182/216925 [03:52<00:38, 740.15 examples/s]Map:  87%|████████▋ | 189506/216925 [03:51<00:34, 802.03 examples/s]Map:  86%|████████▌ | 185991/216925 [03:51<00:36, 854.91 examples/s]Map:  84%|████████▍ | 182000/216925 [03:52<00:53, 653.12 examples/s]Map:  87%|████████▋ | 188273/216925 [03:52<00:36, 779.78 examples/s]Map:  87%|████████▋ | 189594/216925 [03:51<00:33, 822.37 examples/s]Map:  84%|████████▍ | 182085/216925 [03:52<00:50, 693.70 examples/s]Map:  87%|████████▋ | 188370/216925 [03:52<00:34, 826.05 examples/s]Map:  87%|████████▋ | 189687/216925 [03:51<00:32, 849.61 examples/s]Map:  86%|████████▌ | 186087/216925 [03:51<00:44, 689.80 examples/s]Map:  84%|████████▍ | 182171/216925 [03:52<00:47, 729.07 examples/s]Map:  87%|████████▋ | 188460/216925 [03:52<00:33, 843.38 examples/s]Map:  87%|████████▋ | 189781/216925 [03:51<00:31, 871.37 examples/s]Map:  86%|████████▌ | 186180/216925 [03:51<00:41, 744.63 examples/s]Map:  84%|████████▍ | 182258/216925 [03:53<00:45, 762.76 examples/s]Map:  87%|████████▋ | 188550/216925 [03:52<00:33, 857.32 examples/s]Map:  88%|████████▊ | 189874/216925 [03:51<00:30, 884.18 examples/s]Map:  86%|████████▌ | 186270/216925 [03:51<00:39, 782.30 examples/s]Map:  84%|████████▍ | 182345/216925 [03:53<00:43, 787.89 examples/s]Map:  87%|████████▋ | 188645/216925 [03:53<00:32, 880.72 examples/s]Map:  88%|████████▊ | 189965/216925 [03:51<00:30, 889.94 examples/s]Map:  86%|████████▌ | 186360/216925 [03:51<00:37, 812.81 examples/s]Map:  84%|████████▍ | 182429/216925 [03:53<00:43, 800.24 examples/s]Map:  86%|████████▌ | 186448/216925 [03:51<00:36, 827.76 examples/s]Map:  87%|████████▋ | 188775/216925 [03:53<00:32, 873.96 examples/s]Map:  84%|████████▍ | 182513/216925 [03:53<00:42, 809.80 examples/s]Map:  86%|████████▌ | 186539/216925 [03:52<00:35, 848.21 examples/s]Map:  88%|████████▊ | 190094/216925 [03:52<00:37, 714.35 examples/s]Map:  87%|████████▋ | 188864/216925 [03:53<00:31, 876.92 examples/s]Map:  84%|████████▍ | 182600/216925 [03:53<00:41, 824.49 examples/s]Map:  86%|████████▌ | 186631/216925 [03:52<00:34, 865.93 examples/s]Map:  88%|████████▊ | 190188/216925 [03:52<00:35, 763.19 examples/s]Map:  87%|████████▋ | 188959/216925 [03:53<00:31, 894.48 examples/s]Map:  84%|████████▍ | 182722/216925 [03:53<00:42, 814.08 examples/s]Map:  88%|████████▊ | 190281/216925 [03:52<00:33, 801.57 examples/s]Map:  86%|████████▌ | 186760/216925 [03:52<00:34, 862.25 examples/s]Map:  84%|████████▍ | 182841/216925 [03:53<00:42, 803.25 examples/s]Map:  87%|████████▋ | 189083/216925 [03:53<00:39, 713.09 examples/s]Map:  88%|████████▊ | 190407/216925 [03:52<00:32, 813.03 examples/s]Map:  86%|████████▌ | 186884/216925 [03:52<00:35, 846.13 examples/s]Map:  84%|████████▍ | 182925/216925 [03:53<00:42, 808.68 examples/s]Map:  87%|████████▋ | 189174/216925 [03:53<00:36, 756.03 examples/s]Map:  88%|████████▊ | 190501/216925 [03:52<00:31, 840.64 examples/s]Map:  86%|████████▌ | 186975/216925 [03:52<00:34, 861.04 examples/s]Map:  87%|████████▋ | 189264/216925 [03:53<00:35, 788.55 examples/s]Map:  88%|████████▊ | 190597/216925 [03:52<00:30, 869.82 examples/s]Map:  87%|████████▋ | 189359/216925 [03:53<00:33, 826.22 examples/s]Map:  88%|████████▊ | 190688/216925 [03:52<00:29, 877.37 examples/s]Map:  84%|████████▍ | 183043/216925 [03:54<00:51, 660.61 examples/s]Map:  86%|████████▌ | 187085/216925 [03:52<00:43, 692.77 examples/s]Map:  87%|████████▋ | 189452/216925 [03:54<00:32, 850.92 examples/s]Map:  88%|████████▊ | 190780/216925 [03:52<00:29, 884.59 examples/s]Map:  84%|████████▍ | 183128/216925 [03:54<00:48, 699.37 examples/s]Map:  86%|████████▋ | 187174/216925 [03:52<00:40, 733.67 examples/s]Map:  87%|████████▋ | 189544/216925 [03:54<00:31, 865.92 examples/s]Map:  88%|████████▊ | 190871/216925 [03:52<00:29, 889.65 examples/s]Map:  84%|████████▍ | 183213/216925 [03:54<00:45, 733.73 examples/s]Map:  86%|████████▋ | 187265/216925 [03:52<00:38, 773.63 examples/s]Map:  88%|████████▊ | 190966/216925 [03:53<00:28, 904.19 examples/s]Map:  84%|████████▍ | 183300/216925 [03:54<00:43, 766.64 examples/s]Map:  87%|████████▋ | 189679/216925 [03:54<00:31, 875.60 examples/s]Map:  86%|████████▋ | 187356/216925 [03:53<00:36, 806.91 examples/s]Map:  85%|████████▍ | 183384/216925 [03:54<00:42, 782.16 examples/s]Map:  87%|████████▋ | 189773/216925 [03:54<00:30, 889.32 examples/s]Map:  86%|████████▋ | 187446/216925 [03:53<00:35, 830.25 examples/s]Map:  85%|████████▍ | 183471/216925 [03:54<00:41, 803.21 examples/s]Map:  88%|████████▊ | 191088/216925 [03:53<00:36, 716.98 examples/s]Map:  88%|████████▊ | 189865/216925 [03:54<00:30, 896.79 examples/s]Map:  86%|████████▋ | 187537/216925 [03:53<00:34, 848.25 examples/s]Map:  85%|████████▍ | 183554/216925 [03:54<00:41, 806.47 examples/s]Map:  88%|████████▊ | 191187/216925 [03:53<00:33, 777.79 examples/s]Map:  88%|████████▊ | 189959/216925 [03:54<00:29, 907.85 examples/s]Map:  86%|████████▋ | 187626/216925 [03:53<00:34, 857.56 examples/s]Map:  85%|████████▍ | 183672/216925 [03:54<00:41, 797.56 examples/s]Map:  88%|████████▊ | 191309/216925 [03:53<00:32, 785.47 examples/s]Map:  87%|████████▋ | 187752/216925 [03:53<00:34, 846.48 examples/s]Map:  88%|████████▊ | 191398/216925 [03:53<00:31, 809.26 examples/s]Map:  88%|████████▊ | 190093/216925 [03:54<00:37, 709.58 examples/s]Map:  85%|████████▍ | 183796/216925 [03:54<00:41, 804.95 examples/s]Map:  87%|████████▋ | 187840/216925 [03:53<00:34, 851.90 examples/s]Map:  88%|████████▊ | 191487/216925 [03:53<00:30, 829.21 examples/s]Map:  88%|████████▊ | 190185/216925 [03:54<00:35, 752.23 examples/s]Map:  85%|████████▍ | 183880/216925 [03:55<00:40, 812.18 examples/s]Map:  87%|████████▋ | 187970/216925 [03:53<00:33, 855.97 examples/s]Map:  88%|████████▊ | 191577/216925 [03:53<00:30, 844.26 examples/s]Map:  88%|████████▊ | 190277/216925 [03:55<00:33, 791.25 examples/s]Map:  88%|████████▊ | 191670/216925 [03:53<00:29, 864.05 examples/s]Map:  88%|████████▊ | 190369/216925 [03:55<00:32, 820.64 examples/s]Map:  85%|████████▍ | 184000/216925 [03:55<00:50, 656.44 examples/s]Map:  87%|████████▋ | 188087/216925 [03:54<00:40, 706.95 examples/s]Map:  88%|████████▊ | 190458/216925 [03:55<00:31, 835.98 examples/s]Map:  88%|████████▊ | 191803/216925 [03:54<00:28, 869.75 examples/s]Map:  85%|████████▍ | 184087/216925 [03:55<00:46, 698.82 examples/s]Map:  87%|████████▋ | 188180/216925 [03:54<00:38, 752.42 examples/s]Map:  88%|████████▊ | 190549/216925 [03:55<00:30, 855.96 examples/s]Map:  88%|████████▊ | 191895/216925 [03:54<00:28, 882.04 examples/s]Map:  85%|████████▍ | 184173/216925 [03:55<00:44, 733.86 examples/s]Map:  87%|████████▋ | 188266/216925 [03:54<00:36, 775.44 examples/s]Map:  88%|████████▊ | 190639/216925 [03:55<00:30, 867.42 examples/s]Map:  89%|████████▊ | 191988/216925 [03:54<00:27, 894.01 examples/s]Map:  85%|████████▍ | 184259/216925 [03:55<00:42, 761.45 examples/s]Map:  87%|████████▋ | 188354/216925 [03:54<00:35, 797.48 examples/s]Map:  88%|████████▊ | 190728/216925 [03:55<00:30, 871.90 examples/s]Map:  85%|████████▍ | 184347/216925 [03:55<00:41, 788.30 examples/s]Map:  87%|████████▋ | 188440/216925 [03:54<00:35, 812.45 examples/s]Map:  88%|████████▊ | 190819/216925 [03:55<00:29, 879.39 examples/s]Map:  89%|████████▊ | 192089/216925 [03:54<00:35, 700.56 examples/s]Map:  87%|████████▋ | 188533/216925 [03:54<00:33, 840.16 examples/s]Map:  88%|████████▊ | 190910/216925 [03:55<00:29, 887.66 examples/s]Map:  85%|████████▌ | 184468/216925 [03:55<00:40, 792.86 examples/s]Map:  89%|████████▊ | 192183/216925 [03:54<00:32, 754.55 examples/s]Map:  85%|████████▌ | 184555/216925 [03:55<00:39, 810.88 examples/s]Map:  87%|████████▋ | 188650/216925 [03:54<00:34, 816.19 examples/s]Map:  89%|████████▊ | 192269/216925 [03:54<00:31, 779.29 examples/s]Map:  88%|████████▊ | 191000/216925 [03:55<00:37, 684.07 examples/s]Map:  89%|████████▊ | 192358/216925 [03:54<00:30, 805.91 examples/s]Map:  85%|████████▌ | 184676/216925 [03:56<00:40, 802.05 examples/s]Map:  87%|████████▋ | 188764/216925 [03:54<00:35, 792.18 examples/s]Map:  88%|████████▊ | 191088/216925 [03:56<00:35, 729.75 examples/s]Map:  89%|████████▊ | 192450/216925 [03:54<00:29, 834.09 examples/s]Map:  85%|████████▌ | 184758/216925 [03:56<00:40, 802.94 examples/s]Map:  87%|████████▋ | 188846/216925 [03:54<00:35, 796.51 examples/s]Map:  88%|████████▊ | 191181/216925 [03:56<00:33, 776.80 examples/s]Map:  89%|████████▉ | 192544/216925 [03:55<00:28, 861.71 examples/s]Map:  85%|████████▌ | 184847/216925 [03:56<00:38, 824.30 examples/s]Map:  88%|████████▊ | 191269/216925 [03:56<00:31, 802.87 examples/s]Map:  87%|████████▋ | 188967/216925 [03:55<00:35, 796.41 examples/s]Map:  89%|████████▉ | 192634/216925 [03:55<00:27, 869.98 examples/s]Map:  88%|████████▊ | 191362/216925 [03:56<00:30, 836.72 examples/s]Map:  85%|█████���██▌ | 184971/216925 [03:56<00:38, 822.12 examples/s]Map:  89%|████████▉ | 192723/216925 [03:55<00:27, 871.25 examples/s]Map:  88%|████████▊ | 191451/216925 [03:56<00:29, 851.09 examples/s]Map:  89%|████████▉ | 192814/216925 [03:55<00:27, 880.33 examples/s]Map:  87%|████████▋ | 189089/216925 [03:55<00:40, 680.18 examples/s]Map:  88%|████████▊ | 191542/216925 [03:56<00:29, 863.51 examples/s]Map:  85%|████████▌ | 185085/216925 [03:56<00:47, 671.95 examples/s]Map:  89%|████████▉ | 192907/216925 [03:55<00:26, 893.07 examples/s]Map:  87%|████████▋ | 189176/216925 [03:55<00:38, 718.81 examples/s]Map:  88%|████████▊ | 191630/216925 [03:56<00:29, 865.78 examples/s]Map:  85%|████████▌ | 185174/216925 [03:56<00:44, 716.12 examples/s]Map:  87%|████████▋ | 189265/216925 [03:55<00:36, 754.31 examples/s]Map:  88%|████████▊ | 191720/216925 [03:56<00:28, 872.53 examples/s]Map:  89%|████████▉ | 193000/216925 [03:55<00:33, 714.53 examples/s]Map:  85%|████████▌ | 185253/216925 [03:56<00:43, 727.04 examples/s]Map:  87%|████████▋ | 189354/216925 [03:55<00:35, 785.51 examples/s]Map:  88%|████████▊ | 191812/216925 [03:56<00:28, 885.55 examples/s]Map:  89%|████████▉ | 193090/216925 [03:55<00:31, 760.47 examples/s]Map:  85%|████████▌ | 185334/216925 [03:57<00:42, 745.67 examples/s]Map:  87%|████████▋ | 189447/216925 [03:55<00:33, 820.68 examples/s]Map:  88%|████████▊ | 191905/216925 [03:56<00:27, 896.72 examples/s]Map:  89%|████████▉ | 193184/216925 [03:55<00:29, 806.43 examples/s]Map:  85%|████████▌ | 185420/216925 [03:57<00:40, 771.21 examples/s]Map:  87%|████████▋ | 189535/216925 [03:55<00:32, 832.21 examples/s]Map:  89%|████████▉ | 193305/216925 [03:55<00:29, 800.97 examples/s]Map:  86%|████████▌ | 185533/216925 [03:57<00:41, 761.64 examples/s]Map:  89%|████████▊ | 192000/216925 [03:57<00:36, 680.49 examples/s]Map:  87%|████████▋ | 189655/216925 [03:55<00:33, 815.95 examples/s]Map:  89%|████████▉ | 193397/216925 [03:56<00:28, 828.46 examples/s]Map:  86%|████████▌ | 185617/216925 [03:57<00:40, 780.45 examples/s]Map:  89%|████████▊ | 192091/216925 [03:57<00:33, 733.41 examples/s]Map:  87%|████████▋ | 189747/216925 [03:56<00:32, 838.49 examples/s]Map:  89%|████████▉ | 193490/216925 [03:56<00:27, 851.13 examples/s]Map:  86%|████████▌ | 185701/216925 [03:57<00:39, 792.02 examples/s]Map:  89%|████████▊ | 192183/216925 [03:57<00:31, 779.70 examples/s]Map:  88%|████████▊ | 189839/216925 [03:56<00:31, 857.33 examples/s]Map:  86%|████████▌ | 185784/216925 [03:57<00:39, 797.74 examples/s]Map:  89%|████████▊ | 192276/216925 [03:57<00:30, 817.51 examples/s]Map:  89%|████████▉ | 193621/216925 [03:56<00:27, 854.62 examples/s]Map:  88%|████████▊ | 189967/216925 [03:56<00:31, 852.99 examples/s]Map:  86%|████████▌ | 185873/216925 [03:57<00:37, 821.11 examples/s]Map:  89%|████████▊ | 192368/216925 [03:57<00:29, 843.35 examples/s]Map:  89%|████████▉ | 193715/216925 [03:56<00:26, 872.90 examples/s]Map:  86%|████████▌ | 185958/216925 [03:57<00:37, 825.98 examples/s]Map:  89%|████████▊ | 192460/216925 [03:57<00:28, 861.14 examples/s]Map:  89%|████████▉ | 193807/216925 [03:56<00:26, 884.17 examples/s]Map:  88%|████████▊ | 190088/216925 [03:56<00:38, 697.35 examples/s]Map:  89%|████████▉ | 192554/216925 [03:57<00:27, 881.46 examples/s]Map:  89%|████████▉ | 193901/216925 [03:56<00:25, 895.81 examples/s]Map:  88%|████████▊ | 190175/216925 [03:56<00:36, 732.93 examples/s]Map:  89%|████████▉ | 192645/216925 [03:57<00:27, 886.48 examples/s]Map:  89%|████████▉ | 193994/216925 [03:56<00:25, 902.52 examples/s]Map:  86%|████████▌ | 186082/216925 [03:58<00:46, 657.45 examples/s]Map:  89%|████████▉ | 192735/216925 [03:57<00:27, 886.90 examples/s]Map:  86%|████████▌ | 186167/216925 [03:58<00:44, 697.68 examples/s]Map:  88%|████████▊ | 190299/216925 [03:56<00:35, 758.32 examples/s]Map:  89%|████████▉ | 192828/216925 [03:58<00:26, 895.73 examples/s]Map:  89%|████████▉ | 194090/216925 [03:56<00:32, 708.90 examples/s]Map:  86%|████████▌ | 186252/216925 [03:58<00:41, 731.70 examples/s]Map:  88%|████████▊ | 190389/216925 [03:56<00:33, 787.37 examples/s]Map:  90%|████████▉ | 194174/216925 [03:57<00:30, 739.95 examples/s]Map:  86%|████████▌ | 186333/216925 [03:58<00:40, 749.68 examples/s]Map:  89%|████████▉ | 192955/216925 [03:58<00:27, 874.57 examples/s]Map:  88%|████████▊ | 190510/216925 [03:57<00:33, 788.56 examples/s]Map:  90%|████████▉ | 194259/216925 [03:57<00:29, 766.17 examples/s]Map:  86%|████████▌ | 186456/216925 [03:58<00:39, 769.66 examples/s]Map:  88%|████████▊ | 190600/216925 [03:57<00:32, 812.44 examples/s]Map:  90%|████████▉ | 194348/216925 [03:57<00:28, 797.06 examples/s]Map:  89%|████████▉ | 193045/216925 [03:58<00:33, 703.70 examples/s]Map:  86%|████████▌ | 186541/216925 [03:58<00:38, 787.45 examples/s]Map:  88%|████████▊ | 190692/216925 [03:57<00:31, 838.16 examples/s]Map:  90%|████████▉ | 194438/216925 [03:57<00:27, 824.20 examples/s]Map:  89%|████████▉ | 193141/216925 [03:58<00:31, 760.80 examples/s]Map:  86%|████████▌ | 186629/216925 [03:58<00:37, 810.21 examples/s]Map:  88%|████████▊ | 190783/216925 [03:57<00:30, 854.55 examples/s]Map:  90%|████████▉ | 194525/216925 [03:57<00:26, 834.65 examples/s]Map:  89%|████████▉ | 193233/216925 [03:58<00:29, 797.17 examples/s]Map:  86%|████████▌ | 186715/216925 [03:58<00:36, 819.38 examples/s]Map:  88%|████████▊ | 190871/216925 [03:57<00:30, 860.40 examples/s]Map:  90%|████████▉ | 194619/216925 [03:57<00:25, 863.02 examples/s]Map:  89%|████████▉ | 193327/216925 [03:58<00:28, 830.74 examples/s]Map:  86%|████████▌ | 186804/216925 [03:58<00:35, 838.15 examples/s]Map:  90%|████████▉ | 194712/216925 [03:57<00:25, 881.27 examples/s]Map:  89%|████████▉ | 193419/216925 [03:58<00:27, 853.32 examples/s]Map:  86%|████████▌ | 186894/216925 [03:59<00:35, 852.91 examples/s]Map:  90%|████████▉ | 194804/216925 [03:57<00:24, 890.59 examples/s]Map:  88%|████████▊ | 191000/216925 [03:57<00:37, 697.20 examples/s]Map:  89%|████████▉ | 193510/216925 [03:58<00:27, 865.87 examples/s]Map:  86%|████████▌ | 186984/216925 [03:59<00:34, 864.31 examples/s]Map:  90%|████████▉ | 194898/216925 [03:57<00:24, 902.71 examples/s]Map:  88%|████████▊ | 191080/216925 [03:57<00:35, 719.52 examples/s]Map:  89%|████████▉ | 193600/216925 [03:59<00:26, 873.25 examples/s]Map:  90%|████████▉ | 194994/216925 [03:57<00:23, 916.23 examples/s]Map:  88%|████████▊ | 191172/216925 [03:57<00:33, 765.74 examples/s]Map:  89%|████████▉ | 193692/216925 [03:59<00:26, 882.41 examples/s]Map:  86%|████████▌ | 187091/216925 [03:59<00:42, 697.61 examples/s]Map:  88%|████████▊ | 191261/216925 [03:58<00:32, 795.59 examples/s]Map:  86%|████████▋ | 187185/216925 [03:59<00:39, 752.63 examples/s]Map:  89%|████████▉ | 193826/216925 [03:59<00:26, 883.12 examples/s]Map:  90%|████████▉ | 195090/216925 [03:58<00:30, 708.81 examples/s]Map:  88%|████████▊ | 191352/216925 [03:58<00:31, 823.54 examples/s]Map:  86%|████████▋ | 187274/216925 [03:59<00:37, 784.36 examples/s]Map:  90%|████████▉ | 195183/216925 [03:58<00:28, 759.60 examples/s]Map:  89%|████████▉ | 193958/216925 [03:59<00:26, 880.28 examples/s]Map:  88%|████████▊ | 191481/216925 [03:58<00:30, 833.15 examples/s]Map:  86%|████████▋ | 187366/216925 [03:59<00:36, 818.11 examples/s]Map:  90%|█████████ | 195275/216925 [03:58<00:27, 799.72 examples/s]Map:  88%|████████▊ | 191570/216925 [03:58<00:30, 843.85 examples/s]Map:  86%|████████▋ | 187453/216925 [03:59<00:35, 830.62 examples/s]Map:  90%|█████████ | 195368/216925 [03:58<00:25, 832.82 examples/s]Map:  89%|████████▉ | 194091/216925 [03:59<00:31, 735.71 examples/s]Map:  88%|████████▊ | 191661/216925 [03:58<00:29, 857.03 examples/s]Map:  86%|████████▋ | 187544/216925 [03:59<00:34, 849.80 examples/s]Map:  90%|█████████ | 195459/216925 [03:58<00:25, 849.44 examples/s]Map:  90%|████████▉ | 194187/216925 [03:59<00:29, 781.99 examples/s]Map:  88%|████████▊ | 191751/216925 [03:58<00:29, 864.01 examples/s]Map:  86%|████████▋ | 187634/216925 [03:59<00:33, 862.77 examples/s]Map:  90%|█████████ | 195547/216925 [03:58<00:24, 857.60 examples/s]Map:  90%|████████▉ | 194276/216925 [03:59<00:28, 803.10 examples/s]Map:  88%|████████▊ | 191839/216925 [03:58<00:28, 866.57 examples/s]Map:  90%|█████████ | 195642/216925 [03:58<00:24, 880.19 examples/s]Map:  87%|████████▋ | 187766/216925 [04:00<00:33, 864.76 examples/s]Map:  90%|████████▉ | 194371/216925 [03:59<00:26, 836.60 examples/s]Map:  88%|████████▊ | 191931/216925 [03:58<00:28, 875.17 examples/s]Map:  87%|████████▋ | 187855/216925 [04:00<00:33, 868.70 examples/s]Map:  90%|█████████ | 195777/216925 [03:58<00:23, 882.06 examples/s]Map:  90%|████████▉ | 194464/216925 [04:00<00:26, 857.06 examples/s]Map:  90%|████████▉ | 194555/216925 [04:00<00:25, 870.18 examples/s]Map:  87%|████████▋ | 187984/216925 [04:00<00:33, 861.14 examples/s]Map:  89%|████████▊ | 192043/216925 [03:59<00:36, 688.17 examples/s]Map:  90%|█████████ | 195906/216925 [03:59<00:24, 871.05 examples/s]Map:  90%|████████▉ | 194647/216925 [04:00<00:25, 882.57 examples/s]Map:  89%|████████▊ | 192136/216925 [03:59<00:33, 742.80 examples/s]Map:  90%|█████████ | 195998/216925 [03:59<00:23, 879.70 examples/s]Map:  90%|████████▉ | 194739/216925 [04:00<00:24, 891.43 examples/s]Map:  87%|████████▋ | 188089/216925 [04:00<00:41, 701.24 examples/s]Map:  89%|████████▊ | 192226/216925 [03:59<00:31, 780.19 examples/s]Map:  87%|████████▋ | 188172/216925 [04:00<00:39, 726.87 examples/s]Map:  90%|████████▉ | 194873/216925 [04:00<00:24, 889.74 examples/s]Map:  89%|████████▊ | 192352/216925 [03:59<00:30, 797.97 examples/s]Map:  90%|█████████ | 196126/216925 [03:59<00:29, 702.32 examples/s]Map:  87%|████████▋ | 188266/216925 [04:00<00:36, 776.06 examples/s]Map:  90%|████████▉ | 194966/216925 [04:00<00:24, 897.06 examples/s]Map:  89%|████████▊ | 192443/216925 [03:59<00:29, 822.08 examples/s]Map:  90%|█████████ | 196216/216925 [03:59<00:27, 742.83 examples/s]Map:  87%|████████▋ | 188356/216925 [04:00<00:35, 805.57 examples/s]Map:  89%|████████▉ | 192533/216925 [03:59<00:29, 841.00 examples/s]Map:  90%|█████████ | 196307/216925 [03:59<00:26, 778.81 examples/s]Map:  90%|████████▉ | 195089/216925 [04:00<00:29, 730.87 examples/s]Map:  87%|████████▋ | 188486/216925 [04:01<00:34, 823.03 examples/s]Map:  91%|█████████ | 196401/216925 [03:59<00:25, 816.96 examples/s]Map:  89%|████████▉ | 192662/216925 [03:59<00:28, 842.26 examples/s]Map:  90%|████████▉ | 195178/216925 [04:00<00:28, 766.02 examples/s]Map:  87%|████████▋ | 188575/216925 [04:01<00:33, 837.03 examples/s]Map:  91%|█████████ | 196495/216925 [03:59<00:24, 847.18 examples/s]Map:  89%|████████▉ | 192751/216925 [03:59<00:28, 850.96 examples/s]Map:  90%|█████████ | 195268/216925 [04:01<00:27, 796.34 examples/s]Map:  87%|████████▋ | 188666/216925 [04:01<00:33, 853.73 examples/s]Map:  91%|█████████ | 196589/216925 [03:59<00:23, 869.64 examples/s]Map:  89%|████████▉ | 192841/216925 [03:59<00:28, 859.28 examples/s]Map:  90%|█████████ | 195363/216925 [04:01<00:25, 834.00 examples/s]Map:  91%|█████████ | 196683/216925 [04:00<00:22, 888.47 examples/s]Map:  87%|████████▋ | 188795/216925 [04:01<00:32, 853.06 examples/s]Map:  89%|████████▉ | 192930/216925 [04:00<00:27, 862.24 examples/s]Map:  90%|█████████ | 195453/216925 [04:01<00:25, 849.06 examples/s]Map:  91%|█████████ | 196775/216925 [04:00<00:22, 894.75 examples/s]Map:  87%|████████▋ | 188886/216925 [04:01<00:32, 863.81 examples/s]Map:  90%|█████████ | 195546/216925 [04:01<00:24, 870.85 examples/s]Map:  91%|█████████ | 196866/216925 [04:00<00:22, 895.62 examples/s]Map:  87%|████████▋ | 188981/216925 [04:01<00:31, 884.43 examples/s]Map:  89%|████████▉ | 193044/216925 [04:00<00:34, 697.02 examples/s]Map:  91%|█████████ | 196963/216925 [04:00<00:21, 911.82 examples/s]Map:  90%|█████████ | 195682/216925 [04:01<00:24, 881.41 examples/s]Map:  89%|████████▉ | 193138/216925 [04:00<00:31, 751.00 examples/s]Map:  87%|████████▋ | 189085/216925 [04:01<00:39, 703.35 examples/s]Map:  89%|████████▉ | 193223/216925 [04:00<00:30, 773.51 examples/s]Map:  90%|█████████ | 195817/216925 [04:01<00:23, 884.51 examples/s]Map:  91%|█████████ | 197089/216925 [04:00<00:27, 713.63 examples/s]Map:  87%|████████▋ | 189179/216925 [04:01<00:36, 756.19 examples/s]Map:  89%|████████▉ | 193311/216925 [04:00<00:29, 797.26 examples/s]Map:  90%|█████████ | 195949/216925 [04:01<00:23, 878.88 examples/s]Map:  91%|█████████ | 197181/216925 [04:00<00:26, 758.04 examples/s]Map:  87%|████████▋ | 189269/216925 [04:01<00:35, 789.84 examples/s]Map:  89%|████████▉ | 193401/216925 [04:00<00:28, 822.87 examples/s]Map:  91%|█████████ | 197275/216925 [04:00<00:24, 800.59 examples/s]Map:  87%|████████▋ | 189356/216925 [04:02<00:34, 809.42 examples/s]Map:  89%|████████▉ | 193493/216925 [04:00<00:27, 846.64 examples/s]Map:  90%|█████████ | 196046/216925 [04:02<00:28, 722.58 examples/s]Map:  91%|█████████ | 197369/216925 [04:00<00:23, 833.33 examples/s]Map:  87%|████████▋ | 189446/216925 [04:02<00:33, 830.87 examples/s]Map:  89%|████████▉ | 193580/216925 [04:00<00:27, 848.07 examples/s]Map:  90%|█████████ | 196137/216925 [04:02<00:27, 762.72 examples/s]Map:  91%|█████████ | 197461/216925 [04:00<00:22, 854.77 examples/s]Map:  87%|████████▋ | 189540/216925 [04:02<00:31, 858.85 examples/s]Map:  89%|████████▉ | 193705/216925 [04:01<00:27, 837.81 examples/s]Map:  90%|█████████ | 196226/216925 [04:02<00:26, 790.55 examples/s]Map:  91%|█████████ | 197552/216925 [04:01<00:22, 866.36 examples/s]Map:  87%|████████▋ | 189632/216925 [04:02<00:31, 869.90 examples/s]Map:  89%|████████▉ | 193797/216925 [04:01<00:27, 855.36 examples/s]Map:  91%|█████████ | 196318/216925 [04:02<00:25, 821.87 examples/s]Map:  91%|█████████ | 197648/216925 [04:01<00:21, 890.99 examples/s]Map:  87%|████████▋ | 189746/216925 [04:02<00:32, 825.53 examples/s]Map:  89%|████████▉ | 193887/216925 [04:01<00:26, 865.13 examples/s]Map:  91%|█████████ | 196409/216925 [04:02<00:24, 843.13 examples/s]Map:  91%|█████████ | 197741/216925 [04:01<00:21, 899.32 examples/s]Map:  88%|████████▊ | 189831/216925 [04:02<00:32, 830.02 examples/s]Map:  89%|████████▉ | 193980/216925 [04:01<00:26, 877.95 examples/s]Map:  91%|█████████ | 196500/216925 [04:02<00:23, 860.81 examples/s]Map:  91%|█████████ | 197837/216925 [04:01<00:20, 915.88 examples/s]Map:  91%|█████████ | 197930/216925 [04:01<00:20, 918.39 examples/s]Map:  88%|████████▊ | 189954/216925 [04:02<00:32, 823.69 examples/s]Map:  91%|█████████ | 196631/216925 [04:02<00:23, 861.49 examples/s]Map:  89%|████████▉ | 194081/216925 [04:01<00:33, 683.85 examples/s]Map:  91%|█████████ | 196720/216925 [04:02<00:23, 866.63 examples/s]Map:  90%|████████▉ | 194171/216925 [04:01<00:31, 731.15 examples/s]Map:  88%|████████▊ | 190039/216925 [04:03<00:41, 647.63 examples/s]Map:  91%|█████████▏| 198044/216925 [04:01<00:26, 724.98 examples/s]Map:  91%|█████████ | 196810/216925 [04:02<00:22, 875.47 examples/s]Map:  90%|████████▉ | 194257/216925 [04:01<00:29, 759.36 examples/s]Map:  88%|████████▊ | 190125/216925 [04:03<00:38, 693.02 examples/s]Map:  91%|█████████▏| 198137/216925 [04:01<00:24, 772.98 examples/s]Map:  91%|█████████ | 196902/216925 [04:02<00:22, 886.03 examples/s]Map:  90%|████████▉ | 194342/216925 [04:01<00:28, 781.50 examples/s]Map:  88%|████████▊ | 190211/216925 [04:03<00:36, 731.97 examples/s]Map:  91%|█████████▏| 198230/216925 [04:01<00:23, 809.76 examples/s]Map:  91%|█████████ | 196997/216925 [04:03<00:22, 901.27 examples/s]Map:  90%|████████▉ | 194429/216925 [04:01<00:28, 803.34 examples/s]Map:  88%|████████▊ | 190295/216925 [04:03<00:35, 757.94 examples/s]Map:  91%|█████████▏| 198320/216925 [04:01<00:22, 831.74 examples/s]Map:  90%|████████▉ | 194513/216925 [04:02<00:27, 812.94 examples/s]Map:  88%|████████▊ | 190379/216925 [04:03<00:34, 778.50 examples/s]Map:  91%|█████████ | 197093/216925 [04:03<00:27, 709.89 examples/s]Map:  91%|█████████▏| 198450/216925 [04:02<00:21, 841.38 examples/s]Map:  90%|████████▉ | 194604/216925 [04:02<00:26, 835.48 examples/s]Map:  88%|████████▊ | 190467/216925 [04:03<00:32, 804.28 examples/s]Map:  91%|█████████ | 197186/216925 [04:03<00:25, 760.57 examples/s]Map:  92%|█████████▏| 198539/216925 [04:02<00:21, 850.27 examples/s]Map:  90%|████████▉ | 194690/216925 [04:02<00:26, 839.33 examples/s]Map:  88%|████████▊ | 190550/216925 [04:03<00:32, 810.59 examples/s]Map:  91%|█████████ | 197268/216925 [04:03<00:25, 774.27 examples/s]Map:  88%|████████▊ | 190638/216925 [04:03<00:31, 828.37 examples/s]Map:  91%|█████████ | 197353/216925 [04:03<00:24, 790.35 examples/s]Map:  90%|████████▉ | 194818/216925 [04:02<00:26, 840.60 examples/s]Map:  88%|████████▊ | 190727/216925 [04:03<00:31, 843.25 examples/s]Map:  92%|█████████▏| 198629/216925 [04:02<00:29, 613.82 examples/s]Map:  91%|█████████ | 197441/216925 [04:03<00:23, 812.54 examples/s]Map:  90%|████████▉ | 194905/216925 [04:02<00:26, 845.70 examples/s]Map:  92%|█████████▏| 198708/216925 [04:02<00:28, 648.31 examples/s]Map:  91%|█████████ | 197525/216925 [04:03<00:23, 815.84 examples/s]Map:  88%|████████▊ | 190845/216925 [04:03<00:31, 818.09 examples/s]Map:  92%|█████████▏| 198794/216925 [04:02<00:26, 695.96 examples/s]Map:  88%|████████▊ | 190929/216925 [04:04<00:31, 821.30 examples/s]Map:  90%|████████▉ | 195000/216925 [04:02<00:33, 651.41 examples/s]Map:  91%|█████████ | 197652/216925 [04:03<00:23, 819.27 examples/s]Map:  92%|█████████▏| 198883/216925 [04:02<00:24, 742.57 examples/s]Map:  90%|████████▉ | 195085/216925 [04:02<00:31, 694.32 examples/s]Map:  91%|█████████ | 197741/216925 [04:04<00:22, 835.60 examples/s]Map:  92%|█████████▏| 198976/216925 [04:02<00:22, 788.98 examples/s]Map:  90%|████████▉ | 195174/216925 [04:02<00:29, 741.34 examples/s]Map:  91%|█████████ | 197827/216925 [04:04<00:22, 839.18 examples/s]Map:  88%|████████▊ | 191043/216925 [04:04<00:38, 668.32 examples/s]Map:  90%|█████████ | 195261/216925 [04:03<00:28, 770.82 examples/s]Map:  91%|█████████ | 197913/216925 [04:04<00:22, 840.78 examples/s]Map:  88%|████████▊ | 191129/216925 [04:04<00:36, 709.31 examples/s]Map:  92%|█████████▏| 199090/216925 [04:03<00:27, 651.59 examples/s]Map:  90%|█████████ | 195350/216925 [04:03<00:26, 800.74 examples/s]Map:  88%|████████▊ | 191217/216925 [04:04<00:34, 747.89 examples/s]Map:  92%|█████████▏| 199181/216925 [04:03<00:25, 708.01 examples/s]Map:  90%|█████████ | 195436/216925 [04:03<00:26, 814.61 examples/s]Map:  91%|█████████▏| 198000/216925 [04:04<00:28, 658.40 examples/s]Map:  88%|████████▊ | 191298/216925 [04:04<00:33, 763.03 examples/s]Map:  92%|█████████▏| 199272/216925 [04:03<00:23, 756.13 examples/s]Map:  90%|█████████ | 195524/216925 [04:03<00:25, 827.77 examples/s]Map:  91%|█████████▏| 198087/216925 [04:04<00:26, 707.30 examples/s]Map:  88%|████████▊ | 191382/216925 [04:04<00:32, 781.45 examples/s]Map:  92%|█████████▏| 199366/216925 [04:03<00:21, 802.38 examples/s]Map:  91%|█████████▏| 198177/216925 [04:04<00:24, 754.88 examples/s]Map:  88%|████████▊ | 191474/216925 [04:04<00:31, 811.98 examples/s]Map:  90%|█████████ | 195653/216925 [04:03<00:25, 836.97 examples/s]Map:  92%|█████████▏| 199453/216925 [04:03<00:21, 817.50 examples/s]Map:  91%|█████████▏| 198265/216925 [04:04<00:23, 784.96 examples/s]Map:  88%|████████▊ | 191558/216925 [04:04<00:31, 815.95 examples/s]Map:  90%|█████████ | 195775/216925 [04:03<00:25, 825.12 examples/s]Map:  91%|█████████▏| 198351/216925 [04:04<00:23, 805.18 examples/s]Map:  92%|█████████▏| 199581/216925 [04:03<00:20, 828.27 examples/s]Map:  88%|████████▊ | 191681/216925 [04:05<00:31, 814.15 examples/s]Map:  90%|█████████ | 195892/216925 [04:03<00:26, 806.93 examples/s]Map:  91%|█████████▏| 198467/216925 [04:05<00:23, 792.15 examples/s]Map:  92%|█████████▏| 199696/216925 [04:03<00:21, 804.65 examples/s]Map:  88%|████████▊ | 191798/216925 [04:05<00:31, 800.26 examples/s]Map:  90%|█████████ | 195977/216925 [04:03<00:25, 814.14 examples/s]Map:  92%|█████████▏| 199791/216925 [04:03<00:20, 838.18 examples/s]Map:  88%|████████▊ | 191883/216925 [04:05<00:30, 809.71 examples/s]Map:  92%|█████████▏| 199882/216925 [04:04<00:19, 854.63 examples/s]Map:  88%|████████▊ | 191966/216925 [04:05<00:30, 813.41 examples/s]Map:  92%|█████████▏| 198590/216925 [04:05<00:29, 624.88 examples/s]Map:  90%|█████████ | 196088/216925 [04:04<00:31, 666.50 examples/s]Map:  92%|█████████▏| 199974/216925 [04:04<00:19, 867.92 examples/s]Map:  92%|█████████▏| 198679/216925 [04:05<00:26, 676.95 examples/s]Map:  90%|█████████ | 196178/216925 [04:04<00:29, 714.19 examples/s]Map:  92%|█████████▏| 198768/216925 [04:05<00:25, 723.34 examples/s]Map:  89%|████████▊ | 192089/216925 [04:05<00:37, 663.22 examples/s]Map:  90%|█████████ | 196262/216925 [04:04<00:27, 742.20 examples/s]Map:  92%|█████████▏| 200090/216925 [04:04<00:24, 697.14 examples/s]Map:  92%|█████████▏| 198855/216925 [04:05<00:23, 756.00 examples/s]Map:  89%|████████▊ | 192176/216925 [04:05<00:35, 704.88 examples/s]Map:  91%|█████████ | 196348/216925 [04:04<00:26, 768.95 examples/s]Map:  92%|█████████▏| 200178/216925 [04:04<00:22, 736.53 examples/s]Map:  92%|█████████▏| 198941/216925 [04:05<00:23, 781.41 examples/s]Map:  89%|████████▊ | 192260/216925 [04:05<00:33, 735.55 examples/s]Map:  91%|█████████ | 196438/216925 [04:04<00:25, 800.26 examples/s]Map:  92%|█████████▏| 200270/216925 [04:04<00:21, 778.80 examples/s]Map:  89%|████████▊ | 192345/216925 [04:05<00:32, 762.54 examples/s]Map:  91%|█████████ | 196523/216925 [04:04<00:25, 810.48 examples/s]Map:  92%|█████████▏| 200363/216925 [04:04<00:20, 816.49 examples/s]Map:  92%|█████████▏| 199040/216925 [04:05<00:28, 637.52 examples/s]Map:  89%|████████▊ | 192432/216925 [04:06<00:31, 789.44 examples/s]Map:  91%|█████████ | 196611/216925 [04:04<00:24, 827.27 examples/s]Map:  92%|█████████▏| 200452/216925 [04:04<00:19, 835.29 examples/s]Map:  92%|█████████▏| 199130/216925 [04:06<00:25, 696.51 examples/s]Map:  89%|████████▊ | 192517/216925 [04:06<00:30, 805.53 examples/s]Map:  91%|█████████ | 196708/216925 [04:04<00:23, 867.05 examples/s]Map:  92%|█████████▏| 200540/216925 [04:04<00:19, 845.45 examples/s]Map:  92%|█████████▏| 199214/216925 [04:06<00:24, 727.10 examples/s]Map:  89%|████████▉ | 192631/216925 [04:06<00:30, 784.20 examples/s]Map:  91%|█████████ | 196824/216925 [04:04<00:24, 827.23 examples/s]Map:  92%|█████████▏| 199298/216925 [04:06<00:23, 753.01 examples/s]Map:  93%|█████████▎| 200666/216925 [04:05<00:19, 840.59 examples/s]Map:  91%|█████████ | 196911/216925 [04:05<00:23, 836.17 examples/s]Map:  92%|█████████▏| 199384/216925 [04:06<00:22, 778.30 examples/s]Map:  93%|█████████▎| 200752/216925 [04:05<00:19, 843.19 examples/s]Map:  89%|████████▉ | 192739/216925 [04:06<00:31, 757.93 examples/s]Map:  92%|█████████▏| 199472/216925 [04:06<00:21, 803.67 examples/s]Map:  93%|█████████▎| 200838/216925 [04:05<00:19, 846.09 examples/s]Map:  89%|████████▉ | 192829/216925 [04:06<00:30, 791.15 examples/s]Map:  91%|█████████ | 197000/216925 [04:05<00:29, 673.85 examples/s]Map:  92%|█████████▏| 199563/216925 [04:06<00:20, 829.91 examples/s]Map:  93%|█████████▎| 200927/216925 [04:05<00:18, 856.80 examples/s]Map:  89%|████████▉ | 192916/216925 [04:06<00:29, 809.01 examples/s]Map:  91%|█████████ | 197086/216925 [04:05<00:27, 716.28 examples/s]Map:  92%|█████████▏| 199650/216925 [04:06<00:20, 839.55 examples/s]Map:  91%|█████████ | 197177/216925 [04:05<00:25, 763.15 examples/s]Map:  92%|█████████▏| 199737/216925 [04:06<00:20, 845.96 examples/s]Map:  89%|████████▉ | 193000/216925 [04:06<00:37, 646.35 examples/s]Map:  93%|█████████▎| 201043/216925 [04:05<00:23, 686.68 examples/s]Map:  91%|█████████ | 197263/216925 [04:05<00:24, 787.73 examples/s]Map:  92%|█████████▏| 199824/216925 [04:06<00:20, 850.99 examples/s]Map:  89%|████████▉ | 193082/216925 [04:06<00:34, 686.02 examples/s]Map:  93%|█████████▎| 201134/216925 [04:05<00:21, 735.58 examples/s]Map:  91%|█████████ | 197351/216925 [04:05<00:24, 809.51 examples/s]Map:  92%|█████████▏| 199914/216925 [04:06<00:19, 863.07 examples/s]Map:  89%|████████▉ | 193170/216925 [04:07<00:32, 732.95 examples/s]Map:  93%|��████████▎| 201228/216925 [04:05<00:20, 784.60 examples/s]Map:  91%|█████████ | 197439/216925 [04:05<00:23, 826.40 examples/s]Map:  89%|████████▉ | 193255/216925 [04:07<00:31, 762.06 examples/s]Map:  93%|█████████▎| 201321/216925 [04:05<00:19, 819.74 examples/s]Map:  91%|█████████ | 197525/216925 [04:05<00:23, 833.59 examples/s]Map:  89%|████████▉ | 193341/216925 [04:07<00:29, 786.19 examples/s]Map:  93%|█████████▎| 201411/216925 [04:05<00:18, 838.26 examples/s]Map:  92%|█████████▏| 200042/216925 [04:07<00:24, 687.43 examples/s]Map:  91%|█████████ | 197614/216925 [04:06<00:22, 845.03 examples/s]Map:  89%|████████▉ | 193424/216925 [04:07<00:29, 793.93 examples/s]Map:  92%|█████████▏| 200126/216925 [04:07<00:23, 718.98 examples/s]Map:  93%|█████████▎| 201536/216925 [04:06<00:18, 832.35 examples/s]Map:  91%|█████████ | 197729/216925 [04:06<00:23, 811.12 examples/s]Map:  92%|█████████▏| 200213/216925 [04:07<00:22, 753.42 examples/s]Map:  89%|████████▉ | 193546/216925 [04:07<00:29, 795.67 examples/s]Map:  93%|█████████▎| 201624/216925 [04:06<00:18, 842.28 examples/s]Map:  91%|█████████ | 197817/216925 [04:06<00:23, 826.77 examples/s]Map:  92%|█████████▏| 200306/216925 [04:07<00:20, 794.69 examples/s]Map:  89%|████████▉ | 193635/216925 [04:07<00:28, 818.71 examples/s]Map:  93%|█████████▎| 201713/216925 [04:06<00:17, 851.90 examples/s]Map:  91%|█████████ | 197904/216925 [04:06<00:22, 837.20 examples/s]Map:  92%|█████████▏| 200391/216925 [04:07<00:20, 807.82 examples/s]Map:  89%|████████▉ | 193721/216925 [04:07<00:28, 826.58 examples/s]Map:  93%|█████████▎| 201801/216925 [04:06<00:17, 857.47 examples/s]Map:  91%|█████████▏| 197994/216925 [04:06<00:22, 851.67 examples/s]Map:  92%|█████████▏| 200478/216925 [04:07<00:20, 822.29 examples/s]Map:  89%|████████▉ | 193811/216925 [04:07<00:27, 846.54 examples/s]Map:  93%|█████████▎| 201889/216925 [04:06<00:17, 858.52 examples/s]Map:  92%|█████████▏| 200568/216925 [04:07<00:19, 842.07 examples/s]Map:  89%|████████▉ | 193899/216925 [04:07<00:27, 851.71 examples/s]Map:  93%|█████████▎| 201983/216925 [04:06<00:17, 877.96 examples/s]Map:  91%|█████████▏| 198081/216925 [04:06<00:28, 661.45 examples/s]Map:  93%|█████████▎| 200658/216925 [04:07<00:18, 857.59 examples/s]Map:  89%|████████▉ | 193988/216925 [04:08<00:26, 861.35 examples/s]Map:  91%|█████████▏| 198170/216925 [04:06<00:26, 713.01 examples/s]Map:  93%|█████████▎| 200746/216925 [04:07<00:18, 860.62 examples/s]Map:  93%|█████████▎| 202088/216925 [04:06<00:21, 690.16 examples/s]Map:  91%|█████████▏| 198255/216925 [04:06<00:25, 746.00 examples/s]Map:  93%|█████████▎| 200833/216925 [04:08<00:18, 862.43 examples/s]Map:  89%|████████▉ | 194089/216925 [04:08<00:33, 687.40 examples/s]Map:  93%|█████████▎| 202179/216925 [04:06<00:19, 739.64 examples/s]Map:  91%|█████████▏| 198342/216925 [04:06<00:23, 776.86 examples/s]Map:  93%|█████████▎| 200922/216925 [04:08<00:18, 868.09 examples/s]Map:  90%|████████▉ | 194179/216925 [04:08<00:30, 736.51 examples/s]Map:  93%|█████████▎| 202265/216925 [04:07<00:19, 767.32 examples/s]Map:  91%|█████████▏| 198425/216925 [04:07<00:23, 787.35 examples/s]Map:  90%|████████▉ | 194269/216925 [04:08<00:29, 777.31 examples/s]Map:  93%|█████████▎| 202356/216925 [04:07<00:18, 802.75 examples/s]Map:  92%|█████████▏| 198516/216925 [04:07<00:22, 818.27 examples/s]Map:  90%|████████▉ | 194355/216925 [04:08<00:28, 798.34 examples/s]Map:  93%|█████████▎| 201038/216925 [04:08<00:23, 684.44 examples/s]Map:  93%|█████████▎| 202481/216925 [04:07<00:17, 809.03 examples/s]Map:  93%|█████████▎| 201119/216925 [04:08<00:22, 710.37 examples/s]Map:  90%|████████▉ | 194479/216925 [04:08<00:27, 804.87 examples/s]Map:  93%|█████████▎| 202571/216925 [04:07<00:17, 829.26 examples/s]Map:  93%|█████████▎| 201208/216925 [04:08<00:20, 751.04 examples/s]Map:  92%|█████████▏| 198630/216925 [04:07<00:30, 599.23 examples/s]Map:  90%|████████▉ | 194567/216925 [04:08<00:27, 821.82 examples/s]Map:  93%|��████████▎| 202660/216925 [04:07<00:16, 843.53 examples/s]Map:  93%|█████████▎| 201297/216925 [04:08<00:19, 782.59 examples/s]Map:  92%|█████████▏| 198717/216925 [04:07<00:27, 652.73 examples/s]Map:  90%|████████▉ | 194654/216925 [04:08<00:26, 831.21 examples/s]Map:  93%|█████████▎| 202748/216925 [04:07<00:16, 852.30 examples/s]Map:  93%|█████████▎| 201387/216925 [04:08<00:19, 811.65 examples/s]Map:  92%|█████████▏| 198805/216925 [04:07<00:25, 702.87 examples/s]Map:  90%|████████▉ | 194741/216925 [04:08<00:26, 840.21 examples/s]Map:  94%|█████████▎| 202839/216925 [04:07<00:16, 866.82 examples/s]Map:  93%|█████████▎| 201481/216925 [04:08<00:18, 841.82 examples/s]Map:  92%|█████████▏| 198893/216925 [04:07<00:24, 746.26 examples/s]Map:  90%|████████▉ | 194828/216925 [04:09<00:26, 847.07 examples/s]Map:  94%|█████████▎| 202932/216925 [04:07<00:15, 880.24 examples/s]Map:  92%|█████████▏| 198979/216925 [04:07<00:23, 774.07 examples/s]Map:  90%|████████▉ | 194920/216925 [04:09<00:25, 863.20 examples/s]Map:  93%|█████████▎| 201610/216925 [04:09<00:18, 844.72 examples/s]Map:  93%|█████████▎| 201701/216925 [04:09<00:17, 860.24 examples/s]Map:  94%|█████████▎| 203044/216925 [04:08<00:19, 708.67 examples/s]Map:  92%|█████████▏| 199085/216925 [04:08<00:28, 632.37 examples/s]Map:  93%|█████████▎| 201791/216925 [04:09<00:17, 869.71 examples/s]Map:  90%|████████▉ | 195043/216925 [04:09<00:31, 695.16 examples/s]Map:  94%|█████████▎| 203134/216925 [04:08<00:18, 751.75 examples/s]Map:  92%|█████████▏| 199175/216925 [04:08<00:25, 689.93 examples/s]Map:  93%|█████████▎| 201881/216925 [04:09<00:17, 875.90 examples/s]Map:  90%|████████▉ | 195130/216925 [04:09<00:29, 734.63 examples/s]Map:  94%|█████████▎| 203228/216925 [04:08<00:17, 795.04 examples/s]Map:  92%|█████████▏| 199260/216925 [04:08<00:24, 727.55 examples/s]Map:  90%|████████▉ | 195224/216925 [04:09<00:27, 782.82 examples/s]Map:  94%|█████████▎| 203325/216925 [04:08<00:16, 837.11 examples/s]Map:  92%|█████████▏| 199344/216925 [04:08<00:23, 754.93 examples/s]Map:  90%|█████████ | 195311/216925 [04:09<00:26, 801.97 examples/s]Map:  93%|█████████▎| 202000/216925 [04:09<00:21, 685.70 examples/s]Map:  94%|█████████▍| 203457/216925 [04:08<00:15, 849.68 examples/s]Map:  92%|█████████▏| 199432/216925 [04:08<00:22, 785.78 examples/s]Map:  90%|█████████ | 195399/216925 [04:09<00:26, 821.28 examples/s]Map:  93%|█████████▎| 202088/216925 [04:09<00:20, 727.05 examples/s]Map:  94%|█████████▍| 203548/216925 [04:08<00:15, 863.11 examples/s]Map:  92%|█████████▏| 199521/216925 [04:08<00:21, 812.29 examples/s]Map:  90%|█████████ | 195489/216925 [04:09<00:25, 841.85 examples/s]Map:  93%|█████████▎| 202179/216925 [04:09<00:19, 768.56 examples/s]Map:  94%|█████████▍| 203637/216925 [04:08<00:15, 868.24 examples/s]Map:  90%|█████████ | 195578/216925 [04:10<00:25, 853.78 examples/s]Map:  93%|█████████▎| 202270/216925 [04:09<00:18, 802.32 examples/s]Map:  92%|█████████▏| 199642/216925 [04:08<00:21, 808.02 examples/s]Map:  94%|█████████▍| 203729/216925 [04:08<00:14, 879.97 examples/s]Map:  90%|█████████ | 195667/216925 [04:10<00:24, 861.91 examples/s]Map:  93%|█████████▎| 202359/216925 [04:10<00:17, 822.85 examples/s]Map:  92%|█████████▏| 199732/216925 [04:08<00:20, 829.19 examples/s]Map:  94%|█████████▍| 203822/216925 [04:08<00:14, 891.66 examples/s]Map:  90%|█████████ | 195757/216925 [04:10<00:24, 870.32 examples/s]Map:  93%|█████████▎| 202448/216925 [04:10<00:17, 840.75 examples/s]Map:  92%|█████████▏| 199824/216925 [04:08<00:20, 850.95 examples/s]Map:  90%|█████████ | 195852/216925 [04:10<00:23, 890.87 examples/s]Map:  94%|█████████▍| 203957/216925 [04:09<00:14, 890.39 examples/s]Map:  93%|█████████▎| 202538/216925 [04:10<00:16, 854.49 examples/s]Map:  92%|█████████▏| 199912/216925 [04:09<00:19, 853.83 examples/s]Map:  93%|█████████▎| 202626/216925 [04:10<00:16, 859.91 examples/s]Map:  90%|█████████ | 195980/216925 [04:10<00:24, 871.12 examples/s]Map:  94%|█████████▍| 204047/216925 [04:09<00:18, 707.48 examples/s]Map:  93%|█████████▎| 202715/216925 [04:10<00:16, 866.82 examples/s]Map:  92%|█████████▏| 200000/216925 [04:09<00:25, 667.13 examples/s]Map:  94%|█████████▍| 204138/216925 [04:09<00:16, 752.66 examples/s]Map:  93%|█████████▎| 202806/216925 [04:10<00:16, 875.76 examples/s]Map:  92%|█████████▏| 200087/216925 [04:09<00:23, 712.44 examples/s]Map:  90%|█████████ | 196090/216925 [04:10<00:29, 707.70 examples/s]Map:  94%|█████████▍| 204231/216925 [04:09<00:15, 793.91 examples/s]Map:  94%|█████████▎| 202897/216925 [04:10<00:15, 881.99 examples/s]Map:  92%|█████████▏| 200175/216925 [04:09<00:22, 752.36 examples/s]Map:  90%|█████████ | 196177/216925 [04:10<00:27, 741.28 examples/s]Map:  94%|█████████▍| 204320/216925 [04:09<00:15, 818.49 examples/s]Map:  94%|█████████▎| 202991/216925 [04:10<00:15, 894.82 examples/s]Map:  92%|█████████▏| 200261/216925 [04:09<00:21, 778.53 examples/s]Map:  90%|█████████ | 196264/216925 [04:10<00:26, 770.15 examples/s]Map:  94%|█████████▍| 204414/216925 [04:09<00:14, 848.67 examples/s]Map:  92%|█████████▏| 200349/216925 [04:09<00:20, 805.71 examples/s]Map:  91%|█████████ | 196355/216925 [04:11<00:25, 802.45 examples/s]Map:  94%|█████████▍| 204509/216925 [04:09<00:14, 869.67 examples/s]Map:  94%|█████████▎| 203091/216925 [04:10<00:19, 707.59 examples/s]Map:  91%|█████████ | 196449/216925 [04:11<00:24, 834.29 examples/s]Map:  92%|█████████▏| 200472/216925 [04:09<00:20, 809.72 examples/s]Map:  94%|█████████▍| 204601/216925 [04:09<00:13, 880.34 examples/s]Map:  94%|█████████▎| 203179/216925 [04:11<00:18, 749.01 examples/s]Map:  91%|█████████ | 196543/216925 [04:11<00:23, 858.63 examples/s]Map:  92%|█████████▏| 200557/216925 [04:09<00:19, 818.80 examples/s]Map:  94%|█████████▍| 204692/216925 [04:09<00:13, 886.65 examples/s]Map:  94%|█████████▎| 203268/216925 [04:11<00:17, 782.02 examples/s]Map:  92%|█████████▏| 200647/216925 [04:10<00:19, 838.28 examples/s]Map:  91%|█████████ | 196671/216925 [04:11<00:23, 854.14 examples/s]Map:  94%|█████████▎| 203356/216925 [04:11<00:16, 805.11 examples/s]Map:  94%|█████████▍| 204827/216925 [04:10<00:13, 888.62 examples/s]Map:  91%|█████████ | 196761/216925 [04:11<00:23, 860.43 examples/s]Map:  94%|█████████▍| 203444/216925 [04:11<00:16, 824.99 examples/s]Map:  93%|█████████▎| 200776/216925 [04:10<00:19, 843.98 examples/s]Map:  94%|█████████▍| 204962/216925 [04:10<00:13, 889.81 examples/s]Map:  93%|█████████▎| 200867/216925 [04:10<00:18, 859.56 examples/s]Map:  91%|█████████ | 196892/216925 [04:11<00:23, 861.35 examples/s]Map:  94%|█████████▍| 203571/216925 [04:11<00:16, 829.21 examples/s]Map:  91%|█████████ | 196983/216925 [04:11<00:22, 870.81 examples/s]Map:  94%|█████████▍| 203660/216925 [04:11<00:15, 844.68 examples/s]Map:  93%|█████████▎| 200996/216925 [04:10<00:18, 854.16 examples/s]Map:  95%|█████████▍| 205092/216925 [04:10<00:16, 738.69 examples/s]Map:  94%|█████████▍| 203749/216925 [04:11<00:15, 856.21 examples/s]Map:  95%|█████████▍| 205172/216925 [04:10<00:15, 750.56 examples/s]Map:  91%|█████████ | 197082/216925 [04:11<00:28, 687.08 examples/s]Map:  94%|█████████▍| 203878/216925 [04:11<00:15, 854.10 examples/s]Map:  93%|█████████▎| 201122/216925 [04:10<00:22, 688.89 examples/s]Map:  95%|█████████▍| 205261/216925 [04:10<00:14, 780.59 examples/s]Map:  91%|█████████ | 197176/216925 [04:12<00:26, 741.27 examples/s]Map:  94%|█████████▍| 203970/216925 [04:11<00:14, 868.57 examples/s]Map:  93%|█████████▎| 201212/216925 [04:10<00:21, 729.29 examples/s]Map:  95%|█████████▍| 205353/216925 [04:10<00:14, 814.58 examples/s]Map:  91%|█████████ | 197267/216925 [04:12<00:25, 780.83 examples/s]Map:  93%|█████████▎| 201301/216925 [04:10<00:20, 762.60 examples/s]Map:  95%|█████████▍| 205444/216925 [04:10<00:13, 837.01 examples/s]Map:  91%|█████████ | 197361/216925 [04:12<00:23, 819.00 examples/s]Map:  93%|█████████▎| 201393/216925 [04:10<00:19, 799.18 examples/s]Map:  95%|█████████▍| 205536/216925 [04:10<00:13, 857.09 examples/s]Map:  94%|█████████▍| 204090/216925 [04:12<00:18, 710.62 examples/s]Map:  91%|█████████ | 197451/216925 [04:12<00:23, 837.66 examples/s]Map:  93%|█████████▎| 201485/216925 [04:11<00:18, 829.63 examples/s]Map:  94%|█████████▍| 204180/216925 [04:12<00:17, 749.12 examples/s]Map:  91%|█████████ | 197539/216925 [04:12<00:22, 847.47 examples/s]Map:  95%|█████████▍| 205670/216925 [04:11<00:12, 867.45 examples/s]Map:  93%|█████████▎| 201576/216925 [04:11<00:18, 846.34 examples/s]Map:  94%|█████████▍| 204274/216925 [04:12<00:15, 793.07 examples/s]Map:  95%|█████████▍| 205761/216925 [04:11<00:12, 874.62 examples/s]Map:  93%|█████████▎| 201668/216925 [04:11<00:17, 862.51 examples/s]Map:  91%|█████████ | 197668/216925 [04:12<00:22, 851.19 examples/s]Map:  94%|█████████▍| 204370/216925 [04:12<00:15, 831.64 examples/s]Map:  95%|█████████▍| 205851/216925 [04:11<00:12, 878.07 examples/s]Map:  93%|█████████▎| 201761/216925 [04:11<00:17, 880.88 examples/s]Map:  91%|█████████ | 197756/216925 [04:12<00:22, 856.91 examples/s]Map:  94%|█████████▍| 204461/216925 [04:12<00:14, 849.84 examples/s]Map:  95%|█████████▍| 205948/216925 [04:11<00:12, 898.59 examples/s]Map:  91%|█████████ | 197852/216925 [04:12<00:21, 879.29 examples/s]Map:  94%|█████████▍| 204555/216925 [04:12<00:14, 872.66 examples/s]Map:  93%|█████████▎| 201895/216925 [04:11<00:17, 879.49 examples/s]Map:  94%|█████████▍| 204645/216925 [04:12<00:13, 880.09 examples/s]Map:  93%|█████████▎| 201986/216925 [04:11<00:16, 884.39 examples/s]Map:  91%|█████████▏| 197983/216925 [04:12<00:21, 875.70 examples/s]Map:  95%|█████████▍| 206043/216925 [04:11<00:15, 697.01 examples/s]Map:  94%|█████████▍| 204737/216925 [04:12<00:13, 888.12 examples/s]Map:  95%|█████████▌| 206139/216925 [04:11<00:14, 757.57 examples/s]Map:  94%|█████████▍| 204828/216925 [04:12<00:13, 892.02 examples/s]Map:  91%|█████████▏| 198089/216925 [04:13<00:26, 715.90 examples/s]Map:  93%|█████████▎| 202091/216925 [04:11<00:21, 706.27 examples/s]Map:  95%|█████████▌| 206232/216925 [04:11<00:13, 798.45 examples/s]Map:  94%|█████████▍| 204921/216925 [04:13<00:13, 898.54 examples/s]Map:  91%|█████████▏| 198182/216925 [04:13<00:24, 762.92 examples/s]Map:  93%|█████████▎| 202182/216925 [04:11<00:19, 752.20 examples/s]Map:  95%|█████████▌| 206324/216925 [04:11<00:12, 827.67 examples/s]Map:  91%|█████████▏| 198276/216925 [04:13<00:23, 804.28 examples/s]Map:  93%|█████████▎| 202270/216925 [04:12<00:18, 778.45 examples/s]Map:  95%|█████████▌| 206415/216925 [04:12<00:12, 845.71 examples/s]Map:  95%|█████████▍| 205041/216925 [04:13<00:16, 706.25 examples/s]Map:  91%|█████████▏| 198365/216925 [04:13<00:22, 825.35 examples/s]Map:  93%|█████████▎| 202360/216925 [04:12<00:18, 808.78 examples/s]Map:  95%|█████████▌| 206506/216925 [04:12<00:12, 854.74 examples/s]Map:  95%|█████████▍| 205142/216925 [04:13<00:15, 772.70 examples/s]Map:  91%|█████████▏| 198455/216925 [04:13<00:21, 843.46 examples/s]Map:  93%|█████████▎| 202453/216925 [04:12<00:17, 839.33 examples/s]Map:  95%|█████████▌| 206600/216925 [04:12<00:11, 875.17 examples/s]Map:  95%|█████████▍| 205235/216925 [04:13<00:14, 808.23 examples/s]Map:  93%|█████████▎| 202543/216925 [04:12<00:16, 855.73 examples/s]Map:  95%|█████████▌| 206693/216925 [04:12<00:11, 887.02 examples/s]Map:  95%|█████████▍| 205323/216925 [04:13<00:14, 824.17 examples/s]Map:  93%|█████████▎| 202633/216925 [04:12<00:16, 866.88 examples/s]Map:  95%|█████████▌| 206823/216925 [04:12<00:11, 876.90 examples/s]Map:  95%|█████████▍| 205415/216925 [04:13<00:13, 847.25 examples/s]Map:  92%|█████████▏| 198544/216925 [04:13<00:33, 551.83 examples/s]Map:  93%|█████████▎| 202722/216925 [04:12<00:16, 871.44 examples/s]Map:  95%|█████████▌| 206918/216925 [04:12<00:11, 895.46 examples/s]Map:  95%|█████████▍| 205507/216925 [04:13<00:13, 863.13 examples/s]Map:  92%|█████████▏| 198632/216925 [04:13<00:29, 617.39 examples/s]Map:  93%|█████████▎| 202812/216925 [04:12<00:16, 877.69 examples/s]Map:  95%|█████████▍| 205598/216925 [04:13<00:12, 873.85 examples/s]Map:  92%|█████████▏| 198724/216925 [04:14<00:26, 681.55 examples/s]Map:  94%|█████████▎| 202946/216925 [04:12<00:15, 878.93 examples/s]Map:  95%|█████████▍| 205690/216925 [04:14<00:12, 884.05 examples/s]Map:  92%|█████████▏| 198814/216925 [04:14<00:24, 731.68 examples/s]Map:  95%|█████████▌| 207044/216925 [04:12<00:13, 725.46 examples/s]Map:  92%|█████████▏| 198905/216925 [04:14<00:23, 776.07 examples/s]Map:  95%|█████████▌| 207136/216925 [04:12<00:12, 764.92 examples/s]Map:  95%|█████████▍| 205823/216925 [04:14<00:12, 883.07 examples/s]Map:  94%|█████████▎| 203043/216925 [04:13<00:19, 708.40 examples/s]Map:  92%|█████████▏| 198996/216925 [04:14<00:22, 809.05 examples/s]Map:  96%|█████████▌| 207229/216925 [04:13<00:12, 803.54 examples/s]Map:  95%|█████████▍| 205916/216925 [04:14<00:12, 891.64 examples/s]Map:  94%|█████████▎| 203136/216925 [04:13<00:18, 757.83 examples/s]Map:  96%|█████████▌| 207319/216925 [04:13<00:11, 826.53 examples/s]Map:  94%|█████████▎| 203223/216925 [04:13<00:17, 783.05 examples/s]Map:  92%|█████████▏| 199093/216925 [04:14<00:26, 668.36 examples/s]Map:  96%|█████████▌| 207414/216925 [04:13<00:11, 856.17 examples/s]Map:  94%|█████████▎| 203314/216925 [04:13<00:16, 815.37 examples/s]Map:  95%|█████████▍| 206045/216925 [04:14<00:14, 729.12 examples/s]Map:  92%|█████████▏| 199186/216925 [04:14<00:24, 729.84 examples/s]Map:  96%|█████████▌| 207505/216925 [04:13<00:10, 867.76 examples/s]Map:  94%|█████████▍| 203402/216925 [04:13<00:16, 830.57 examples/s]Map:  95%|█████████▌| 206138/216925 [04:14<00:13, 770.99 examples/s]Map:  92%|█████████▏| 199278/216925 [04:14<00:22, 773.49 examples/s]Map:  96%|█████████▌| 207600/216925 [04:13<00:10, 889.50 examples/s]Map:  94%|█████████▍| 203490/216925 [04:13<00:15, 844.20 examples/s]Map:  95%|█████████▌| 206233/216925 [04:14<00:13, 812.68 examples/s]Map:  92%|█████████▏| 199369/216925 [04:14<00:21, 807.40 examples/s]Map:  96%|█████████▌| 207694/216925 [04:13<00:10, 900.84 examples/s]Map:  94%|█████████▍| 203580/216925 [04:13<00:15, 854.63 examples/s]Map:  95%|█████████▌| 206325/216925 [04:14<00:12, 838.69 examples/s]Map:  92%|█████████▏| 199458/216925 [04:14<00:21, 825.93 examples/s]Map:  96%|█████████▌| 207788/216925 [04:13<00:10, 909.86 examples/s]Map:  94%|█████████▍| 203673/216925 [04:13<00:15, 874.38 examples/s]Map:  92%|█████████▏| 199554/216925 [04:15<00:20, 861.21 examples/s]Map:  95%|█████████▌| 206456/216925 [04:14<00:12, 845.80 examples/s]Map:  96%|█████████▌| 207917/216925 [04:13<00:10, 889.69 examples/s]Map:  92%|█████████▏| 199645/216925 [04:15<00:19, 871.49 examples/s]Map:  94%|█████████▍| 203804/216925 [04:13<00:15, 869.16 examples/s]Map:  95%|█████████▌| 206590/216925 [04:15<00:12, 854.59 examples/s]Map:  92%|█████████▏| 199739/216925 [04:15<00:19, 888.53 examples/s]Map:  94%|█████████▍| 203894/216925 [04:13<00:14, 873.35 examples/s]Map:  95%|█████████▌| 206686/216925 [04:15<00:11, 875.55 examples/s]Map:  96%|█████████▌| 208047/216925 [04:14<00:12, 720.90 examples/s]Map:  92%|█████████▏| 199833/216925 [04:15<00:18, 899.75 examples/s]Map:  95%|█████████▌| 206781/216925 [04:15<00:11, 889.97 examples/s]Map:  96%|█████████▌| 208147/216925 [04:14<00:11, 779.18 examples/s]Map:  92%|█████████▏| 199928/216925 [04:15<00:18, 908.72 examples/s]Map:  94%|█████████▍| 204000/216925 [04:14<00:18, 698.70 examples/s]Map:  96%|█████████▌| 208237/216925 [04:14<00:10, 805.50 examples/s]Map:  94%|█████████▍| 204091/216925 [04:14<00:17, 743.99 examples/s]Map:  95%|█████████▌| 206916/216925 [04:15<00:11, 890.98 examples/s]Map:  96%|█████████▌| 208331/216925 [04:14<00:10, 836.17 examples/s]Map:  94%|█████████▍| 204180/216925 [04:14<00:16, 776.98 examples/s]Map:  92%|█████████▏| 200046/216925 [04:15<00:23, 722.84 examples/s]Map:  96%|█████████▌| 208429/216925 [04:14<00:09, 871.33 examples/s]Map:  94%|█████████▍| 204269/216925 [04:14<00:15, 804.56 examples/s]Map:  92%|█████████▏| 200138/216925 [04:15<00:21, 766.98 examples/s]Map:  95%|█████████▌| 207047/216925 [04:15<00:13, 744.53 examples/s]Map:  96%|█████████▌| 208522/216925 [04:14<00:09, 884.11 examples/s]Map:  94%|█████████▍| 204360/216925 [04:14<00:15, 828.92 examples/s]Map:  92%|█████████▏| 200233/216925 [04:15<00:20, 808.38 examples/s]Map:  95%|█████████▌| 207135/216925 [04:15<00:12, 772.13 examples/s]Map:  94%|█████████▍| 204452/216925 [04:14<00:14, 851.88 examples/s]Map:  92%|█████████▏| 200327/216925 [04:16<00:19, 838.92 examples/s]Map:  96%|█████████▌| 208659/216925 [04:14<00:09, 892.14 examples/s]Map:  96%|█████████▌| 207227/216925 [04:15<00:12, 802.65 examples/s]Map:  94%|█████████▍| 204543/216925 [04:14<00:14, 864.99 examples/s]Map:  92%|█████████▏| 200417/216925 [04:16<00:19, 852.17 examples/s]Map:  96%|█████████▌| 207317/216925 [04:16<00:11, 824.17 examples/s]Map:  96%|█████████▋| 208796/216925 [04:14<00:09, 895.56 examples/s]Map:  96%|█████████▌| 207405/216925 [04:16<00:11, 836.56 examples/s]Map:  94%|█████████▍| 204670/216925 [04:14<00:14, 855.77 examples/s]Map:  92%|█████████▏| 200549/216925 [04:16<00:19, 860.68 examples/s]Map:  96%|█████████▋| 208887/216925 [04:14<00:08, 894.11 examples/s]Map:  96%|█████████▌| 207499/216925 [04:16<00:10, 861.15 examples/s]Map:  94%|█████████▍| 204762/216925 [04:15<00:13, 871.09 examples/s]Map:  92%|█████████▏| 200643/216925 [04:16<00:18, 877.08 examples/s]Map:  96%|█████████▋| 208978/216925 [04:15<00:08, 895.89 examples/s]Map:  96%|█████████▌| 207595/216925 [04:16<00:10, 884.67 examples/s]Map:  94%|█████████▍| 204891/216925 [04:15<00:13, 864.11 examples/s]Map:  93%|█████████▎| 200774/216925 [04:16<00:18, 873.31 examples/s]Map:  96%|█████████▌| 207691/216925 [04:16<00:10, 903.09 examples/s]Map:  96%|█████████▋| 209089/216925 [04:15<00:10, 720.43 examples/s]Map:  94%|█████████▍| 204982/216925 [04:15<00:13, 870.81 examples/s]Map:  93%|█████████▎| 200869/216925 [04:16<00:18, 889.68 examples/s]Map:  96%|█████████▋| 209184/216925 [04:15<00:10, 771.05 examples/s]Map:  96%|█████████▌| 207827/216925 [04:16<00:10, 899.70 examples/s]Map:  93%|█████████▎| 200962/216925 [04:16<00:17, 898.24 examples/s]Map:  96%|█████████▋| 209275/216925 [04:15<00:09, 803.19 examples/s]Map:  95%|█████████▍| 205089/216925 [04:15<00:16, 704.36 examples/s]Map:  96%|█████████▌| 207959/216925 [04:16<00:10, 888.52 examples/s]Map:  97%|█████████▋| 209369/216925 [04:15<00:09, 834.19 examples/s]Map:  95%|█████████▍| 205178/216925 [04:15<00:15, 742.21 examples/s]Map:  93%|█████████▎| 201093/216925 [04:16<00:21, 739.92 examples/s]Map:  97%|█████████▋| 209459/216925 [04:15<00:08, 850.11 examples/s]Map:  95%|█████████▍| 205266/216925 [04:15<00:15, 772.84 examples/s]Map:  93%|█████████▎| 201191/216925 [04:17<00:19, 791.05 examples/s]Map:  96%|█████████▌| 208089/216925 [04:16<00:12, 735.61 examples/s]Map:  97%|█████████▋| 209551/216925 [04:15<00:08, 868.78 examples/s]Map:  95%|█████████▍| 205363/216925 [04:15<00:14, 820.57 examples/s]Map:  93%|█████████▎| 201286/216925 [04:17<00:18, 826.40 examples/s]Map:  96%|█████████▌| 208184/216925 [04:17<00:11, 777.60 examples/s]Map:  97%|█████████▋| 209646/216925 [04:15<00:08, 888.57 examples/s]Map:  95%|█████████▍| 205451/216925 [04:15<00:13, 832.11 examples/s]Map:  93%|█████████▎| 201375/216925 [04:17<00:18, 840.77 examples/s]Map:  96%|█████████▌| 208277/216925 [04:17<00:10, 809.73 examples/s]Map:  95%|█████████▍| 205542/216925 [04:16<00:13, 851.51 examples/s]Map:  93%|█████████▎| 201471/216925 [04:17<00:17, 869.56 examples/s]Map:  97%|█████████▋| 209778/216925 [04:16<00:08, 883.66 examples/s]Map:  96%|█████████▌| 208368/216925 [04:17<00:10, 832.10 examples/s]Map:  93%|█████████▎| 201562/216925 [04:17<00:17, 878.91 examples/s]Map:  97%|█████████▋| 209872/216925 [04:16<00:07, 895.45 examples/s]Map:  95%|█████████▍| 205670/216925 [04:16<00:13, 849.92 examples/s]Map:  96%|█████████▌| 208458/216925 [04:17<00:10, 845.55 examples/s]Map:  95%|█████████▍| 205760/216925 [04:16<00:12, 861.47 examples/s]Map:  96%|█████████▌| 208551/216925 [04:17<00:09, 863.89 examples/s]Map:  93%|█████████▎| 201700/216925 [04:17<00:17, 888.92 examples/s]Map:  95%|█████████▍| 205848/216925 [04:16<00:12, 862.31 examples/s]Map:  97%|█████████▋| 210000/216925 [04:16<00:09, 718.23 examples/s]Map:  96%|█████████▌| 208643/216925 [04:17<00:09, 876.41 examples/s]Map:  93%|█████████▎| 201792/216925 [04:17<00:16, 895.67 examples/s]Map:  95%|█████████▍| 205941/216925 [04:16<00:12, 880.97 examples/s]Map:  97%|█████████▋| 210085/216925 [04:16<00:09, 746.03 examples/s]Map:  96%|█████████▌| 208737/216925 [04:17<00:09, 889.99 examples/s]Map:  93%|█████████▎| 201885/216925 [04:17<00:16, 904.22 examples/s]Map:  97%|█████████▋| 210182/216925 [04:16<00:08, 796.14 examples/s]Map:  93%|█████████▎| 201983/216925 [04:17<00:16, 922.76 examples/s]Map:  96%|█████████▋| 208829/216925 [04:17<00:09, 894.03 examples/s]Map:  95%|█████████▍| 206044/216925 [04:16<00:15, 703.72 examples/s]Map:  97%|█████████▋| 210275/216925 [04:16<00:08, 825.86 examples/s]Map:  96%|█████████▋| 208921/216925 [04:17<00:08, 899.41 examples/s]Map:  95%|█████████▌| 206132/216925 [04:16<00:14, 741.32 examples/s]Map:  97%|█████████▋| 210368/216925 [04:16<00:07, 850.72 examples/s]Map:  93%|█████████▎| 202088/216925 [04:18<00:20, 727.54 examples/s]Map:  95%|█████████▌| 206218/216925 [04:16<00:13, 770.54 examples/s]Map:  93%|█████████▎| 202181/216925 [04:18<00:19, 773.54 examples/s]Map:  96%|█████████▋| 209045/216925 [04:18<00:11, 714.65 examples/s]Map:  97%|█████████▋| 210500/216925 [04:16<00:07, 858.70 examples/s]Map:  95%|█████████▌| 206308/216925 [04:16<00:13, 801.85 examples/s]Map:  93%|█████████▎| 202271/216925 [04:18<00:18, 803.94 examples/s]Map:  96%|█████████▋| 209134/216925 [04:18<00:10, 751.92 examples/s]Map:  95%|█████████▌| 206396/216925 [04:17<00:12, 820.57 examples/s]Map:  97%|█████████▋| 210638/216925 [04:17<00:07, 874.46 examples/s]Map:  93%|█████████▎| 202365/216925 [04:18<00:17, 836.19 examples/s]Map:  96%|█████████▋| 209224/216925 [04:18<00:09, 787.21 examples/s]Map:  95%|█████████▌| 206488/216925 [04:17<00:12, 847.13 examples/s]Map:  97%|█████████▋| 210732/216925 [04:17<00:06, 888.66 examples/s]Map:  93%|█████████▎| 202458/216925 [04:18<00:16, 858.99 examples/s]Map:  96%|█████████▋| 209314/216925 [04:18<00:09, 816.02 examples/s]Map:  95%|█████████▌| 206577/216925 [04:17<00:12, 858.50 examples/s]Map:  97%|█████████▋| 210824/216925 [04:17<00:06, 893.20 examples/s]Map:  93%|█████████▎| 202554/216925 [04:18<00:16, 884.36 examples/s]Map:  97%|█████████▋| 209406/216925 [04:18<00:08, 841.44 examples/s]Map:  95%|█████████▌| 206670/216925 [04:17<00:11, 876.21 examples/s]Map:  97%|█████████▋| 210918/216925 [04:17<00:06, 903.93 examples/s]Map:  93%|█████████▎| 202646/216925 [04:18<00:16, 890.50 examples/s]Map:  97%|█████████▋| 209504/216925 [04:18<00:08, 878.13 examples/s]Map:  95%|█████████▌| 206803/216925 [04:17<00:11, 876.39 examples/s]Map:  93%|█████████▎| 202783/216925 [04:18<00:15, 894.08 examples/s]Map:  97%|█████████▋| 209641/216925 [04:18<00:08, 886.56 examples/s]Map:  97%|█████████▋| 211047/216925 [04:17<00:08, 726.32 examples/s]Map:  95%|█████████▌| 206895/216925 [04:17<00:11, 886.20 examples/s]Map:  94%|█████████▎| 202875/216925 [04:18<00:15, 896.69 examples/s]Map:  97%|█████████▋| 209734/216925 [04:18<00:08, 896.21 examples/s]Map:  97%|█████████▋| 211141/216925 [04:17<00:07, 771.78 examples/s]Map:  95%|█████████▌| 206987/216925 [04:17<00:11, 893.52 examples/s]Map:  94%|█████████▎| 202968/216925 [04:19<00:15, 902.76 examples/s]Map:  97%|█████████▋| 209827/216925 [04:18<00:07, 904.36 examples/s]Map:  97%|█████████▋| 211234/216925 [04:17<00:07, 808.03 examples/s]Map:  97%|█████████▋| 209965/216925 [04:19<00:07, 907.86 examples/s]Map:  97%|█████████▋| 211329/216925 [04:17<00:06, 840.83 examples/s]Map:  95%|█████████▌| 207083/216925 [04:17<00:14, 701.61 examples/s]Map:  94%|█████████▎| 203091/216925 [04:19<00:18, 733.64 examples/s]Map:  97%|█████████▋| 211419/216925 [04:18<00:06, 855.84 examples/s]Map:  96%|█████████▌| 207168/216925 [04:18<00:13, 734.53 examples/s]Map:  94%|█████████▎| 203181/216925 [04:19<00:17, 768.95 examples/s]Map:  98%|█████████▊| 211510/216925 [04:18<00:06, 865.89 examples/s]Map:  96%|█████████▌| 207258/216925 [04:18<00:12, 773.92 examples/s]Map:  97%|█████████▋| 210095/216925 [04:19<00:09, 747.76 examples/s]Map:  94%|█████████▎| 203267/216925 [04:19<00:17, 788.73 examples/s]Map:  98%|█████████▊| 211602/216925 [04:18<00:06, 877.16 examples/s]Map:  96%|█████████▌| 207352/216925 [04:18<00:11, 814.69 examples/s]Map:  97%|█████████▋| 210184/216925 [04:19<00:08, 774.93 examples/s]Map:  94%|█████████▎| 203358/216925 [04:19<00:16, 816.40 examples/s]Map:  98%|█████████▊| 211695/216925 [04:18<00:05, 891.00 examples/s]Map:  96%|█████████▌| 207445/216925 [04:18<00:11, 843.35 examples/s]Map:  97%|█████████▋| 210273/216925 [04:19<00:08, 801.63 examples/s]Map:  94%|█████████▍| 203449/216925 [04:19<00:16, 838.49 examples/s]Map:  98%|█████████▊| 211787/216925 [04:18<00:05, 896.73 examples/s]Map:  96%|█████████▌| 207537/216925 [04:18<00:10, 861.37 examples/s]Map:  97%|█████████▋| 210364/216925 [04:19<00:07, 822.41 examples/s]Map:  94%|█████████▍| 203539/216925 [04:19<00:15, 850.55 examples/s]Map:  98%|█████████▊| 211885/216925 [04:18<00:05, 916.19 examples/s]Map:  96%|█████████▌| 207632/216925 [04:18<00:10, 883.09 examples/s]Map:  97%|█████████▋| 210456/216925 [04:19<00:07, 845.94 examples/s]Map:  94%|█████████▍| 203630/216925 [04:19<00:15, 865.66 examples/s]Map:  98%|█████████▊| 211980/216925 [04:18<00:05, 920.28 examples/s]Map:  97%|█████████▋| 210552/216925 [04:19<00:07, 874.84 examples/s]Map:  94%|█████████▍| 203720/216925 [04:20<00:15, 874.37 examples/s]Map:  96%|█████████▌| 207761/216925 [04:18<00:10, 870.56 examples/s]Map:  96%|█████████▌| 207851/216925 [04:18<00:10, 874.95 examples/s]Map:  97%|█████████▋| 210687/216925 [04:20<00:07, 879.91 examples/s]Map:  94%|█████████▍| 203854/216925 [04:20<00:14, 878.61 examples/s]Map:  98%|█████████▊| 212085/216925 [04:18<00:06, 709.35 examples/s]Map:  97%|█████████▋| 210778/216925 [04:20<00:06, 885.53 examples/s]Map:  94%|█████████▍| 203949/216925 [04:20<00:14, 894.47 examples/s]Map:  96%|█████████▌| 207978/216925 [04:18<00:10, 861.10 examples/s]Map:  98%|█████████▊| 212179/216925 [04:18<00:06, 762.33 examples/s]Map:  97%|█████████▋| 210870/216925 [04:20<00:06, 891.62 examples/s]Map:  98%|█████████▊| 212272/216925 [04:19<00:05, 802.29 examples/s]Map:  97%|█████████▋| 210965/216925 [04:20<00:06, 904.29 examples/s]Map:  94%|█████████▍| 204045/216925 [04:20<00:17, 716.66 examples/s]Map:  98%|█████████▊| 212363/216925 [04:19<00:05, 827.40 examples/s]Map:  96%|█████████▌| 208085/216925 [04:19<00:12, 695.32 examples/s]Map:  94%|█████████▍| 204138/216925 [04:20<00:16, 765.01 examples/s]Map:  96%|█████████▌| 208178/216925 [04:19<00:11, 744.90 examples/s]Map:  98%|█████████▊| 212496/216925 [04:19<00:05, 848.04 examples/s]Map:  94%|█████████▍| 204230/216925 [04:20<00:15, 801.74 examples/s]Map:  97%|█████████▋| 211089/216925 [04:20<00:08, 726.04 examples/s]Map:  96%|█████████▌| 208268/216925 [04:19<00:11, 779.59 examples/s]Map:  98%|█████████▊| 212588/216925 [04:19<00:05, 863.81 examples/s]Map:  94%|█████████▍| 204326/216925 [04:20<00:14, 840.00 examples/s]Map:  97%|█████████▋| 211180/216925 [04:20<00:07, 765.41 examples/s]Map:  96%|█████████▌| 208361/216925 [04:19<00:10, 814.37 examples/s]Map:  98%|█████████▊| 212681/216925 [04:19<00:04, 879.36 examples/s]Map:  94%|█████████▍| 204418/216925 [04:20<00:14, 859.03 examples/s]Map:  97%|█████████▋| 211277/216925 [04:20<00:06, 812.73 examples/s]Map:  96%|█████████▌| 208448/216925 [04:19<00:10, 827.97 examples/s]Map:  94%|█████████▍| 204509/216925 [04:20<00:14, 870.03 examples/s]Map:  97%|█████████▋| 211366/216925 [04:20<00:06, 830.06 examples/s]Map:  98%|█████████▊| 212813/216925 [04:19<00:04, 877.15 examples/s]Map:  96%|█████████▌| 208540/216925 [04:19<00:09, 847.78 examples/s]Map:  94%|█████████▍| 204599/216925 [04:21<00:14, 874.95 examples/s]Map:  97%|█████████▋| 211456/216925 [04:20<00:06, 845.97 examples/s]Map:  98%|█████████▊| 212902/216925 [04:19<00:04, 877.26 examples/s]Map:  96%|█████████▌| 208630/216925 [04:19<00:09, 859.64 examples/s]Map:  94%|█████████▍| 204690/216925 [04:21<00:13, 881.93 examples/s]Map:  98%|█████████▊| 211550/216925 [04:21<00:06, 868.50 examples/s]Map:  98%|█████████▊| 212995/216925 [04:19<00:04, 890.52 examples/s]Map:  96%|█████████▌| 208722/216925 [04:19<00:09, 872.78 examples/s]Map:  98%|█████████▊| 211643/216925 [04:21<00:05, 881.22 examples/s]Map:  94%|█████████▍| 204821/216925 [04:21<00:13, 875.63 examples/s]Map:  96%|█████████▋| 208855/216925 [04:20<00:09, 874.78 examples/s]Map:  98%|█████████▊| 211733/216925 [04:21<00:05, 883.49 examples/s]Map:  98%|█████████▊| 213088/216925 [04:20<00:05, 702.95 examples/s]Map:  94%|█████████▍| 204915/216925 [04:21<00:13, 886.61 examples/s]Map:  96%|█████████▋| 208944/216925 [04:20<00:09, 874.67 examples/s]Map:  98%|█████████▊| 211825/216925 [04:21<00:05, 890.77 examples/s]Map:  98%|█████████▊| 213180/216925 [04:20<00:04, 753.07 examples/s]Map:  98%|█████████▊| 213272/216925 [04:20<00:04, 792.17 examples/s]Map:  98%|█████████▊| 211960/216925 [04:21<00:05, 890.59 examples/s]Map:  95%|█████████▍| 205043/216925 [04:21<00:16, 720.47 examples/s]Map:  96%|█████████▋| 209041/216925 [04:20<00:11, 693.73 examples/s]Map:  98%|█████████▊| 213365/216925 [04:20<00:04, 826.54 examples/s]Map:  95%|█████████▍| 205135/216925 [04:21<00:15, 762.30 examples/s]Map:  96%|█████████▋| 209134/216925 [04:20<00:10, 745.88 examples/s]Map:  98%|█████████▊| 213458/216925 [04:20<00:04, 850.23 examples/s]Map:  95%|█████████▍| 205229/216925 [04:21<00:14, 803.12 examples/s]Map:  96%|█████████▋| 209223/216925 [04:20<00:09, 780.77 examples/s]Map:  98%|█████████▊| 212093/216925 [04:21<00:06, 732.72 examples/s]Map:  98%|█████████▊| 213552/216925 [04:20<00:03, 873.40 examples/s]Map:  95%|█████████▍| 205321/216925 [04:21<00:13, 831.60 examples/s]Map:  96%|█████████▋| 209315/216925 [04:20<00:09, 813.83 examples/s]Map:  98%|█████████▊| 212187/216925 [04:21<00:06, 775.38 examples/s]Map:  98%|█████████▊| 213643/216925 [04:20<00:03, 881.26 examples/s]Map:  95%|█████████▍| 205412/216925 [04:22<00:13, 851.18 examples/s]Map:  97%|█████████▋| 209401/216925 [04:20<00:09, 822.18 examples/s]Map:  98%|█████████▊| 212278/216925 [04:21<00:05, 805.04 examples/s]Map:  99%|█████████▊| 213737/216925 [04:20<00:03, 895.30 examples/s]Map:  95%|█████████▍| 205504/216925 [04:22<00:13, 867.02 examples/s]Map:  97%|█████████▋| 209493/216925 [04:20<00:08, 845.68 examples/s]Map:  98%|█████████▊| 212369/216925 [04:22<00:05, 829.20 examples/s]Map:  99%|█████████▊| 213830/216925 [04:20<00:03, 904.01 examples/s]Map:  95%|█████████▍| 205594/216925 [04:22<00:12, 872.37 examples/s]Map:  97%|█████████▋| 209585/216925 [04:20<00:08, 865.23 examples/s]Map:  98%|█████████▊| 212464/216925 [04:22<00:05, 856.95 examples/s]Map:  99%|█████████▊| 213965/216925 [04:21<00:03, 898.14 examples/s]Map:  95%|█████████▍| 205689/216925 [04:22<00:12, 893.41 examples/s]Map:  97%|█████████▋| 209674/216925 [04:21<00:08, 867.01 examples/s]Map:  98%|█████████▊| 212556/216925 [04:22<00:05, 869.54 examples/s]Map:  95%|█████████▍| 205781/216925 [04:22<00:12, 896.48 examples/s]Map:  97%|█████████▋| 209762/216925 [04:21<00:08, 867.35 examples/s]Map:  98%|█████████▊| 212648/216925 [04:22<00:04, 879.32 examples/s]Map:  95%|█████████▍| 205876/216925 [04:22<00:12, 909.33 examples/s]Map:  97%|���████████▋| 209852/216925 [04:21<00:08, 872.65 examples/s]Map:  99%|█████████▊| 214085/216925 [04:21<00:03, 714.57 examples/s]Map:  98%|█████████▊| 212780/216925 [04:22<00:04, 874.74 examples/s]Map:  97%|█████████▋| 209940/216925 [04:21<00:08, 871.53 examples/s]Map:  99%|█████████▊| 214179/216925 [04:21<00:03, 761.52 examples/s]Map:  99%|█████████▉| 214268/216925 [04:21<00:03, 789.37 examples/s]Map:  98%|█████████▊| 212912/216925 [04:22<00:04, 873.66 examples/s]Map:  95%|█████████▍| 206000/216925 [04:22<00:15, 724.62 examples/s]Map:  97%|█████████▋| 210043/216925 [04:21<00:09, 691.98 examples/s]Map:  99%|█████████▉| 214360/216925 [04:21<00:03, 821.56 examples/s]Map:  95%|█████████▌| 206090/216925 [04:22<00:14, 762.16 examples/s]Map:  97%|█████████▋| 210136/216925 [04:21<00:09, 746.46 examples/s]Map:  99%|█████████▉| 214453/216925 [04:21<00:02, 848.29 examples/s]Map:  95%|█████████▌| 206176/216925 [04:23<00:13, 784.48 examples/s]Map:  98%|█████████▊| 213043/216925 [04:22<00:05, 721.37 examples/s]Map:  97%|█████████▋| 210223/216925 [04:21<00:08, 776.66 examples/s]Map:  99%|█████████▉| 214545/216925 [04:21<00:02, 864.12 examples/s]Map:  95%|█████████▌| 206263/216925 [04:23<00:13, 806.03 examples/s]Map:  98%|█████████▊| 213136/216925 [04:23<00:04, 763.56 examples/s]Map:  97%|█████████▋| 210313/216925 [04:21<00:08, 806.18 examples/s]Map:  99%|█████████▉| 214640/216925 [04:21<00:02, 884.77 examples/s]Map:  95%|█████████▌| 206357/216925 [04:23<00:12, 839.92 examples/s]Map:  98%|█████████▊| 213225/216925 [04:23<00:04, 792.09 examples/s]Map:  97%|█████████▋| 210401/216925 [04:21<00:07, 823.23 examples/s]Map:  99%|█████████▉| 214731/216925 [04:21<00:02, 889.87 examples/s]Map:  95%|█████████▌| 206449/216925 [04:23<00:12, 861.03 examples/s]Map:  98%|█████████▊| 213315/216925 [04:23<00:04, 816.69 examples/s]Map:  97%|█████████▋| 210490/216925 [04:22<00:07, 839.99 examples/s]Map:  99%|█████████▉| 214825/216925 [04:22<00:02, 901.00 examples/s]Map:  95%|█████████▌| 206540/216925 [04:23<00:11, 871.64 examples/s]Map:  98%|█████████▊| 213406/216925 [04:23<00:04, 837.07 examples/s]Map:  97%|█████████▋| 210581/216925 [04:22<00:07, 854.00 examples/s]Map:  99%|█████████▉| 214919/216925 [04:22<00:02, 906.27 examples/s]Map:  95%|█████████▌| 206631/216925 [04:23<00:11, 880.67 examples/s]Map:  98%|█████████▊| 213494/216925 [04:23<00:04, 846.29 examples/s]Map:  97%|█████████▋| 210670/216925 [04:22<00:07, 862.35 examples/s]Map:  95%|█████████▌| 206764/216925 [04:23<00:11, 880.49 examples/s]Map:  98%|█████████▊| 213624/216925 [04:23<00:03, 849.05 examples/s]Map:  99%|█████████▉| 215043/216925 [04:22<00:02, 718.13 examples/s]Map:  97%|█████████▋| 210801/216925 [04:22<00:07, 864.69 examples/s]Map:  95%|█████████▌| 206858/216925 [04:23<00:11, 891.95 examples/s]Map:  99%|█████████▊| 213715/216925 [04:23<00:03, 861.14 examples/s]Map:  99%|█████████▉| 215132/216925 [04:22<00:02, 754.34 examples/s]Map:  97%|█████████▋| 210894/216925 [04:22<00:06, 877.62 examples/s]Map:  95%|█████████▌| 206949/216925 [04:23<00:11, 892.79 examples/s]Map:  99%|█████████▊| 213803/216925 [04:23<00:03, 863.57 examples/s]Map:  99%|█████████▉| 215222/216925 [04:22<00:02, 788.84 examples/s]Map:  99%|█████████▊| 213895/216925 [04:23<00:03, 878.07 examples/s]Map:  99%|█████████▉| 215315/216925 [04:22<00:01, 821.46 examples/s]Map:  95%|█████████▌| 207043/216925 [04:24<00:13, 710.11 examples/s]Map:  97%|█████████▋| 211000/216925 [04:22<00:08, 704.77 examples/s]Map:  99%|█████████▊| 213986/216925 [04:23<00:03, 885.38 examples/s]Map:  99%|█████████▉| 215404/216925 [04:22<00:01, 837.38 examples/s]Map:  95%|█████████▌| 207140/216925 [04:24<00:12, 768.24 examples/s]Map:  97%|█████████▋| 211088/216925 [04:22<00:07, 741.07 examples/s]Map:  99%|█████████▉| 215492/216925 [04:22<00:01, 846.29 examples/s]Map:  96%|█████████▌| 207235/216925 [04:24<00:11, 812.15 examples/s]Map:  97%|█████████▋| 211177/216925 [04:22<00:07, 775.75 examples/s]Map:  99%|█████████▊| 214090/216925 [04:24<00:04, 699.78 examples/s]Map:  99%|█████████▉| 215582/216925 [04:23<00:01, 858.59 examples/s]Map:  96%|█████████▌| 207327/216925 [04:24<00:11, 839.17 examples/s]Map:  97%|█████████▋| 211267/216925 [04:23<00:07, 805.93 examples/s]Map:  99%|█████████▊| 214182/216925 [04:24<00:03, 748.85 examples/s]Map:  99%|█████████▉| 215674/216925 [04:23<00:01, 873.99 examples/s]Map:  96%|█████████▌| 207419/216925 [04:24<00:11, 860.39 examples/s]Map:  97%|█████████▋| 211359/216925 [04:23<00:06, 834.45 examples/s]Map:  99%|█████████▉| 214272/216925 [04:24<00:03, 784.61 examples/s]Map:  99%|█████████▉| 215764/216925 [04:23<00:01, 879.56 examples/s]Map:  96%|█████████▌| 207512/216925 [04:24<00:10, 874.57 examples/s]Map:  97%|█████████▋| 211451/216925 [04:23<00:06, 855.52 examples/s]Map:  99%|█████████▉| 214365/216925 [04:24<00:03, 820.03 examples/s]Map: 100%|█████████▉| 215857/216925 [04:23<00:01, 891.49 examples/s]Map:  98%|█████████▊| 211543/216925 [04:23<00:06, 870.67 examples/s]Map:  99%|█████████▉| 214454/216925 [04:24<00:02, 835.75 examples/s]Map:  96%|█████████▌| 207647/216925 [04:24<00:10, 879.45 examples/s]Map: 100%|█████████▉| 215950/216925 [04:23<00:01, 901.94 examples/s]Map:  99%|█████████▉| 214544/216925 [04:24<00:02, 849.92 examples/s]Map:  96%|█████████▌| 207737/216925 [04:24<00:10, 883.28 examples/s]Map:  98%|█████████▊| 211677/216925 [04:23<00:06, 874.46 examples/s]Map:  99%|█████████▉| 214637/216925 [04:24<00:02, 872.35 examples/s]Map:  96%|█████████▌| 207830/216925 [04:24<00:10, 895.85 examples/s]Map:  98%|█████████▊| 211769/216925 [04:23<00:05, 884.60 examples/s]Map: 100%|█████████▉| 216086/216925 [04:23<00:01, 709.46 examples/s]Map:  99%|█████████▉| 214730/216925 [04:24<00:02, 885.38 examples/s]Map:  98%|█████████▊| 211863/216925 [04:23<00:05, 895.87 examples/s]Map:  96%|█████████▌| 207959/216925 [04:25<00:10, 878.67 examples/s]Map: 100%|█████████▉| 216175/216925 [04:23<00:01, 747.77 examples/s]Map:  98%|█████████▊| 211954/216925 [04:23<00:05, 895.89 examples/s]Map:  99%|█████████▉| 214860/216925 [04:25<00:02, 874.57 examples/s]Map: 100%|█████████▉| 216261/216925 [04:23<00:00, 772.34 examples/s]Map:  99%|█████████▉| 214949/216925 [04:25<00:02, 878.05 examples/s]Map: 100%|█████████▉| 216353/216925 [04:24<00:00, 807.43 examples/s]Map:  96%|█████████▌| 208092/216925 [04:25<00:12, 730.86 examples/s]Map:  98%|█████████▊| 212083/216925 [04:24<00:06, 706.88 examples/s]Map: 100%|█████████▉| 216448/216925 [04:24<00:00, 840.82 examples/s]Map:  96%|█████████▌| 208186/216925 [04:25<00:11, 773.28 examples/s]Map:  99%|█████████▉| 215044/216925 [04:25<00:02, 699.58 examples/s]Map:  98%|█████████▊| 212172/216925 [04:24<00:06, 743.97 examples/s]Map: 100%|█████████▉| 216541/216925 [04:24<00:00, 863.57 examples/s]Map:  96%|█████████▌| 208276/216925 [04:25<00:10, 800.24 examples/s]Map:  99%|█████████▉| 215134/216925 [04:25<00:02, 743.58 examples/s]Map:  98%|█████████▊| 212261/216925 [04:24<00:06, 776.86 examples/s]Map: 100%|█████████▉| 216634/216925 [04:24<00:00, 878.56 examples/s]Map:  96%|█████████▌| 208367/216925 [04:25<00:10, 825.33 examples/s]Map:  99%|█████████▉| 215225/216925 [04:25<00:02, 781.91 examples/s]Map:  98%|█████████▊| 212352/216925 [04:24<00:05, 809.01 examples/s]Map: 100%|█████████▉| 216729/216925 [04:24<00:00, 895.08 examples/s]Map:  96%|█████████▌| 208463/216925 [04:25<00:09, 856.84 examples/s]Map:  99%|█████████▉| 215319/216925 [04:25<00:01, 820.83 examples/s]Map:  98%|█████████▊| 212441/216925 [04:24<00:05, 828.60 examples/s]Map:  96%|█████████▌| 208555/216925 [04:25<00:09, 872.13 examples/s]Map: 100%|█████████▉| 216868/216925 [04:24<00:00, 902.51 examples/s]Map:  99%|█████████▉| 215409/216925 [04:25<00:01, 840.08 examples/s]Map:  98%|█████████▊| 212533/216925 [04:24<00:05, 849.47 examples/s]Map:  96%|█████████▌| 208651/216925 [04:25<00:09, 893.02 examples/s]Map:  99%|█████████▉| 215504/216925 [04:25<00:01, 866.81 examples/s]Map:  98%|█████████▊| 212621/216925 [04:24<00:05, 857.08 examples/s]Map:  96%|█████████▌| 208746/216925 [04:26<00:09, 905.63 examples/s]Map:  99%|█████████▉| 215595/216925 [04:25<00:01, 875.29 examples/s]Map:  98%|█████████▊| 212709/216925 [04:24<00:04, 860.37 examples/s]Map:  96%|█████████▋| 208838/216925 [04:26<00:08, 907.32 examples/s]Map:  99%|█████████▉| 215686/216925 [04:26<00:01, 882.61 examples/s]Map:  96%|█████████▋| 208935/216925 [04:26<00:08, 919.07 examples/s]Map:  98%|█████████▊| 212840/216925 [04:24<00:04, 861.81 examples/s]Map:  99%|█████████▉| 215778/216925 [04:26<00:01, 892.64 examples/s]Map:  98%|█████████▊| 212931/216925 [04:25<00:04, 871.05 examples/s]Map: 100%|█████████▉| 215907/216925 [04:26<00:01, 877.82 examples/s]Map:  96%|█████████▋| 209043/216925 [04:26<00:10, 729.81 examples/s]Map: 100%|██████████| 216925/216925 [04:25<00:00, 818.17 examples/s]
+Map: 100%|█████████▉| 215997/216925 [04:26<00:01, 879.94 examples/s]Map:  96%|█████████▋| 209136/216925 [04:26<00:10, 773.94 examples/s]Map:  98%|█████████▊| 213043/216925 [04:25<00:05, 695.19 examples/s]Map:  96%|█████████▋| 209231/216925 [04:26<00:09, 816.49 examples/s]Map:  98%|█████████▊| 213131/216925 [04:25<00:05, 734.39 examples/s]Map: 100%|█████████▉| 216089/216925 [04:26<00:01, 694.04 examples/s]Map:  96%|█████████▋| 209321/216925 [04:26<00:09, 835.22 examples/s]Detected kernel version 5.4.0, which is below the recommended minimum of 5.5.0; this can cause the process to hang. It is recommended to upgrade the kernel to the minimum version or higher.
+Map:  98%|█████████▊| 213218/216925 [04:25<00:04, 765.13 examples/s]Map: 100%|█████████▉| 216181/216925 [04:26<00:00, 745.31 examples/s]Map:  97%|█████████▋| 209412/216925 [04:26<00:08, 853.96 examples/s]Map:  98%|█████████▊| 213311/216925 [04:25<00:04, 803.35 examples/s]Map: 100%|█████████▉| 216272/216925 [04:26<00:00, 783.58 examples/s]Map:  97%|█████████▋| 209505/216925 [04:26<00:08, 872.58 examples/s]Map:  98%|█████████▊| 213400/216925 [04:25<00:04, 822.04 examples/s]Map: 100%|█████████▉| 216362/216925 [04:26<00:00, 811.91 examples/s]Map:  97%|█████████▋| 209600/216925 [04:27<00:08, 890.84 examples/s]Map:  98%|█████████▊| 213490/216925 [04:25<00:04, 841.09 examples/s]Map: 100%|█████████▉| 216453/216925 [04:27<00:00, 836.85 examples/s]Map:  97%|█████████▋| 209694/216925 [04:27<00:08, 900.03 examples/s]Map:  98%|█████████▊| 213582/216925 [04:25<00:03, 860.18 examples/s]Map: 100%|█████████▉| 216548/216925 [04:27<00:00, 865.86 examples/s]Map:  97%|█████████▋| 209787/216925 [04:27<00:07, 907.78 examples/s]Map:  98%|█████████▊| 213671/216925 [04:25<00:03, 867.80 examples/s]Map:  99%|█████████▊| 213761/216925 [04:26<00:03, 873.03 examples/s]Map: 100%|█████████▉| 216681/216925 [04:27<00:00, 871.71 examples/s]Map:  97%|█████████▋| 209920/216925 [04:27<00:07, 894.61 examples/s]Map: 100%|█████████▉| 216773/216925 [04:27<00:00, 881.16 examples/s]Map:  99%|█████████▊| 213892/216925 [04:26<00:03, 867.82 examples/s]Map: 100%|█████████▉| 216863/216925 [04:27<00:00, 882.46 examples/s]Map:  99%|█████████▊| 213982/216925 [04:26<00:03, 873.47 examples/s]Map:  97%|█████████▋| 210042/216925 [04:27<00:09, 717.60 examples/s]Map:  97%|█████████▋| 210132/216925 [04:27<00:08, 755.59 examples/s]Map:  97%|█████████▋| 210221/216925 [04:27<00:08, 786.61 examples/s]Map:  99%|█████████▊| 214090/216925 [04:26<00:04, 698.32 examples/s]Map:  97%|█████████▋| 210308/216925 [04:27<00:08, 806.46 examples/s]Map:  99%|█████████▊| 214184/216925 [04:26<00:03, 752.25 examples/s]Map:  97%|█████████▋| 210397/216925 [04:28<00:07, 825.40 examples/s]Map:  99%|█████████▉| 214269/216925 [04:26<00:03, 773.27 examples/s]Map: 100%|██████████| 216925/216925 [04:28<00:00, 809.39 examples/s]
+Map:  97%|█████████▋| 210486/216925 [04:28<00:07, 840.76 examples/s]Map:  99%|█████████▉| 214357/216925 [04:26<00:03, 797.64 examples/s]Map:  97%|█████████▋| 210576/216925 [04:28<00:07, 856.51 examples/s]Map:  99%|█████████▉| 214448/216925 [04:26<00:03, 824.01 examples/s]Map:  99%|█████████▉| 214544/216925 [04:27<00:02, 856.92 examples/s]Map:  97%|█████████▋| 210707/216925 [04:28<00:07, 861.52 examples/s]Map:  99%|█████████▉| 214638/216925 [04:27<00:02, 876.97 examples/s]Map:  97%|█████████▋| 210795/216925 [04:28<00:07, 863.06 examples/s]Map:  99%|█████████▉| 214729/216925 [04:27<00:02, 882.37 examples/s]Map:  97%|█████████▋| 210885/216925 [04:28<00:06, 870.48 examples/s]Map:  99%|█████████▉| 214820/216925 [04:27<00:02, 888.54 examples/s]Map:  97%|█████████▋| 210974/216925 [04:28<00:06, 873.10 examples/s]Map:  99%|█████████▉| 214952/216925 [04:27<00:02, 883.26 examples/s]Map:  97%|█████████▋| 211092/216925 [04:28<00:08, 702.63 examples/s]Map:  97%|█████████▋| 211178/216925 [04:29<00:07, 732.71 examples/s]Map:  99%|█████████▉| 215083/216925 [04:27<00:02, 709.21 examples/s]Map:  97%|█████████▋| 211265/216925 [04:29<00:07, 764.05 examples/s]Map:  99%|█████████▉| 215171/216925 [04:27<00:02, 743.71 examples/s]Map:  97%|█████████▋| 211354/216925 [04:29<00:07, 793.42 examples/s]Map:  99%|█████████▉| 215255/216925 [04:27<00:02, 761.32 examples/s]Map:  97%|█████████▋| 211443/216925 [04:29<00:06, 816.91 examples/s]Map:  99%|█████████▉| 215338/216925 [04:28<00:02, 774.76 examples/s]Map:  98%|█████████▊| 211531/216925 [04:29<00:06, 830.68 examples/s]Map:  99%|█████████▉| 215427/216925 [04:28<00:01, 801.02 examples/s]Map:  99%|█████████▉| 215518/216925 [04:28<00:01, 828.71 examples/s]Map:  98%|█████████▊| 211656/216925 [04:29<00:06, 830.52 examples/s]Map:  99%|█████████▉| 215608/216925 [04:28<00:01, 845.85 examples/s]Map:  98%|█████████▊| 211744/216925 [04:29<00:06, 841.41 examples/s]Map:  99%|█████████▉| 215697/216925 [04:28<00:01, 855.00 examples/s]Map:  98%|█████████▊| 211834/216925 [04:29<00:05, 853.16 examples/s]Map:  99%|█████████▉| 215791/216925 [04:28<00:01, 875.41 examples/s]Map:  98%|█████████▊| 211963/216925 [04:29<00:05, 852.95 examples/s]Map: 100%|█████████▉| 215925/216925 [04:28<00:01, 878.90 examples/s]Map:  98%|█████████▊| 212085/216925 [04:30<00:06, 692.36 examples/s]Map: 100%|█████████▉| 216042/216925 [04:28<00:01, 707.19 examples/s]Map:  98%|█████████▊| 212167/216925 [04:30<00:06, 717.43 examples/s]Map: 100%|█████████▉| 216131/216925 [04:29<00:01, 746.65 examples/s]Map:  98%|█████████▊| 212253/216925 [04:30<00:06, 748.50 examples/s]Map: 100%|█████████▉| 216225/216925 [04:29<00:00, 787.17 examples/s]Map:  98%|█████████▊| 212370/216925 [04:30<00:06, 756.91 examples/s]Map: 100%|█████████▉| 216317/216925 [04:29<00:00, 817.29 examples/s]Map: 100%|█████████▉| 216403/216925 [04:29<00:00, 827.27 examples/s]Map:  98%|█████████▊| 212483/216925 [04:30<00:05, 753.51 examples/s]Map: 100%|█████████▉| 216497/216925 [04:29<00:00, 857.02 examples/s]Map:  98%|█████████▊| 212598/216925 [04:30<00:05, 754.24 examples/s]Map: 100%|█████████▉| 216626/216925 [04:29<00:00, 853.75 examples/s]Map:  98%|█████████▊| 212678/216925 [04:30<00:05, 763.01 examples/s]Map: 100%|█████████▉| 216749/216925 [04:29<00:00, 840.13 examples/s]Map:  98%|█████████▊| 212791/216925 [04:31<00:05, 757.44 examples/s]Map: 100%|█████████▉| 216873/216925 [04:29<00:00, 835.50 examples/s]Map:  98%|█████████▊| 212906/216925 [04:31<00:05, 758.03 examples/s]Map:  98%|█████████▊| 212985/216925 [04:31<00:05, 763.55 examples/s]Map:  98%|█████████▊| 213081/216925 [04:31<00:06, 626.39 examples/s]Map:  98%|█████████▊| 213165/216925 [04:31<00:05, 670.05 examples/s]Map: 100%|██████████| 216925/216925 [04:30<00:00, 802.23 examples/s]
+Map:  98%|█████████▊| 213242/216925 [04:31<00:05, 690.78 examples/s]Map:  98%|█████████▊| 213325/216925 [04:31<00:04, 721.52 examples/s]Map:  98%|█████████▊| 213439/216925 [04:32<00:04, 730.04 examples/s]Map:  98%|█████████▊| 213518/216925 [04:32<00:04, 741.33 examples/s]Map:  98%|█████████▊| 213594/216925 [04:32<00:04, 745.77 examples/s]Map:  99%|█████████▊| 213677/216925 [04:32<00:04, 764.20 examples/s]Map:  99%|█████████▊| 213756/216925 [04:32<00:04, 765.96 examples/s]Map:  99%|█████████▊| 213836/216925 [04:32<00:04, 771.27 examples/s]Map:  99%|█████████▊| 213916/216925 [04:32<00:03, 776.52 examples/s]Map:  99%|█████████▊| 214000/216925 [04:32<00:04, 592.45 examples/s]Map:  99%|█████████▊| 214075/216925 [04:32<00:04, 627.22 examples/s]Map:  99%|█████████▊| 214157/216925 [04:33<00:04, 672.94 examples/s]Map:  99%|█████████▉| 214243/216925 [04:33<00:03, 719.36 examples/s]Map:  99%|█████████▉| 214329/216925 [04:33<00:03, 753.70 examples/s]Map:  99%|█████████▉| 214412/216925 [04:33<00:03, 773.41 examples/s]Map:  99%|█████████▉| 214498/216925 [04:33<00:03, 797.10 examples/s]Map:  99%|█████████▉| 214584/216925 [04:33<00:02, 814.17 examples/s]Map:  99%|█████████▉| 214669/216925 [04:33<00:02, 821.91 examples/s]Map:  99%|█████████▉| 214757/216925 [04:33<00:02, 834.26 examples/s]Map:  99%|█████████▉| 214845/216925 [04:33<00:02, 846.69 examples/s]Map:  99%|█████████▉| 214936/216925 [04:33<00:02, 863.60 examples/s]Map:  99%|█████████▉| 215043/216925 [04:34<00:02, 687.22 examples/s]Map:  99%|█████████▉| 215136/216925 [04:34<00:02, 744.49 examples/s]Map:  99%|█████████▉| 215226/216925 [04:34<00:02, 782.79 examples/s]Map:  99%|█████████▉| 215315/216925 [04:34<00:01, 806.90 examples/s]Map:  99%|█████████▉| 215438/216925 [04:34<00:01, 809.60 examples/s]Map:  99%|█████████▉| 215528/216925 [04:34<00:01, 828.82 examples/s]Map:  99%|█████████▉| 215618/216925 [04:34<00:01, 844.08 examples/s]Map:  99%|█████████▉| 215707/216925 [04:34<00:01, 851.49 examples/s]Map:  99%|█████████▉| 215830/216925 [04:35<00:01, 832.64 examples/s]Map: 100%|█████████▉| 215955/216925 [04:35<00:01, 831.17 examples/s]Map: 100%|█████████▉| 216042/216925 [04:35<00:01, 677.12 examples/s]Map: 100%|█████████▉| 216130/216925 [04:35<00:01, 717.99 examples/s]Map: 100%|█████████▉| 216217/216925 [04:35<00:00, 753.60 examples/s]Map: 100%|█████████▉| 216303/216925 [04:35<00:00, 779.19 examples/s]Map: 100%|█████████▉| 216387/216925 [04:35<00:00, 792.51 examples/s]Map: 100%|█████████▉| 216469/216925 [04:35<00:00, 797.41 examples/s]Map: 100%|█████████▉| 216553/216925 [04:36<00:00, 809.07 examples/s]Map: 100%|█████████▉| 216639/216925 [04:36<00:00, 818.37 examples/s]Map: 100%|█████████▉| 216727/216925 [04:36<00:00, 832.62 examples/s]Map: 100%|█████████▉| 216811/216925 [04:36<00:00, 834.29 examples/s]Map: 100%|█████████▉| 216897/216925 [04:36<00:00, 836.98 examples/s]Map: 100%|██████████| 216925/216925 [04:36<00:00, 783.32 examples/s]
+/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+wandb: Currently logged in as: k-duan (nus_keyu). Use `wandb login --relogin` to force relogin
+wandb: Tracking run with wandb version 0.16.1
+wandb: Run data is saved locally in /home/aiops/duanky/lora-moe/experiments/launch_scripts/wandb/run-20231229_074425-39wnh4vr
+wandb: Run `wandb offline` to turn off syncing.
+wandb: Syncing run belle_dolphine-p12
+wandb: ⭐️ View project at https://wandb.ai/nus_keyu/lora-moe
+wandb: 🚀 View run at https://wandb.ai/nus_keyu/lora-moe/runs/39wnh4vr
+  0%|          | 0/6779 [00:00<?, ?it/s]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+  0%|          | 1/6779 [00:03<5:38:53,  3.00s/it]                                                  {'loss': 1.9867, 'learning_rate': 4.000000000000001e-06, 'epoch': 0.0}
+  0%|          | 1/6779 [00:03<5:38:53,  3.00s/it]  0%|          | 2/6779 [00:05<4:49:25,  2.56s/it]                                                  {'loss': 2.027, 'learning_rate': 8.000000000000001e-06, 'epoch': 0.0}
+  0%|          | 2/6779 [00:05<4:49:25,  2.56s/it]  0%|          | 3/6779 [00:07<4:37:29,  2.46s/it]                                                  {'loss': 2.1682, 'learning_rate': 1.2e-05, 'epoch': 0.0}
+  0%|          | 3/6779 [00:07<4:37:29,  2.46s/it]  0%|          | 4/6779 [00:09<4:28:01,  2.37s/it]                                                  {'loss': 2.14, 'learning_rate': 1.6000000000000003e-05, 'epoch': 0.0}
+  0%|          | 4/6779 [00:09<4:28:01,  2.37s/it]  0%|          | 5/6779 [00:12<4:21:36,  2.32s/it]                                                  {'loss': 2.2372, 'learning_rate': 2e-05, 'epoch': 0.0}
+  0%|          | 5/6779 [00:12<4:21:36,  2.32s/it]  0%|          | 6/6779 [00:14<4:42:13,  2.50s/it]                                                  {'loss': 2.1315, 'learning_rate': 2.4e-05, 'epoch': 0.0}
+  0%|          | 6/6779 [00:14<4:42:13,  2.50s/it]  0%|          | 7/6779 [00:17<4:49:01,  2.56s/it]                                                  {'loss': 2.1406, 'learning_rate': 2.8000000000000003e-05, 'epoch': 0.0}
+  0%|          | 7/6779 [00:17<4:49:01,  2.56s/it]  0%|          | 8/6779 [00:19<4:27:20,  2.37s/it]                                                  {'loss': 1.9937, 'learning_rate': 3.2000000000000005e-05, 'epoch': 0.0}
+  0%|          | 8/6779 [00:19<4:27:20,  2.37s/it]  0%|          | 9/6779 [00:21<4:19:01,  2.30s/it]                                                  {'loss': 2.1101, 'learning_rate': 3.6e-05, 'epoch': 0.0}
+  0%|          | 9/6779 [00:21<4:19:01,  2.30s/it]  0%|          | 10/6779 [00:23<4:17:40,  2.28s/it]                                                   {'loss': 2.1516, 'learning_rate': 4e-05, 'epoch': 0.0}
+  0%|          | 10/6779 [00:23<4:17:40,  2.28s/it]  0%|          | 11/6779 [00:26<4:22:46,  2.33s/it]                                                   {'loss': 2.1944, 'learning_rate': 4.4000000000000006e-05, 'epoch': 0.0}
+  0%|          | 11/6779 [00:26<4:22:46,  2.33s/it]  0%|          | 12/6779 [00:28<4:11:32,  2.23s/it]                                                   {'loss': 1.9559, 'learning_rate': 4.8e-05, 'epoch': 0.0}
+  0%|          | 12/6779 [00:28<4:11:32,  2.23s/it]  0%|          | 13/6779 [00:30<4:08:23,  2.20s/it]                                                   {'loss': 1.9272, 'learning_rate': 5.2000000000000004e-05, 'epoch': 0.0}
+  0%|          | 13/6779 [00:30<4:08:23,  2.20s/it]  0%|          | 14/6779 [00:32<4:14:28,  2.26s/it]                                                   {'loss': 2.1604, 'learning_rate': 5.6000000000000006e-05, 'epoch': 0.0}
+  0%|          | 14/6779 [00:32<4:14:28,  2.26s/it]  0%|          | 15/6779 [00:34<4:08:11,  2.20s/it]                                                   {'loss': 1.9064, 'learning_rate': 6e-05, 'epoch': 0.0}
+  0%|          | 15/6779 [00:34<4:08:11,  2.20s/it]  0%|          | 16/6779 [00:37<4:12:48,  2.24s/it]                                                   {'loss': 1.8924, 'learning_rate': 6.400000000000001e-05, 'epoch': 0.0}
+  0%|          | 16/6779 [00:37<4:12:48,  2.24s/it]  0%|          | 17/6779 [00:39<4:15:18,  2.27s/it]                                                   {'loss': 1.9717, 'learning_rate': 6.800000000000001e-05, 'epoch': 0.0}
+  0%|          | 17/6779 [00:39<4:15:18,  2.27s/it]  0%|          | 18/6779 [00:41<4:17:49,  2.29s/it]                                                   {'loss': 1.8316, 'learning_rate': 7.2e-05, 'epoch': 0.0}
+  0%|          | 18/6779 [00:41<4:17:49,  2.29s/it]  0%|          | 19/6779 [00:44<4:11:33,  2.23s/it]                                                   {'loss': 1.8734, 'learning_rate': 7.6e-05, 'epoch': 0.0}
+  0%|          | 19/6779 [00:44<4:11:33,  2.23s/it]  0%|          | 20/6779 [00:46<4:09:42,  2.22s/it]                                                   {'loss': 1.7933, 'learning_rate': 8e-05, 'epoch': 0.0}
+  0%|          | 20/6779 [00:46<4:09:42,  2.22s/it]  0%|          | 21/6779 [00:48<4:04:24,  2.17s/it]                                                   {'loss': 2.0163, 'learning_rate': 8.4e-05, 'epoch': 0.0}
+  0%|          | 21/6779 [00:48<4:04:24,  2.17s/it]  0%|          | 22/6779 [00:50<4:02:29,  2.15s/it]                                                   {'loss': 1.9915, 'learning_rate': 8.800000000000001e-05, 'epoch': 0.0}
+  0%|          | 22/6779 [00:50<4:02:29,  2.15s/it]  0%|          | 23/6779 [00:52<4:08:04,  2.20s/it]                                                   {'loss': 1.8712, 'learning_rate': 9.200000000000001e-05, 'epoch': 0.0}
+  0%|          | 23/6779 [00:52<4:08:04,  2.20s/it]  0%|          | 24/6779 [00:55<4:12:51,  2.25s/it]                                                   {'loss': 1.7655, 'learning_rate': 9.6e-05, 'epoch': 0.0}
+  0%|          | 24/6779 [00:55<4:12:51,  2.25s/it]  0%|          | 25/6779 [00:57<4:03:24,  2.16s/it]                                                   {'loss': 1.91, 'learning_rate': 0.0001, 'epoch': 0.0}
+  0%|          | 25/6779 [00:57<4:03:24,  2.16s/it]  0%|          | 26/6779 [00:59<4:03:09,  2.16s/it]                                                   {'loss': 2.0138, 'learning_rate': 0.00010400000000000001, 'epoch': 0.0}
+  0%|          | 26/6779 [00:59<4:03:09,  2.16s/it]  0%|          | 27/6779 [01:01<4:07:18,  2.20s/it]                                                   {'loss': 1.8081, 'learning_rate': 0.00010800000000000001, 'epoch': 0.0}
+  0%|          | 27/6779 [01:01<4:07:18,  2.20s/it]  0%|          | 28/6779 [01:04<4:17:34,  2.29s/it]                                                   {'loss': 1.8079, 'learning_rate': 0.00011200000000000001, 'epoch': 0.0}
+  0%|          | 28/6779 [01:04<4:17:34,  2.29s/it]  0%|          | 29/6779 [01:06<4:07:39,  2.20s/it]                                                   {'loss': 1.882, 'learning_rate': 0.000116, 'epoch': 0.0}
+  0%|          | 29/6779 [01:06<4:07:39,  2.20s/it]  0%|          | 30/6779 [01:08<4:11:28,  2.24s/it]                                                   {'loss': 2.0069, 'learning_rate': 0.00012, 'epoch': 0.0}
+  0%|          | 30/6779 [01:08<4:11:28,  2.24s/it]  0%|          | 31/6779 [01:10<4:14:22,  2.26s/it]                                                   {'loss': 1.8437, 'learning_rate': 0.000124, 'epoch': 0.0}
+  0%|          | 31/6779 [01:10<4:14:22,  2.26s/it]  0%|          | 32/6779 [01:12<4:06:01,  2.19s/it]                                                   {'loss': 1.852, 'learning_rate': 0.00012800000000000002, 'epoch': 0.0}
+  0%|          | 32/6779 [01:12<4:06:01,  2.19s/it]  0%|          | 33/6779 [01:14<4:03:39,  2.17s/it]                                                   {'loss': 1.7443, 'learning_rate': 0.000132, 'epoch': 0.0}
+  0%|          | 33/6779 [01:14<4:03:39,  2.17s/it]  1%|          | 34/6779 [01:17<4:10:28,  2.23s/it]                                                   {'loss': 1.7793, 'learning_rate': 0.00013600000000000003, 'epoch': 0.01}
+  1%|          | 34/6779 [01:17<4:10:28,  2.23s/it]  1%|          | 35/6779 [01:19<4:06:38,  2.19s/it]                                                   {'loss': 1.9135, 'learning_rate': 0.00014, 'epoch': 0.01}
+  1%|          | 35/6779 [01:19<4:06:38,  2.19s/it]  1%|          | 36/6779 [01:21<4:04:40,  2.18s/it]                                                   {'loss': 1.8929, 'learning_rate': 0.000144, 'epoch': 0.01}
+  1%|          | 36/6779 [01:21<4:04:40,  2.18s/it]  1%|          | 37/6779 [01:23<4:04:49,  2.18s/it]                                                   {'loss': 1.9677, 'learning_rate': 0.000148, 'epoch': 0.01}
+  1%|          | 37/6779 [01:23<4:04:49,  2.18s/it]  1%|          | 38/6779 [01:25<4:02:11,  2.16s/it]                                                   {'loss': 2.056, 'learning_rate': 0.000152, 'epoch': 0.01}
+  1%|          | 38/6779 [01:25<4:02:11,  2.16s/it]  1%|          | 39/6779 [01:27<4:02:36,  2.16s/it]                                                   {'loss': 1.7649, 'learning_rate': 0.00015600000000000002, 'epoch': 0.01}
+  1%|          | 39/6779 [01:27<4:02:36,  2.16s/it]  1%|          | 40/6779 [01:29<4:02:00,  2.15s/it]                                                   {'loss': 1.89, 'learning_rate': 0.00016, 'epoch': 0.01}
+  1%|          | 40/6779 [01:29<4:02:00,  2.15s/it]  1%|          | 41/6779 [01:32<3:59:02,  2.13s/it]                                                   {'loss': 1.8011, 'learning_rate': 0.000164, 'epoch': 0.01}
+  1%|          | 41/6779 [01:32<3:59:02,  2.13s/it]  1%|          | 42/6779 [01:34<4:04:12,  2.17s/it]                                                   {'loss': 1.9124, 'learning_rate': 0.000168, 'epoch': 0.01}
+  1%|          | 42/6779 [01:34<4:04:12,  2.17s/it]  1%|          | 43/6779 [01:36<4:01:04,  2.15s/it]                                                   {'loss': 1.9942, 'learning_rate': 0.000172, 'epoch': 0.01}
+  1%|          | 43/6779 [01:36<4:01:04,  2.15s/it]  1%|          | 44/6779 [01:38<4:01:25,  2.15s/it]                                                   {'loss': 1.971, 'learning_rate': 0.00017600000000000002, 'epoch': 0.01}
+  1%|          | 44/6779 [01:38<4:01:25,  2.15s/it]  1%|          | 45/6779 [01:40<3:55:52,  2.10s/it]                                                   {'loss': 1.915, 'learning_rate': 0.00018, 'epoch': 0.01}
+  1%|          | 45/6779 [01:40<3:55:52,  2.10s/it]  1%|          | 46/6779 [01:42<3:58:08,  2.12s/it]                                                   {'loss': 1.8294, 'learning_rate': 0.00018400000000000003, 'epoch': 0.01}
+  1%|          | 46/6779 [01:42<3:58:08,  2.12s/it]  1%|          | 47/6779 [01:45<4:05:39,  2.19s/it]                                                   {'loss': 1.8736, 'learning_rate': 0.000188, 'epoch': 0.01}
+  1%|          | 47/6779 [01:45<4:05:39,  2.19s/it]  1%|          | 48/6779 [01:47<4:10:19,  2.23s/it]                                                   {'loss': 1.7379, 'learning_rate': 0.000192, 'epoch': 0.01}
+  1%|          | 48/6779 [01:47<4:10:19,  2.23s/it]  1%|          | 49/6779 [01:50<4:23:02,  2.35s/it]                                                   {'loss': 1.9866, 'learning_rate': 0.000196, 'epoch': 0.01}
+  1%|          | 49/6779 [01:50<4:23:02,  2.35s/it]  1%|          | 50/6779 [01:52<4:12:14,  2.25s/it]                                                   {'loss': 1.9119, 'learning_rate': 0.0002, 'epoch': 0.01}
+  1%|          | 50/6779 [01:52<4:12:14,  2.25s/it]  1%|          | 51/6779 [01:54<4:07:43,  2.21s/it]                                                   {'loss': 1.9222, 'learning_rate': 0.00020400000000000003, 'epoch': 0.01}
+  1%|          | 51/6779 [01:54<4:07:43,  2.21s/it]  1%|          | 52/6779 [01:56<4:08:02,  2.21s/it]                                                   {'loss': 1.6958, 'learning_rate': 0.00020800000000000001, 'epoch': 0.01}
+  1%|          | 52/6779 [01:56<4:08:02,  2.21s/it]  1%|          | 53/6779 [01:58<4:07:36,  2.21s/it]                                                   {'loss': 2.1636, 'learning_rate': 0.00021200000000000003, 'epoch': 0.01}
+  1%|          | 53/6779 [01:58<4:07:36,  2.21s/it]  1%|          | 54/6779 [02:00<4:09:45,  2.23s/it]                                                   {'loss': 1.928, 'learning_rate': 0.00021600000000000002, 'epoch': 0.01}
+  1%|          | 54/6779 [02:00<4:09:45,  2.23s/it]  1%|          | 55/6779 [02:03<4:09:29,  2.23s/it]                                                   {'loss': 1.8135, 'learning_rate': 0.00022000000000000003, 'epoch': 0.01}
+  1%|          | 55/6779 [02:03<4:09:29,  2.23s/it]  1%|          | 56/6779 [02:05<4:12:04,  2.25s/it]                                                   {'loss': 1.857, 'learning_rate': 0.00022400000000000002, 'epoch': 0.01}
+  1%|          | 56/6779 [02:05<4:12:04,  2.25s/it]  1%|          | 57/6779 [02:07<4:07:06,  2.21s/it]                                                   {'loss': 1.948, 'learning_rate': 0.00022799999999999999, 'epoch': 0.01}
+  1%|          | 57/6779 [02:07<4:07:06,  2.21s/it]  1%|          | 58/6779 [02:09<4:03:29,  2.17s/it]                                                   {'loss': 1.7749, 'learning_rate': 0.000232, 'epoch': 0.01}
+  1%|          | 58/6779 [02:09<4:03:29,  2.17s/it]  1%|          | 59/6779 [02:12<4:13:55,  2.27s/it]                                                   {'loss': 1.8576, 'learning_rate': 0.000236, 'epoch': 0.01}
+  1%|          | 59/6779 [02:12<4:13:55,  2.27s/it]  1%|          | 60/6779 [02:14<4:07:41,  2.21s/it]                                                   {'loss': 1.8794, 'learning_rate': 0.00024, 'epoch': 0.01}
+  1%|          | 60/6779 [02:14<4:07:41,  2.21s/it]  1%|          | 61/6779 [02:16<4:09:20,  2.23s/it]                                                   {'loss': 1.6526, 'learning_rate': 0.000244, 'epoch': 0.01}
+  1%|          | 61/6779 [02:16<4:09:20,  2.23s/it]  1%|          | 62/6779 [02:18<4:05:24,  2.19s/it]                                                   {'loss': 1.7652, 'learning_rate': 0.000248, 'epoch': 0.01}
+  1%|          | 62/6779 [02:18<4:05:24,  2.19s/it]  1%|          | 63/6779 [02:20<4:07:09,  2.21s/it]                                                   {'loss': 1.7747, 'learning_rate': 0.000252, 'epoch': 0.01}
+  1%|          | 63/6779 [02:20<4:07:09,  2.21s/it]  1%|          | 64/6779 [02:22<4:06:36,  2.20s/it]                                                   {'loss': 1.872, 'learning_rate': 0.00025600000000000004, 'epoch': 0.01}
+  1%|          | 64/6779 [02:22<4:06:36,  2.20s/it]  1%|          | 65/6779 [02:25<4:07:34,  2.21s/it]                                                   {'loss': 1.957, 'learning_rate': 0.00026000000000000003, 'epoch': 0.01}
+  1%|          | 65/6779 [02:25<4:07:34,  2.21s/it]  1%|          | 66/6779 [02:27<4:02:11,  2.16s/it]                                                   {'loss': 1.9778, 'learning_rate': 0.000264, 'epoch': 0.01}
+  1%|          | 66/6779 [02:27<4:02:11,  2.16s/it]  1%|          | 67/6779 [02:29<4:00:11,  2.15s/it]                                                   {'loss': 1.6753, 'learning_rate': 0.000268, 'epoch': 0.01}
+  1%|          | 67/6779 [02:29<4:00:11,  2.15s/it]  1%|          | 68/6779 [02:31<3:57:40,  2.12s/it]                                                   {'loss': 1.7244, 'learning_rate': 0.00027200000000000005, 'epoch': 0.01}
+  1%|          | 68/6779 [02:31<3:57:40,  2.12s/it]  1%|          | 69/6779 [02:33<3:57:58,  2.13s/it]                                                   {'loss': 1.917, 'learning_rate': 0.000276, 'epoch': 0.01}
+  1%|          | 69/6779 [02:33<3:57:58,  2.13s/it]  1%|          | 70/6779 [02:35<3:56:38,  2.12s/it]                                                   {'loss': 1.9036, 'learning_rate': 0.00028, 'epoch': 0.01}
+  1%|          | 70/6779 [02:35<3:56:38,  2.12s/it]  1%|          | 71/6779 [02:37<3:57:53,  2.13s/it]                                                   {'loss': 1.7857, 'learning_rate': 0.000284, 'epoch': 0.01}
+  1%|          | 71/6779 [02:37<3:57:53,  2.13s/it]  1%|          | 72/6779 [02:40<4:09:56,  2.24s/it]                                                   {'loss': 1.6636, 'learning_rate': 0.000288, 'epoch': 0.01}
+  1%|          | 72/6779 [02:40<4:09:56,  2.24s/it]  1%|          | 73/6779 [02:42<4:07:05,  2.21s/it]                                                   {'loss': 1.8924, 'learning_rate': 0.000292, 'epoch': 0.01}
+  1%|          | 73/6779 [02:42<4:07:05,  2.21s/it]  1%|          | 74/6779 [02:44<4:12:33,  2.26s/it]                                                   {'loss': 1.92, 'learning_rate': 0.000296, 'epoch': 0.01}
+  1%|          | 74/6779 [02:44<4:12:33,  2.26s/it]  1%|          | 75/6779 [02:46<4:07:20,  2.21s/it]                                                   {'loss': 1.8787, 'learning_rate': 0.00030000000000000003, 'epoch': 0.01}
+  1%|          | 75/6779 [02:46<4:07:20,  2.21s/it]  1%|          | 76/6779 [02:49<4:05:31,  2.20s/it]                                                   {'loss': 1.774, 'learning_rate': 0.000304, 'epoch': 0.01}
+  1%|          | 76/6779 [02:49<4:05:31,  2.20s/it]  1%|          | 77/6779 [02:51<4:01:57,  2.17s/it]                                                   {'loss': 1.8049, 'learning_rate': 0.000308, 'epoch': 0.01}
+  1%|          | 77/6779 [02:51<4:01:57,  2.17s/it]  1%|          | 78/6779 [02:53<4:04:26,  2.19s/it]                                                   {'loss': 1.9016, 'learning_rate': 0.00031200000000000005, 'epoch': 0.01}
+  1%|          | 78/6779 [02:53<4:04:26,  2.19s/it]  1%|          | 79/6779 [02:56<4:20:39,  2.33s/it]                                                   {'loss': 1.7271, 'learning_rate': 0.00031600000000000004, 'epoch': 0.01}
+  1%|          | 79/6779 [02:56<4:20:39,  2.33s/it]  1%|          | 80/6779 [02:58<4:16:59,  2.30s/it]                                                   {'loss': 1.7394, 'learning_rate': 0.00032, 'epoch': 0.01}
+  1%|          | 80/6779 [02:58<4:16:59,  2.30s/it]  1%|          | 81/6779 [03:00<4:15:49,  2.29s/it]                                                   {'loss': 1.9497, 'learning_rate': 0.000324, 'epoch': 0.01}
+  1%|          | 81/6779 [03:00<4:15:49,  2.29s/it]  1%|          | 82/6779 [03:02<4:10:36,  2.25s/it]                                                   {'loss': 1.7302, 'learning_rate': 0.000328, 'epoch': 0.01}
+  1%|          | 82/6779 [03:02<4:10:36,  2.25s/it]  1%|          | 83/6779 [03:05<4:13:45,  2.27s/it]                                                   {'loss': 1.846, 'learning_rate': 0.000332, 'epoch': 0.01}
+  1%|          | 83/6779 [03:05<4:13:45,  2.27s/it]  1%|          | 84/6779 [03:07<4:11:01,  2.25s/it]                                                   {'loss': 1.7626, 'learning_rate': 0.000336, 'epoch': 0.01}
+  1%|          | 84/6779 [03:07<4:11:01,  2.25s/it]  1%|▏         | 85/6779 [03:09<4:11:47,  2.26s/it]                                                   {'loss': 1.9597, 'learning_rate': 0.00034, 'epoch': 0.01}
+  1%|▏         | 85/6779 [03:09<4:11:47,  2.26s/it]  1%|▏         | 86/6779 [03:11<4:03:19,  2.18s/it]                                                   {'loss': 1.7221, 'learning_rate': 0.000344, 'epoch': 0.01}
+  1%|▏         | 86/6779 [03:11<4:03:19,  2.18s/it]  1%|▏         | 87/6779 [03:13<4:06:49,  2.21s/it]                                                   {'loss': 1.8593, 'learning_rate': 0.000348, 'epoch': 0.01}
+  1%|▏         | 87/6779 [03:13<4:06:49,  2.21s/it]  1%|▏         | 88/6779 [03:16<4:08:51,  2.23s/it]                                                   {'loss': 1.7383, 'learning_rate': 0.00035200000000000005, 'epoch': 0.01}
+  1%|▏         | 88/6779 [03:16<4:08:51,  2.23s/it]  1%|▏         | 89/6779 [03:18<4:12:46,  2.27s/it]                                                   {'loss': 1.987, 'learning_rate': 0.00035600000000000003, 'epoch': 0.01}
+  1%|▏         | 89/6779 [03:18<4:12:46,  2.27s/it]  1%|▏         | 90/6779 [03:20<4:10:31,  2.25s/it]                                                   {'loss': 1.8862, 'learning_rate': 0.00036, 'epoch': 0.01}
+  1%|▏         | 90/6779 [03:20<4:10:31,  2.25s/it]  1%|▏         | 91/6779 [03:22<4:12:59,  2.27s/it]                                                   {'loss': 1.6766, 'learning_rate': 0.000364, 'epoch': 0.01}
+  1%|▏         | 91/6779 [03:22<4:12:59,  2.27s/it]  1%|▏         | 92/6779 [03:25<4:15:16,  2.29s/it]                                                   {'loss': 1.8663, 'learning_rate': 0.00036800000000000005, 'epoch': 0.01}
+  1%|▏         | 92/6779 [03:25<4:15:16,  2.29s/it]  1%|▏         | 93/6779 [03:27<4:16:46,  2.30s/it]                                                   {'loss': 1.9523, 'learning_rate': 0.00037200000000000004, 'epoch': 0.01}
+  1%|▏         | 93/6779 [03:27<4:16:46,  2.30s/it]  1%|▏         | 94/6779 [03:30<4:24:31,  2.37s/it]                                                   {'loss': 1.7663, 'learning_rate': 0.000376, 'epoch': 0.01}
+  1%|▏         | 94/6779 [03:30<4:24:31,  2.37s/it]  1%|▏         | 95/6779 [03:32<4:18:07,  2.32s/it]                                                   {'loss': 1.803, 'learning_rate': 0.00038, 'epoch': 0.01}
+  1%|▏         | 95/6779 [03:32<4:18:07,  2.32s/it]  1%|▏         | 96/6779 [03:34<4:13:22,  2.27s/it]                                                   {'loss': 1.87, 'learning_rate': 0.000384, 'epoch': 0.01}
+  1%|▏         | 96/6779 [03:34<4:13:22,  2.27s/it]  1%|▏         | 97/6779 [03:36<4:14:38,  2.29s/it]                                                   {'loss': 1.9695, 'learning_rate': 0.000388, 'epoch': 0.01}
+  1%|▏         | 97/6779 [03:36<4:14:38,  2.29s/it]  1%|▏         | 98/6779 [03:39<4:26:50,  2.40s/it]                                                   {'loss': 1.8292, 'learning_rate': 0.000392, 'epoch': 0.01}
+  1%|▏         | 98/6779 [03:39<4:26:50,  2.40s/it]  1%|▏         | 99/6779 [03:41<4:15:28,  2.29s/it]                                                   {'loss': 1.8299, 'learning_rate': 0.00039600000000000003, 'epoch': 0.01}
+  1%|▏         | 99/6779 [03:41<4:15:28,  2.29s/it]  1%|▏         | 100/6779 [03:43<4:12:31,  2.27s/it]                                                    {'loss': 1.8092, 'learning_rate': 0.0004, 'epoch': 0.01}
+  1%|▏         | 100/6779 [03:43<4:12:31,  2.27s/it]  1%|▏         | 101/6779 [03:45<4:05:01,  2.20s/it]                                                    {'loss': 1.912, 'learning_rate': 0.00039999997787532754, 'epoch': 0.01}
+  1%|▏         | 101/6779 [03:45<4:05:01,  2.20s/it]  2%|▏         | 102/6779 [03:48<4:12:21,  2.27s/it]                                                    {'loss': 1.7853, 'learning_rate': 0.00039999991150131497, 'epoch': 0.02}
+  2%|▏         | 102/6779 [03:48<4:12:21,  2.27s/it]  2%|▏         | 103/6779 [03:50<4:23:22,  2.37s/it]                                                    {'loss': 1.8775, 'learning_rate': 0.00039999980087797706, 'epoch': 0.02}
+  2%|▏         | 103/6779 [03:50<4:23:22,  2.37s/it]  2%|▏         | 104/6779 [03:53<4:16:49,  2.31s/it]                                                    {'loss': 1.786, 'learning_rate': 0.00039999964600533815, 'epoch': 0.02}
+  2%|▏         | 104/6779 [03:53<4:16:49,  2.31s/it]  2%|▏         | 105/6779 [03:55<4:11:19,  2.26s/it]                                                    {'loss': 1.8799, 'learning_rate': 0.0003999994468834327, 'epoch': 0.02}
+  2%|▏         | 105/6779 [03:55<4:11:19,  2.26s/it]  2%|▏         | 106/6779 [03:57<4:19:20,  2.33s/it]                                                    {'loss': 1.872, 'learning_rate': 0.00039999920351230456, 'epoch': 0.02}
+  2%|▏         | 106/6779 [03:57<4:19:20,  2.33s/it]  2%|▏         | 107/6779 [03:59<4:16:07,  2.30s/it]                                                    {'loss': 1.7817, 'learning_rate': 0.00039999891589200773, 'epoch': 0.02}
+  2%|▏         | 107/6779 [03:59<4:16:07,  2.30s/it]  2%|▏         | 108/6779 [04:02<4:15:58,  2.30s/it]                                                    {'loss': 1.9934, 'learning_rate': 0.0003999985840226058, 'epoch': 0.02}
+  2%|▏         | 108/6779 [04:02<4:15:58,  2.30s/it]  2%|▏         | 109/6779 [04:04<4:10:43,  2.26s/it]                                                    {'loss': 1.7716, 'learning_rate': 0.0003999982079041722, 'epoch': 0.02}
+  2%|▏         | 109/6779 [04:04<4:10:43,  2.26s/it]  2%|▏         | 110/6779 [04:06<4:06:41,  2.22s/it]                                                    {'loss': 1.8222, 'learning_rate': 0.0003999977875367901, 'epoch': 0.02}
+  2%|▏         | 110/6779 [04:06<4:06:41,  2.22s/it]  2%|▏         | 111/6779 [04:08<4:06:25,  2.22s/it]                                                    {'loss': 1.8632, 'learning_rate': 0.0003999973229205525, 'epoch': 0.02}
+  2%|▏         | 111/6779 [04:08<4:06:25,  2.22s/it]  2%|▏         | 112/6779 [04:10<4:00:51,  2.17s/it]                                                    {'loss': 1.7595, 'learning_rate': 0.0003999968140555623, 'epoch': 0.02}
+  2%|▏         | 112/6779 [04:10<4:00:51,  2.17s/it]  2%|▏         | 113/6779 [04:13<4:04:32,  2.20s/it]                                                    {'loss': 1.6849, 'learning_rate': 0.00039999626094193197, 'epoch': 0.02}
+  2%|▏         | 113/6779 [04:13<4:04:32,  2.20s/it]  2%|▏         | 114/6779 [04:15<4:01:04,  2.17s/it]                                                    {'loss': 1.9866, 'learning_rate': 0.0003999956635797839, 'epoch': 0.02}
+  2%|▏         | 114/6779 [04:15<4:01:04,  2.17s/it]  2%|▏         | 115/6779 [04:17<4:05:08,  2.21s/it]                                                    {'loss': 1.8149, 'learning_rate': 0.0003999950219692503, 'epoch': 0.02}
+  2%|▏         | 115/6779 [04:17<4:05:08,  2.21s/it]  2%|▏         | 116/6779 [04:19<4:00:11,  2.16s/it]                                                    {'loss': 1.8287, 'learning_rate': 0.00039999433611047315, 'epoch': 0.02}
+  2%|▏         | 116/6779 [04:19<4:00:11,  2.16s/it]  2%|▏         | 117/6779 [04:21<4:06:17,  2.22s/it]                                                    {'loss': 1.7472, 'learning_rate': 0.00039999360600360414, 'epoch': 0.02}
+  2%|▏         | 117/6779 [04:21<4:06:17,  2.22s/it]  2%|▏         | 118/6779 [04:24<4:11:35,  2.27s/it]                                                    {'loss': 1.7806, 'learning_rate': 0.0003999928316488048, 'epoch': 0.02}
+  2%|▏         | 118/6779 [04:24<4:11:35,  2.27s/it]  2%|▏         | 119/6779 [04:26<4:04:11,  2.20s/it]                                                    {'loss': 1.9447, 'learning_rate': 0.00039999201304624643, 'epoch': 0.02}
+  2%|▏         | 119/6779 [04:26<4:04:11,  2.20s/it]  2%|▏         | 120/6779 [04:28<4:09:52,  2.25s/it]                                                    {'loss': 1.8369, 'learning_rate': 0.0003999911501961102, 'epoch': 0.02}
+  2%|▏         | 120/6779 [04:28<4:09:52,  2.25s/it]  2%|▏         | 121/6779 [04:30<4:08:13,  2.24s/it]                                                    {'loss': 1.8782, 'learning_rate': 0.000399990243098587, 'epoch': 0.02}
+  2%|▏         | 121/6779 [04:30<4:08:13,  2.24s/it]  2%|▏         | 122/6779 [04:33<4:05:58,  2.22s/it]                                                    {'loss': 1.8528, 'learning_rate': 0.0003999892917538776, 'epoch': 0.02}
+  2%|▏         | 122/6779 [04:33<4:05:58,  2.22s/it]  2%|▏         | 123/6779 [04:35<4:04:01,  2.20s/it]                                                    {'loss': 1.8133, 'learning_rate': 0.0003999882961621923, 'epoch': 0.02}
+  2%|▏         | 123/6779 [04:35<4:04:01,  2.20s/it]  2%|▏         | 124/6779 [04:37<4:09:38,  2.25s/it]                                                    {'loss': 1.6053, 'learning_rate': 0.0003999872563237514, 'epoch': 0.02}
+  2%|▏         | 124/6779 [04:37<4:09:38,  2.25s/it]  2%|▏         | 125/6779 [04:39<4:08:00,  2.24s/it]                                                    {'loss': 1.7234, 'learning_rate': 0.0003999861722387852, 'epoch': 0.02}
+  2%|▏         | 125/6779 [04:39<4:08:00,  2.24s/it]  2%|▏         | 126/6779 [04:41<4:06:35,  2.22s/it]                                                    {'loss': 1.9498, 'learning_rate': 0.0003999850439075333, 'epoch': 0.02}
+  2%|▏         | 126/6779 [04:41<4:06:35,  2.22s/it]  2%|▏         | 127/6779 [04:44<4:07:07,  2.23s/it]                                                    {'loss': 1.7752, 'learning_rate': 0.00039998387133024545, 'epoch': 0.02}
+  2%|▏         | 127/6779 [04:44<4:07:07,  2.23s/it]  2%|▏         | 128/6779 [04:46<4:02:52,  2.19s/it]                                                    {'loss': 1.837, 'learning_rate': 0.000399982654507181, 'epoch': 0.02}
+  2%|▏         | 128/6779 [04:46<4:02:52,  2.19s/it]  2%|▏         | 129/6779 [04:48<4:06:39,  2.23s/it]                                                    {'loss': 1.8002, 'learning_rate': 0.0003999813934386092, 'epoch': 0.02}
+  2%|▏         | 129/6779 [04:48<4:06:39,  2.23s/it]  2%|▏         | 130/6779 [04:50<4:02:08,  2.19s/it]                                                    {'loss': 1.9792, 'learning_rate': 0.00039998008812480913, 'epoch': 0.02}
+  2%|▏         | 130/6779 [04:50<4:02:08,  2.19s/it]  2%|▏         | 131/6779 [04:53<4:09:57,  2.26s/it]                                                    {'loss': 1.7035, 'learning_rate': 0.0003999787385660695, 'epoch': 0.02}
+  2%|▏         | 131/6779 [04:53<4:09:57,  2.26s/it]  2%|▏         | 132/6779 [04:55<4:05:26,  2.22s/it]                                                    {'loss': 1.7462, 'learning_rate': 0.000399977344762689, 'epoch': 0.02}
+  2%|▏         | 132/6779 [04:55<4:05:26,  2.22s/it]  2%|▏         | 133/6779 [04:57<4:03:37,  2.20s/it]                                                    {'loss': 1.9268, 'learning_rate': 0.00039997590671497584, 'epoch': 0.02}
+  2%|▏         | 133/6779 [04:57<4:03:37,  2.20s/it]  2%|▏         | 134/6779 [04:59<3:55:43,  2.13s/it]                                                    {'loss': 1.6444, 'learning_rate': 0.0003999744244232483, 'epoch': 0.02}
+  2%|▏         | 134/6779 [04:59<3:55:43,  2.13s/it]  2%|▏         | 135/6779 [05:01<3:57:26,  2.14s/it]                                                    {'loss': 1.6023, 'learning_rate': 0.0003999728978878343, 'epoch': 0.02}
+  2%|▏         | 135/6779 [05:01<3:57:26,  2.14s/it]  2%|▏         | 136/6779 [05:03<3:53:54,  2.11s/it]                                                    {'loss': 1.9378, 'learning_rate': 0.0003999713271090716, 'epoch': 0.02}
+  2%|▏         | 136/6779 [05:03<3:53:54,  2.11s/it]  2%|▏         | 137/6779 [05:05<4:02:11,  2.19s/it]                                                    {'loss': 1.8392, 'learning_rate': 0.00039996971208730776, 'epoch': 0.02}
+  2%|▏         | 137/6779 [05:05<4:02:11,  2.19s/it]  2%|▏         | 138/6779 [05:08<4:03:33,  2.20s/it]                                                    {'loss': 1.9371, 'learning_rate': 0.0003999680528229, 'epoch': 0.02}
+  2%|▏         | 138/6779 [05:08<4:03:33,  2.20s/it]  2%|▏         | 139/6779 [05:11<4:26:10,  2.41s/it]                                                    {'loss': 1.8793, 'learning_rate': 0.00039996634931621546, 'epoch': 0.02}
+  2%|▏         | 139/6779 [05:11<4:26:10,  2.41s/it]  2%|▏         | 140/6779 [05:12<4:08:30,  2.25s/it]                                                    {'loss': 1.7281, 'learning_rate': 0.00039996460156763115, 'epoch': 0.02}
+  2%|▏         | 140/6779 [05:12<4:08:30,  2.25s/it]  2%|▏         | 141/6779 [05:15<4:12:43,  2.28s/it]                                                    {'loss': 1.8999, 'learning_rate': 0.00039996280957753356, 'epoch': 0.02}
+  2%|▏         | 141/6779 [05:15<4:12:43,  2.28s/it]  2%|▏         | 142/6779 [05:17<4:15:23,  2.31s/it]                                                    {'loss': 1.7616, 'learning_rate': 0.0003999609733463193, 'epoch': 0.02}
+  2%|▏         | 142/6779 [05:17<4:15:23,  2.31s/it]  2%|▏         | 143/6779 [05:19<4:16:33,  2.32s/it]                                                    {'loss': 1.8009, 'learning_rate': 0.0003999590928743946, 'epoch': 0.02}
+  2%|▏         | 143/6779 [05:20<4:16:33,  2.32s/it]  2%|▏         | 144/6779 [05:22<4:09:07,  2.25s/it]                                                    {'loss': 1.8248, 'learning_rate': 0.00039995716816217553, 'epoch': 0.02}
+  2%|▏         | 144/6779 [05:22<4:09:07,  2.25s/it]  2%|▏         | 145/6779 [05:24<4:03:40,  2.20s/it]                                                    {'loss': 1.8125, 'learning_rate': 0.00039995519921008784, 'epoch': 0.02}
+  2%|▏         | 145/6779 [05:24<4:03:40,  2.20s/it]  2%|▏         | 146/6779 [05:26<4:05:03,  2.22s/it]                                                    {'loss': 1.8755, 'learning_rate': 0.00039995318601856723, 'epoch': 0.02}
+  2%|▏         | 146/6779 [05:26<4:05:03,  2.22s/it]  2%|▏         | 147/6779 [05:28<3:59:31,  2.17s/it]                                                    {'loss': 1.8212, 'learning_rate': 0.00039995112858805915, 'epoch': 0.02}
+  2%|▏         | 147/6779 [05:28<3:59:31,  2.17s/it]  2%|▏         | 148/6779 [05:30<3:59:09,  2.16s/it]                                                    {'loss': 1.8124, 'learning_rate': 0.00039994902691901864, 'epoch': 0.02}
+  2%|▏         | 148/6779 [05:30<3:59:09,  2.16s/it]  2%|▏         | 149/6779 [05:32<4:03:43,  2.21s/it]                                                    {'loss': 2.0968, 'learning_rate': 0.00039994688101191087, 'epoch': 0.02}
+  2%|▏         | 149/6779 [05:32<4:03:43,  2.21s/it]  2%|▏         | 150/6779 [05:35<4:06:20,  2.23s/it]                                                    {'loss': 1.9205, 'learning_rate': 0.0003999446908672105, 'epoch': 0.02}
+  2%|▏         | 150/6779 [05:35<4:06:20,  2.23s/it]  2%|▏         | 151/6779 [05:37<4:05:19,  2.22s/it]                                                    {'loss': 1.7214, 'learning_rate': 0.0003999424564854022, 'epoch': 0.02}
+  2%|▏         | 151/6779 [05:37<4:05:19,  2.22s/it]  2%|▏         | 152/6779 [05:39<4:09:10,  2.26s/it]                                                    {'loss': 1.9117, 'learning_rate': 0.00039994017786698015, 'epoch': 0.02}
+  2%|▏         | 152/6779 [05:39<4:09:10,  2.26s/it]  2%|▏         | 153/6779 [05:41<4:03:37,  2.21s/it]                                                    {'loss': 1.8926, 'learning_rate': 0.00039993785501244865, 'epoch': 0.02}
+  2%|▏         | 153/6779 [05:41<4:03:37,  2.21s/it]  2%|▏         | 154/6779 [05:44<4:03:43,  2.21s/it]                                                    {'loss': 1.7361, 'learning_rate': 0.0003999354879223215, 'epoch': 0.02}
+  2%|▏         | 154/6779 [05:44<4:03:43,  2.21s/it]  2%|▏         | 155/6779 [05:46<3:57:04,  2.15s/it]                                                    {'loss': 1.7801, 'learning_rate': 0.00039993307659712246, 'epoch': 0.02}
+  2%|▏         | 155/6779 [05:46<3:57:04,  2.15s/it]  2%|▏         | 156/6779 [05:48<3:59:17,  2.17s/it]                                                    {'loss': 1.7732, 'learning_rate': 0.00039993062103738515, 'epoch': 0.02}
+  2%|▏         | 156/6779 [05:48<3:59:17,  2.17s/it]  2%|▏         | 157/6779 [05:50<4:03:12,  2.20s/it]                                                    {'loss': 1.8174, 'learning_rate': 0.0003999281212436526, 'epoch': 0.02}
+  2%|▏         | 157/6779 [05:50<4:03:12,  2.20s/it]  2%|▏         | 158/6779 [05:52<3:58:40,  2.16s/it]                                                    {'loss': 1.876, 'learning_rate': 0.00039992557721647815, 'epoch': 0.02}
+  2%|▏         | 158/6779 [05:52<3:58:40,  2.16s/it]  2%|▏         | 159/6779 [05:54<4:03:40,  2.21s/it]                                                    {'loss': 1.963, 'learning_rate': 0.00039992298895642444, 'epoch': 0.02}
+  2%|▏         | 159/6779 [05:54<4:03:40,  2.21s/it]  2%|▏         | 160/6779 [05:57<4:08:50,  2.26s/it]                                                    {'loss': 1.9794, 'learning_rate': 0.0003999203564640643, 'epoch': 0.02}
+  2%|▏         | 160/6779 [05:57<4:08:50,  2.26s/it]  2%|▏         | 161/6779 [05:59<4:08:05,  2.25s/it]                                                    {'loss': 1.9807, 'learning_rate': 0.00039991767973998, 'epoch': 0.02}
+  2%|▏         | 161/6779 [05:59<4:08:05,  2.25s/it]  2%|▏         | 162/6779 [06:01<4:12:07,  2.29s/it]                                                    {'loss': 1.8689, 'learning_rate': 0.0003999149587847638, 'epoch': 0.02}
+  2%|▏         | 162/6779 [06:01<4:12:07,  2.29s/it]  2%|▏         | 163/6779 [06:04<4:15:23,  2.32s/it]                                                    {'loss': 1.8105, 'learning_rate': 0.0003999121935990178, 'epoch': 0.02}
+  2%|▏         | 163/6779 [06:04<4:15:23,  2.32s/it]  2%|▏         | 164/6779 [06:06<4:10:46,  2.27s/it]                                                    {'loss': 1.8673, 'learning_rate': 0.00039990938418335364, 'epoch': 0.02}
+  2%|▏         | 164/6779 [06:06<4:10:46,  2.27s/it]  2%|▏         | 165/6779 [06:08<4:06:20,  2.23s/it]                                                    {'loss': 1.7556, 'learning_rate': 0.00039990653053839295, 'epoch': 0.02}
+  2%|▏         | 165/6779 [06:08<4:06:20,  2.23s/it]  2%|▏         | 166/6779 [06:10<3:59:59,  2.18s/it]                                                    {'loss': 1.8107, 'learning_rate': 0.00039990363266476716, 'epoch': 0.02}
+  2%|▏         | 166/6779 [06:10<3:59:59,  2.18s/it]  2%|▏         | 167/6779 [06:12<4:02:03,  2.20s/it]                                                    {'loss': 1.7058, 'learning_rate': 0.00039990069056311734, 'epoch': 0.02}
+  2%|▏         | 167/6779 [06:12<4:02:03,  2.20s/it]  2%|▏         | 168/6779 [06:15<3:58:27,  2.16s/it]                                                    {'loss': 1.8396, 'learning_rate': 0.0003998977042340944, 'epoch': 0.02}
+  2%|▏         | 168/6779 [06:15<3:58:27,  2.16s/it]  2%|▏         | 169/6779 [06:17<3:57:23,  2.15s/it]                                                    {'loss': 1.8712, 'learning_rate': 0.00039989467367835917, 'epoch': 0.02}
+  2%|▏         | 169/6779 [06:17<3:57:23,  2.15s/it]  3%|▎         | 170/6779 [06:19<4:00:40,  2.19s/it]                                                    {'loss': 1.7696, 'learning_rate': 0.00039989159889658205, 'epoch': 0.03}
+  3%|▎         | 170/6779 [06:19<4:00:40,  2.19s/it]  3%|▎         | 171/6779 [06:21<4:04:14,  2.22s/it]                                                    {'loss': 2.0015, 'learning_rate': 0.0003998884798894434, 'epoch': 0.03}
+  3%|▎         | 171/6779 [06:21<4:04:14,  2.22s/it]  3%|▎         | 172/6779 [06:23<3:56:35,  2.15s/it]                                                    {'loss': 1.7819, 'learning_rate': 0.0003998853166576332, 'epoch': 0.03}
+  3%|▎         | 172/6779 [06:23<3:56:35,  2.15s/it]  3%|▎         | 173/6779 [06:26<4:05:09,  2.23s/it]                                                    {'loss': 1.8364, 'learning_rate': 0.00039988210920185134, 'epoch': 0.03}
+  3%|▎         | 173/6779 [06:26<4:05:09,  2.23s/it]  3%|▎         | 174/6779 [06:28<4:01:44,  2.20s/it]                                                    {'loss': 1.8661, 'learning_rate': 0.0003998788575228074, 'epoch': 0.03}
+  3%|▎         | 174/6779 [06:28<4:01:44,  2.20s/it]  3%|▎         | 175/6779 [06:30<3:58:57,  2.17s/it]                                                    {'loss': 1.7113, 'learning_rate': 0.00039987556162122105, 'epoch': 0.03}
+  3%|▎         | 175/6779 [06:30<3:58:57,  2.17s/it]  3%|▎         | 176/6779 [06:32<4:01:03,  2.19s/it]                                                    {'loss': 1.8855, 'learning_rate': 0.0003998722214978212, 'epoch': 0.03}
+  3%|▎         | 176/6779 [06:32<4:01:03,  2.19s/it]  3%|▎         | 177/6779 [06:34<3:59:13,  2.17s/it]                                                    {'loss': 1.8185, 'learning_rate': 0.00039986883715334697, 'epoch': 0.03}
+  3%|▎         | 177/6779 [06:34<3:59:13,  2.17s/it]  3%|▎         | 178/6779 [06:36<3:59:18,  2.18s/it]                                                    {'loss': 1.9077, 'learning_rate': 0.00039986540858854706, 'epoch': 0.03}
+  3%|▎         | 178/6779 [06:36<3:59:18,  2.18s/it]  3%|▎         | 179/6779 [06:38<3:56:10,  2.15s/it]                                                    {'loss': 1.8081, 'learning_rate': 0.0003998619358041802, 'epoch': 0.03}
+  3%|▎         | 179/6779 [06:38<3:56:10,  2.15s/it]  3%|▎         | 180/6779 [06:41<3:56:08,  2.15s/it]                                                    {'loss': 1.8344, 'learning_rate': 0.00039985841880101454, 'epoch': 0.03}
+  3%|▎         | 180/6779 [06:41<3:56:08,  2.15s/it]  3%|▎         | 181/6779 [06:43<4:04:58,  2.23s/it]                                                    {'loss': 1.6801, 'learning_rate': 0.00039985485757982833, 'epoch': 0.03}
+  3%|▎         | 181/6779 [06:43<4:04:58,  2.23s/it]  3%|▎         | 182/6779 [06:45<4:06:51,  2.25s/it]                                                    {'loss': 1.8112, 'learning_rate': 0.0003998512521414095, 'epoch': 0.03}
+  3%|▎         | 182/6779 [06:45<4:06:51,  2.25s/it]  3%|▎         | 183/6779 [06:47<4:04:45,  2.23s/it]                                                    {'loss': 1.8427, 'learning_rate': 0.0003998476024865556, 'epoch': 0.03}
+  3%|▎         | 183/6779 [06:47<4:04:45,  2.23s/it]  3%|▎         | 184/6779 [06:50<4:00:11,  2.19s/it]                                                    {'loss': 1.8487, 'learning_rate': 0.00039984390861607424, 'epoch': 0.03}
+  3%|▎         | 184/6779 [06:50<4:00:11,  2.19s/it]  3%|▎         | 185/6779 [06:52<4:01:28,  2.20s/it]                                                    {'loss': 1.8618, 'learning_rate': 0.0003998401705307825, 'epoch': 0.03}
+  3%|▎         | 185/6779 [06:52<4:01:28,  2.20s/it]  3%|▎         | 186/6779 [06:54<3:59:08,  2.18s/it]                                                    {'loss': 1.7255, 'learning_rate': 0.0003998363882315077, 'epoch': 0.03}
+  3%|▎         | 186/6779 [06:54<3:59:08,  2.18s/it]  3%|▎         | 187/6779 [06:56<4:05:51,  2.24s/it]                                                    {'loss': 1.9246, 'learning_rate': 0.00039983256171908637, 'epoch': 0.03}
+  3%|▎         | 187/6779 [06:56<4:05:51,  2.24s/it]  3%|▎         | 188/6779 [06:58<4:03:40,  2.22s/it]                                                    {'loss': 1.777, 'learning_rate': 0.0003998286909943653, 'epoch': 0.03}
+  3%|▎         | 188/6779 [06:58<4:03:40,  2.22s/it]  3%|▎         | 189/6779 [07:01<4:01:28,  2.20s/it]                                                    {'loss': 1.888, 'learning_rate': 0.00039982477605820084, 'epoch': 0.03}
+  3%|▎         | 189/6779 [07:01<4:01:28,  2.20s/it]  3%|▎         | 190/6779 [07:03<4:07:32,  2.25s/it]                                                    {'loss': 1.8577, 'learning_rate': 0.0003998208169114591, 'epoch': 0.03}
+  3%|▎         | 190/6779 [07:03<4:07:32,  2.25s/it]  3%|▎         | 191/6779 [07:05<3:59:34,  2.18s/it]                                                    {'loss': 1.802, 'learning_rate': 0.0003998168135550161, 'epoch': 0.03}
+  3%|▎         | 191/6779 [07:05<3:59:34,  2.18s/it]  3%|▎         | 192/6779 [07:07<3:55:28,  2.14s/it]                                                    {'loss': 1.9086, 'learning_rate': 0.0003998127659897575, 'epoch': 0.03}
+  3%|▎         | 192/6779 [07:07<3:55:28,  2.14s/it]  3%|▎         | 193/6779 [07:09<3:55:23,  2.14s/it]                                                    {'loss': 1.8168, 'learning_rate': 0.00039980867421657887, 'epoch': 0.03}
+  3%|▎         | 193/6779 [07:09<3:55:23,  2.14s/it]  3%|▎         | 194/6779 [07:11<3:58:01,  2.17s/it]                                                    {'loss': 1.844, 'learning_rate': 0.0003998045382363855, 'epoch': 0.03}
+  3%|▎         | 194/6779 [07:11<3:58:01,  2.17s/it]  3%|▎         | 195/6779 [07:14<3:55:58,  2.15s/it]                                                    {'loss': 1.6602, 'learning_rate': 0.00039980035805009236, 'epoch': 0.03}
+  3%|▎         | 195/6779 [07:14<3:55:58,  2.15s/it]  3%|▎         | 196/6779 [07:16<3:53:40,  2.13s/it]                                                    {'loss': 1.82, 'learning_rate': 0.00039979613365862443, 'epoch': 0.03}
+  3%|▎         | 196/6779 [07:16<3:53:40,  2.13s/it]  3%|▎         | 197/6779 [07:18<3:57:10,  2.16s/it]                                                    {'loss': 1.5808, 'learning_rate': 0.00039979186506291635, 'epoch': 0.03}
+  3%|▎         | 197/6779 [07:18<3:57:10,  2.16s/it]  3%|▎         | 198/6779 [07:20<3:58:24,  2.17s/it]                                                    {'loss': 1.8157, 'learning_rate': 0.00039978755226391236, 'epoch': 0.03}
+  3%|▎         | 198/6779 [07:20<3:58:24,  2.17s/it]  3%|▎         | 199/6779 [07:22<3:56:25,  2.16s/it]                                                    {'loss': 1.7821, 'learning_rate': 0.0003997831952625669, 'epoch': 0.03}
+  3%|▎         | 199/6779 [07:22<3:56:25,  2.16s/it]  3%|▎         | 200/6779 [07:24<3:57:04,  2.16s/it]                                                    {'loss': 1.7804, 'learning_rate': 0.00039977879405984375, 'epoch': 0.03}
+  3%|▎         | 200/6779 [07:24<3:57:04,  2.16s/it]  3%|▎         | 201/6779 [07:27<3:57:34,  2.17s/it]                                                    {'loss': 1.9383, 'learning_rate': 0.0003997743486567167, 'epoch': 0.03}
+  3%|▎         | 201/6779 [07:27<3:57:34,  2.17s/it]  3%|▎         | 202/6779 [07:29<4:07:24,  2.26s/it]                                                    {'loss': 1.8185, 'learning_rate': 0.0003997698590541693, 'epoch': 0.03}
+  3%|▎         | 202/6779 [07:29<4:07:24,  2.26s/it]  3%|▎         | 203/6779 [07:31<4:09:39,  2.28s/it]                                                    {'loss': 1.6616, 'learning_rate': 0.0003997653252531949, 'epoch': 0.03}
+  3%|▎         | 203/6779 [07:31<4:09:39,  2.28s/it]  3%|▎         | 204/6779 [07:33<4:04:41,  2.23s/it]                                                    {'loss': 1.8869, 'learning_rate': 0.00039976074725479654, 'epoch': 0.03}
+  3%|▎         | 204/6779 [07:33<4:04:41,  2.23s/it]  3%|▎         | 205/6779 [07:36<4:01:22,  2.20s/it]                                                    {'loss': 1.7009, 'learning_rate': 0.0003997561250599871, 'epoch': 0.03}
+  3%|▎         | 205/6779 [07:36<4:01:22,  2.20s/it]  3%|▎         | 206/6779 [07:38<4:01:30,  2.20s/it]                                                    {'loss': 1.9382, 'learning_rate': 0.0003997514586697892, 'epoch': 0.03}
+  3%|▎         | 206/6779 [07:38<4:01:30,  2.20s/it]  3%|▎         | 207/6779 [07:40<4:00:23,  2.19s/it]                                                    {'loss': 1.8235, 'learning_rate': 0.00039974674808523534, 'epoch': 0.03}
+  3%|▎         | 207/6779 [07:40<4:00:23,  2.19s/it]  3%|▎         | 208/6779 [07:42<4:10:19,  2.29s/it]                                                    {'loss': 1.771, 'learning_rate': 0.0003997419933073676, 'epoch': 0.03}
+  3%|▎         | 208/6779 [07:42<4:10:19,  2.29s/it]  3%|▎         | 209/6779 [07:45<4:10:48,  2.29s/it]                                                    {'loss': 1.715, 'learning_rate': 0.0003997371943372381, 'epoch': 0.03}
+  3%|▎         | 209/6779 [07:45<4:10:48,  2.29s/it]  3%|▎         | 210/6779 [07:47<4:05:54,  2.25s/it]                                                    {'loss': 1.6947, 'learning_rate': 0.0003997323511759085, 'epoch': 0.03}
+  3%|▎         | 210/6779 [07:47<4:05:54,  2.25s/it]  3%|▎         | 211/6779 [07:49<4:10:17,  2.29s/it]                                                    {'loss': 1.7607, 'learning_rate': 0.00039972746382445037, 'epoch': 0.03}
+  3%|▎         | 211/6779 [07:49<4:10:17,  2.29s/it]  3%|▎         | 212/6779 [07:51<4:04:35,  2.23s/it]                                                    {'loss': 1.6536, 'learning_rate': 0.000399722532283945, 'epoch': 0.03}
+  3%|▎         | 212/6779 [07:51<4:04:35,  2.23s/it]  3%|▎         | 213/6779 [07:54<4:05:23,  2.24s/it]                                                    {'loss': 1.8122, 'learning_rate': 0.00039971755655548346, 'epoch': 0.03}
+  3%|▎         | 213/6779 [07:54<4:05:23,  2.24s/it]  3%|▎         | 214/6779 [07:56<4:01:12,  2.20s/it]                                                    {'loss': 1.8806, 'learning_rate': 0.0003997125366401667, 'epoch': 0.03}
+  3%|▎         | 214/6779 [07:56<4:01:12,  2.20s/it]  3%|▎         | 215/6779 [07:58<3:56:59,  2.17s/it]                                                    {'loss': 1.8513, 'learning_rate': 0.0003997074725391053, 'epoch': 0.03}
+  3%|▎         | 215/6779 [07:58<3:56:59,  2.17s/it]  3%|▎         | 216/6779 [08:00<3:55:44,  2.16s/it]                                                    {'loss': 1.8634, 'learning_rate': 0.00039970236425341957, 'epoch': 0.03}
+  3%|▎         | 216/6779 [08:00<3:55:44,  2.16s/it]  3%|▎         | 217/6779 [08:02<3:59:21,  2.19s/it]                                                    {'loss': 1.9743, 'learning_rate': 0.00039969721178423985, 'epoch': 0.03}
+  3%|▎         | 217/6779 [08:02<3:59:21,  2.19s/it]  3%|▎         | 218/6779 [08:05<4:03:32,  2.23s/it]                                                    {'loss': 1.743, 'learning_rate': 0.00039969201513270617, 'epoch': 0.03}
+  3%|▎         | 218/6779 [08:05<4:03:32,  2.23s/it]  3%|▎         | 219/6779 [08:07<4:00:53,  2.20s/it]                                                    {'loss': 1.6621, 'learning_rate': 0.00039968677429996806, 'epoch': 0.03}
+  3%|▎         | 219/6779 [08:07<4:00:53,  2.20s/it]  3%|▎         | 220/6779 [08:09<3:56:08,  2.16s/it]                                                    {'loss': 1.8157, 'learning_rate': 0.0003996814892871852, 'epoch': 0.03}
+  3%|▎         | 220/6779 [08:09<3:56:08,  2.16s/it]  3%|▎         | 221/6779 [08:11<3:58:43,  2.18s/it]                                                    {'loss': 1.8073, 'learning_rate': 0.0003996761600955268, 'epoch': 0.03}
+  3%|▎         | 221/6779 [08:11<3:58:43,  2.18s/it]  3%|▎         | 222/6779 [08:13<4:03:06,  2.22s/it]                                                    {'loss': 1.8465, 'learning_rate': 0.0003996707867261719, 'epoch': 0.03}
+  3%|▎         | 222/6779 [08:13<4:03:06,  2.22s/it]  3%|▎         | 223/6779 [08:16<4:06:17,  2.25s/it]                                                    {'loss': 1.6805, 'learning_rate': 0.0003996653691803095, 'epoch': 0.03}
+  3%|▎         | 223/6779 [08:16<4:06:17,  2.25s/it]  3%|▎         | 224/6779 [08:18<4:20:18,  2.38s/it]                                                    {'loss': 1.9336, 'learning_rate': 0.000399659907459138, 'epoch': 0.03}
+  3%|▎         | 224/6779 [08:18<4:20:18,  2.38s/it]  3%|▎         | 225/6779 [08:20<4:08:42,  2.28s/it]                                                    {'loss': 1.8547, 'learning_rate': 0.000399654401563866, 'epoch': 0.03}
+  3%|▎         | 225/6779 [08:20<4:08:42,  2.28s/it]  3%|▎         | 226/6779 [08:23<4:07:00,  2.26s/it]                                                    {'loss': 1.8622, 'learning_rate': 0.00039964885149571146, 'epoch': 0.03}
+  3%|▎         | 226/6779 [08:23<4:07:00,  2.26s/it]  3%|▎         | 227/6779 [08:25<4:01:06,  2.21s/it]                                                    {'loss': 1.7799, 'learning_rate': 0.0003996432572559025, 'epoch': 0.03}
+  3%|▎         | 227/6779 [08:25<4:01:06,  2.21s/it]  3%|▎         | 228/6779 [08:27<3:55:38,  2.16s/it]                                                    {'loss': 1.864, 'learning_rate': 0.00039963761884567663, 'epoch': 0.03}
+  3%|▎         | 228/6779 [08:27<3:55:38,  2.16s/it]  3%|▎         | 229/6779 [08:29<3:51:25,  2.12s/it]                                                    {'loss': 1.8255, 'learning_rate': 0.00039963193626628153, 'epoch': 0.03}
+  3%|▎         | 229/6779 [08:29<3:51:25,  2.12s/it]  3%|▎         | 230/6779 [08:31<3:53:13,  2.14s/it]                                                    {'loss': 1.7513, 'learning_rate': 0.0003996262095189743, 'epoch': 0.03}
+  3%|▎         | 230/6779 [08:31<3:53:13,  2.14s/it]  3%|▎         | 231/6779 [08:33<4:04:25,  2.24s/it]                                                    {'loss': 1.9518, 'learning_rate': 0.0003996204386050221, 'epoch': 0.03}
+  3%|▎         | 231/6779 [08:33<4:04:25,  2.24s/it]  3%|▎         | 232/6779 [08:36<4:01:54,  2.22s/it]                                                    {'loss': 1.8381, 'learning_rate': 0.00039961462352570157, 'epoch': 0.03}
+  3%|▎         | 232/6779 [08:36<4:01:54,  2.22s/it]  3%|▎         | 233/6779 [08:38<3:59:56,  2.20s/it]                                                    {'loss': 1.8554, 'learning_rate': 0.0003996087642822994, 'epoch': 0.03}
+  3%|▎         | 233/6779 [08:38<3:59:56,  2.20s/it]  3%|▎         | 234/6779 [08:40<4:01:37,  2.22s/it]                                                    {'loss': 1.7689, 'learning_rate': 0.0003996028608761119, 'epoch': 0.03}
+  3%|▎         | 234/6779 [08:40<4:01:37,  2.22s/it]  3%|▎         | 235/6779 [08:42<3:56:15,  2.17s/it]                                                    {'loss': 1.8383, 'learning_rate': 0.0003995969133084451, 'epoch': 0.03}
+  3%|▎         | 235/6779 [08:42<3:56:15,  2.17s/it]  3%|▎         | 236/6779 [08:44<3:57:47,  2.18s/it]                                                    {'loss': 1.7142, 'learning_rate': 0.000399590921580615, 'epoch': 0.03}
+  3%|▎         | 236/6779 [08:44<3:57:47,  2.18s/it]  3%|▎         | 237/6779 [08:47<4:13:25,  2.32s/it]                                                    {'loss': 1.8717, 'learning_rate': 0.00039958488569394714, 'epoch': 0.03}
+  3%|▎         | 237/6779 [08:47<4:13:25,  2.32s/it]  4%|▎         | 238/6779 [08:49<4:08:26,  2.28s/it]                                                    {'loss': 1.793, 'learning_rate': 0.000399578805649777, 'epoch': 0.04}
+  4%|▎         | 238/6779 [08:49<4:08:26,  2.28s/it]  4%|▎         | 239/6779 [08:51<4:07:10,  2.27s/it]                                                    {'loss': 1.8575, 'learning_rate': 0.0003995726814494498, 'epoch': 0.04}
+  4%|▎         | 239/6779 [08:51<4:07:10,  2.27s/it]  4%|▎         | 240/6779 [08:54<4:07:30,  2.27s/it]                                                    {'loss': 1.9538, 'learning_rate': 0.00039956651309432047, 'epoch': 0.04}
+  4%|▎         | 240/6779 [08:54<4:07:30,  2.27s/it]  4%|▎         | 241/6779 [08:56<4:08:45,  2.28s/it]                                                    {'loss': 2.0565, 'learning_rate': 0.0003995603005857538, 'epoch': 0.04}
+  4%|▎         | 241/6779 [08:56<4:08:45,  2.28s/it]  4%|▎         | 242/6779 [08:58<4:04:51,  2.25s/it]                                                    {'loss': 1.854, 'learning_rate': 0.0003995540439251241, 'epoch': 0.04}
+  4%|▎         | 242/6779 [08:58<4:04:51,  2.25s/it]  4%|▎         | 243/6779 [09:01<4:10:06,  2.30s/it]                                                    {'loss': 1.8063, 'learning_rate': 0.00039954774311381575, 'epoch': 0.04}
+  4%|▎         | 243/6779 [09:01<4:10:06,  2.30s/it]  4%|▎         | 244/6779 [09:03<4:05:27,  2.25s/it]                                                    {'loss': 1.8717, 'learning_rate': 0.00039954139815322285, 'epoch': 0.04}
+  4%|▎         | 244/6779 [09:03<4:05:27,  2.25s/it]  4%|▎         | 245/6779 [09:05<4:00:43,  2.21s/it]                                                    {'loss': 1.75, 'learning_rate': 0.0003995350090447491, 'epoch': 0.04}
+  4%|▎         | 245/6779 [09:05<4:00:43,  2.21s/it]  4%|▎         | 246/6779 [09:07<3:55:40,  2.16s/it]                                                    {'loss': 1.6838, 'learning_rate': 0.00039952857578980815, 'epoch': 0.04}
+  4%|▎         | 246/6779 [09:07<3:55:40,  2.16s/it]  4%|▎         | 247/6779 [09:09<3:54:27,  2.15s/it]                                                    {'loss': 1.7988, 'learning_rate': 0.0003995220983898233, 'epoch': 0.04}
+  4%|▎         | 247/6779 [09:09<3:54:27,  2.15s/it]  4%|▎         | 248/6779 [09:11<3:59:08,  2.20s/it]                                                    {'loss': 1.6739, 'learning_rate': 0.0003995155768462276, 'epoch': 0.04}
+  4%|▎         | 248/6779 [09:11<3:59:08,  2.20s/it]  4%|▎         | 249/6779 [09:13<3:56:29,  2.17s/it]                                                    {'loss': 1.6904, 'learning_rate': 0.000399509011160464, 'epoch': 0.04}
+  4%|▎         | 249/6779 [09:13<3:56:29,  2.17s/it]  4%|▎         | 250/6779 [09:16<3:55:16,  2.16s/it]                                                    {'loss': 1.6439, 'learning_rate': 0.0003995024013339851, 'epoch': 0.04}
+  4%|▎         | 250/6779 [09:16<3:55:16,  2.16s/it]  4%|▎         | 251/6779 [09:18<3:54:01,  2.15s/it]                                                    {'loss': 1.869, 'learning_rate': 0.0003994957473682533, 'epoch': 0.04}
+  4%|▎         | 251/6779 [09:18<3:54:01,  2.15s/it]  4%|▎         | 252/6779 [09:20<3:53:45,  2.15s/it]                                                    {'loss': 1.8591, 'learning_rate': 0.00039948904926474083, 'epoch': 0.04}
+  4%|▎         | 252/6779 [09:20<3:53:45,  2.15s/it]  4%|▎         | 253/6779 [09:22<3:52:00,  2.13s/it]                                                    {'loss': 1.9372, 'learning_rate': 0.00039948230702492945, 'epoch': 0.04}
+  4%|▎         | 253/6779 [09:22<3:52:00,  2.13s/it]  4%|▎         | 254/6779 [09:24<3:49:32,  2.11s/it]                                                    {'loss': 1.8036, 'learning_rate': 0.0003994755206503111, 'epoch': 0.04}
+  4%|▎         | 254/6779 [09:24<3:49:32,  2.11s/it]  4%|▍         | 255/6779 [09:26<3:55:08,  2.16s/it]                                                    {'loss': 1.761, 'learning_rate': 0.0003994686901423871, 'epoch': 0.04}
+  4%|▍         | 255/6779 [09:26<3:55:08,  2.16s/it]  4%|▍         | 256/6779 [09:28<3:58:06,  2.19s/it]                                                    {'loss': 1.9229, 'learning_rate': 0.0003994618155026687, 'epoch': 0.04}
+  4%|▍         | 256/6779 [09:28<3:58:06,  2.19s/it]  4%|▍         | 257/6779 [09:31<4:06:41,  2.27s/it]                                                    {'loss': 1.8738, 'learning_rate': 0.0003994548967326768, 'epoch': 0.04}
+  4%|▍         | 257/6779 [09:31<4:06:41,  2.27s/it]  4%|▍         | 258/6779 [09:33<4:01:54,  2.23s/it]                                                    {'loss': 1.8045, 'learning_rate': 0.00039944793383394234, 'epoch': 0.04}
+  4%|▍         | 258/6779 [09:33<4:01:54,  2.23s/it]  4%|▍         | 259/6779 [09:36<4:09:59,  2.30s/it]                                                    {'loss': 1.8773, 'learning_rate': 0.0003994409268080057, 'epoch': 0.04}
+  4%|▍         | 259/6779 [09:36<4:09:59,  2.30s/it]  4%|▍         | 260/6779 [09:38<4:06:46,  2.27s/it]                                                    {'loss': 1.8563, 'learning_rate': 0.00039943387565641726, 'epoch': 0.04}
+  4%|▍         | 260/6779 [09:38<4:06:46,  2.27s/it]  4%|▍         | 261/6779 [09:40<4:01:30,  2.22s/it]                                                    {'loss': 1.827, 'learning_rate': 0.000399426780380737, 'epoch': 0.04}
+  4%|▍         | 261/6779 [09:40<4:01:30,  2.22s/it]  4%|▍         | 262/6779 [09:42<3:57:50,  2.19s/it]                                                    {'loss': 1.7594, 'learning_rate': 0.00039941964098253466, 'epoch': 0.04}
+  4%|▍         | 262/6779 [09:42<3:57:50,  2.19s/it]  4%|▍         | 263/6779 [09:44<3:56:36,  2.18s/it]                                                    {'loss': 1.8092, 'learning_rate': 0.00039941245746339, 'epoch': 0.04}
+  4%|▍         | 263/6779 [09:44<3:56:36,  2.18s/it]  4%|▍         | 264/6779 [09:46<3:51:13,  2.13s/it]                                                    {'loss': 1.8061, 'learning_rate': 0.00039940522982489217, 'epoch': 0.04}
+  4%|▍         | 264/6779 [09:46<3:51:13,  2.13s/it]  4%|▍         | 265/6779 [09:49<4:00:17,  2.21s/it]                                                    {'loss': 1.8575, 'learning_rate': 0.00039939795806864033, 'epoch': 0.04}
+  4%|▍         | 265/6779 [09:49<4:00:17,  2.21s/it]  4%|▍         | 266/6779 [09:51<3:59:31,  2.21s/it]                                                    {'loss': 1.859, 'learning_rate': 0.0003993906421962433, 'epoch': 0.04}
+  4%|▍         | 266/6779 [09:51<3:59:31,  2.21s/it]  4%|▍         | 267/6779 [09:53<4:00:24,  2.22s/it]                                                    {'loss': 1.8997, 'learning_rate': 0.0003993832822093198, 'epoch': 0.04}
+  4%|▍         | 267/6779 [09:53<4:00:24,  2.22s/it]  4%|▍         | 268/6779 [09:55<4:06:54,  2.28s/it]                                                    {'loss': 1.768, 'learning_rate': 0.0003993758781094981, 'epoch': 0.04}
+  4%|▍         | 268/6779 [09:55<4:06:54,  2.28s/it]  4%|▍         | 269/6779 [09:57<4:01:54,  2.23s/it]                                                    {'loss': 1.8899, 'learning_rate': 0.0003993684298984163, 'epoch': 0.04}
+  4%|▍         | 269/6779 [09:57<4:01:54,  2.23s/it]  4%|▍         | 270/6779 [10:00<3:56:20,  2.18s/it]                                                    {'loss': 1.8604, 'learning_rate': 0.0003993609375777224, 'epoch': 0.04}
+  4%|▍         | 270/6779 [10:00<3:56:20,  2.18s/it]  4%|▍         | 271/6779 [10:02<3:57:50,  2.19s/it]                                                    {'loss': 1.8243, 'learning_rate': 0.00039935340114907394, 'epoch': 0.04}
+  4%|▍         | 271/6779 [10:02<3:57:50,  2.19s/it]  4%|▍         | 272/6779 [10:04<4:03:58,  2.25s/it]                                                    {'loss': 1.8511, 'learning_rate': 0.00039934582061413844, 'epoch': 0.04}
+  4%|▍         | 272/6779 [10:04<4:03:58,  2.25s/it]  4%|▍         | 273/6779 [10:06<4:02:02,  2.23s/it]                                                    {'loss': 1.7176, 'learning_rate': 0.00039933819597459306, 'epoch': 0.04}
+  4%|▍         | 273/6779 [10:06<4:02:02,  2.23s/it]  4%|▍         | 274/6779 [10:09<4:05:30,  2.26s/it]                                                    {'loss': 1.9557, 'learning_rate': 0.00039933052723212464, 'epoch': 0.04}
+  4%|▍         | 274/6779 [10:09<4:05:30,  2.26s/it]  4%|▍         | 275/6779 [10:11<4:01:31,  2.23s/it]                                                    {'loss': 1.8519, 'learning_rate': 0.00039932281438843, 'epoch': 0.04}
+  4%|▍         | 275/6779 [10:11<4:01:31,  2.23s/it]  4%|▍         | 276/6779 [10:13<3:56:25,  2.18s/it]                                                    {'loss': 1.7136, 'learning_rate': 0.0003993150574452154, 'epoch': 0.04}
+  4%|▍         | 276/6779 [10:13<3:56:25,  2.18s/it]  4%|▍         | 277/6779 [10:15<3:49:25,  2.12s/it]                                                    {'loss': 1.9016, 'learning_rate': 0.0003993072564041971, 'epoch': 0.04}
+  4%|▍         | 277/6779 [10:15<3:49:25,  2.12s/it]  4%|▍         | 278/6779 [10:17<3:50:49,  2.13s/it]                                                    {'loss': 1.8027, 'learning_rate': 0.0003992994112671011, 'epoch': 0.04}
+  4%|▍         | 278/6779 [10:17<3:50:49,  2.13s/it]  4%|▍         | 279/6779 [10:19<3:48:04,  2.11s/it]                                                    {'loss': 1.76, 'learning_rate': 0.00039929152203566315, 'epoch': 0.04}
+  4%|▍         | 279/6779 [10:19<3:48:04,  2.11s/it]  4%|▍         | 280/6779 [10:21<3:56:27,  2.18s/it]                                                    {'loss': 1.68, 'learning_rate': 0.0003992835887116286, 'epoch': 0.04}
+  4%|▍         | 280/6779 [10:21<3:56:27,  2.18s/it]  4%|▍         | 281/6779 [10:24<3:56:07,  2.18s/it]                                                    {'loss': 1.8404, 'learning_rate': 0.0003992756112967528, 'epoch': 0.04}
+  4%|▍         | 281/6779 [10:24<3:56:07,  2.18s/it]  4%|▍         | 282/6779 [10:26<3:58:50,  2.21s/it]                                                    {'loss': 1.8483, 'learning_rate': 0.0003992675897928006, 'epoch': 0.04}
+  4%|▍         | 282/6779 [10:26<3:58:50,  2.21s/it]  4%|▍         | 283/6779 [10:28<3:54:42,  2.17s/it]                                                    {'loss': 1.7165, 'learning_rate': 0.00039925952420154687, 'epoch': 0.04}
+  4%|▍         | 283/6779 [10:28<3:54:42,  2.17s/it]  4%|▍         | 284/6779 [10:30<3:58:42,  2.21s/it]                                                    {'loss': 1.6934, 'learning_rate': 0.000399251414524776, 'epoch': 0.04}
+  4%|▍         | 284/6779 [10:30<3:58:42,  2.21s/it]  4%|▍         | 285/6779 [10:32<3:56:50,  2.19s/it]                                                    {'loss': 1.8476, 'learning_rate': 0.00039924326076428216, 'epoch': 0.04}
+  4%|▍         | 285/6779 [10:32<3:56:50,  2.19s/it]  4%|▍         | 286/6779 [10:35<3:57:45,  2.20s/it]                                                    {'loss': 1.7379, 'learning_rate': 0.0003992350629218695, 'epoch': 0.04}
+  4%|▍         | 286/6779 [10:35<3:57:45,  2.20s/it]  4%|▍         | 287/6779 [10:37<4:06:21,  2.28s/it]                                                    {'loss': 1.8374, 'learning_rate': 0.0003992268209993517, 'epoch': 0.04}
+  4%|▍         | 287/6779 [10:37<4:06:21,  2.28s/it]  4%|▍         | 288/6779 [10:39<4:02:32,  2.24s/it]                                                    {'loss': 1.8406, 'learning_rate': 0.00039921853499855225, 'epoch': 0.04}
+  4%|▍         | 288/6779 [10:39<4:02:32,  2.24s/it]  4%|▍         | 289/6779 [10:41<4:02:04,  2.24s/it]                                                    {'loss': 1.8564, 'learning_rate': 0.0003992102049213044, 'epoch': 0.04}
+  4%|▍         | 289/6779 [10:41<4:02:04,  2.24s/it]  4%|▍         | 290/6779 [10:44<3:58:32,  2.21s/it]                                                    {'loss': 1.8254, 'learning_rate': 0.0003992018307694512, 'epoch': 0.04}
+  4%|▍         | 290/6779 [10:44<3:58:32,  2.21s/it]  4%|▍         | 291/6779 [10:46<4:01:33,  2.23s/it]                                                    {'loss': 1.855, 'learning_rate': 0.00039919341254484534, 'epoch': 0.04}
+  4%|▍         | 291/6779 [10:46<4:01:33,  2.23s/it]  4%|▍         | 292/6779 [10:48<4:06:36,  2.28s/it]                                                    {'loss': 1.8129, 'learning_rate': 0.0003991849502493493, 'epoch': 0.04}
+  4%|▍         | 292/6779 [10:48<4:06:36,  2.28s/it]  4%|▍         | 293/6779 [10:50<3:58:41,  2.21s/it]                                                    {'loss': 1.8434, 'learning_rate': 0.0003991764438848354, 'epoch': 0.04}
+  4%|▍         | 293/6779 [10:50<3:58:41,  2.21s/it]  4%|▍         | 294/6779 [10:52<3:50:05,  2.13s/it]                                                    {'loss': 1.6632, 'learning_rate': 0.00039916789345318564, 'epoch': 0.04}
+  4%|▍         | 294/6779 [10:52<3:50:05,  2.13s/it]  4%|▍         | 295/6779 [10:54<3:44:14,  2.08s/it]                                                    {'loss': 1.7855, 'learning_rate': 0.0003991592989562918, 'epoch': 0.04}
+  4%|▍         | 295/6779 [10:54<3:44:14,  2.08s/it]  4%|▍         | 296/6779 [10:56<3:42:41,  2.06s/it]                                                    {'loss': 1.8238, 'learning_rate': 0.00039915066039605525, 'epoch': 0.04}
+  4%|▍         | 296/6779 [10:56<3:42:41,  2.06s/it]  4%|▍         | 297/6779 [10:58<3:46:27,  2.10s/it]                                                    {'loss': 1.9404, 'learning_rate': 0.0003991419777743874, 'epoch': 0.04}
+  4%|▍         | 297/6779 [10:58<3:46:27,  2.10s/it]  4%|▍         | 298/6779 [11:01<3:52:28,  2.15s/it]                                                    {'loss': 1.8163, 'learning_rate': 0.00039913325109320924, 'epoch': 0.04}
+  4%|▍         | 298/6779 [11:01<3:52:28,  2.15s/it]  4%|▍         | 299/6779 [11:03<4:00:11,  2.22s/it]                                                    {'loss': 1.8147, 'learning_rate': 0.00039912448035445136, 'epoch': 0.04}
+  4%|▍         | 299/6779 [11:03<4:00:11,  2.22s/it]  4%|▍         | 300/6779 [11:05<4:03:22,  2.25s/it]                                                    {'loss': 1.674, 'learning_rate': 0.00039911566556005446, 'epoch': 0.04}
+  4%|▍         | 300/6779 [11:05<4:03:22,  2.25s/it]  4%|▍         | 301/6779 [11:08<3:59:30,  2.22s/it]                                                    {'loss': 1.6375, 'learning_rate': 0.00039910680671196864, 'epoch': 0.04}
+  4%|▍         | 301/6779 [11:08<3:59:30,  2.22s/it]  4%|▍         | 302/6779 [11:10<4:01:06,  2.23s/it]                                                    {'loss': 1.8138, 'learning_rate': 0.0003990979038121539, 'epoch': 0.04}
+  4%|▍         | 302/6779 [11:10<4:01:06,  2.23s/it]  4%|▍         | 303/6779 [11:12<4:02:41,  2.25s/it]                                                    {'loss': 1.8332, 'learning_rate': 0.00039908895686258014, 'epoch': 0.04}
+  4%|▍         | 303/6779 [11:12<4:02:41,  2.25s/it]  4%|▍         | 304/6779 [11:14<3:57:54,  2.20s/it]                                                    {'loss': 1.864, 'learning_rate': 0.00039907996586522666, 'epoch': 0.04}
+  4%|▍         | 304/6779 [11:14<3:57:54,  2.20s/it]  4%|▍         | 305/6779 [11:17<4:01:28,  2.24s/it]                                                    {'loss': 1.8037, 'learning_rate': 0.0003990709308220828, 'epoch': 0.04}
+  4%|▍         | 305/6779 [11:17<4:01:28,  2.24s/it]  5%|▍         | 306/6779 [11:19<4:02:21,  2.25s/it]                                                    {'loss': 1.7727, 'learning_rate': 0.00039906185173514745, 'epoch': 0.05}
+  5%|▍         | 306/6779 [11:19<4:02:21,  2.25s/it]  5%|▍         | 307/6779 [11:21<3:58:40,  2.21s/it]                                                    {'loss': 1.8783, 'learning_rate': 0.00039905272860642937, 'epoch': 0.05}
+  5%|▍         | 307/6779 [11:21<3:58:40,  2.21s/it]  5%|▍         | 308/6779 [11:23<4:03:49,  2.26s/it]                                                    {'loss': 1.866, 'learning_rate': 0.00039904356143794694, 'epoch': 0.05}
+  5%|▍         | 308/6779 [11:23<4:03:49,  2.26s/it]  5%|▍         | 309/6779 [11:25<3:56:23,  2.19s/it]                                                    {'loss': 1.6836, 'learning_rate': 0.0003990343502317285, 'epoch': 0.05}
+  5%|▍         | 309/6779 [11:25<3:56:23,  2.19s/it]  5%|▍         | 310/6779 [11:28<3:59:55,  2.23s/it]                                                    {'loss': 1.8226, 'learning_rate': 0.000399025094989812, 'epoch': 0.05}
+  5%|▍         | 310/6779 [11:28<3:59:55,  2.23s/it]  5%|▍         | 311/6779 [11:30<3:57:28,  2.20s/it]                                                    {'loss': 1.7026, 'learning_rate': 0.000399015795714245, 'epoch': 0.05}
+  5%|▍         | 311/6779 [11:30<3:57:28,  2.20s/it]  5%|▍         | 312/6779 [11:32<3:52:18,  2.16s/it]                                                    {'loss': 1.9241, 'learning_rate': 0.00039900645240708503, 'epoch': 0.05}
+  5%|▍         | 312/6779 [11:32<3:52:18,  2.16s/it]  5%|▍         | 313/6779 [11:34<3:54:59,  2.18s/it]                                                    {'loss': 1.7931, 'learning_rate': 0.00039899706507039927, 'epoch': 0.05}
+  5%|▍         | 313/6779 [11:34<3:54:59,  2.18s/it]  5%|▍         | 314/6779 [11:36<3:54:44,  2.18s/it]                                                    {'loss': 1.7745, 'learning_rate': 0.00039898763370626455, 'epoch': 0.05}
+  5%|▍         | 314/6779 [11:36<3:54:44,  2.18s/it]  5%|▍         | 315/6779 [11:39<4:00:57,  2.24s/it]                                                    {'loss': 1.7543, 'learning_rate': 0.00039897815831676766, 'epoch': 0.05}
+  5%|▍         | 315/6779 [11:39<4:00:57,  2.24s/it]  5%|▍         | 316/6779 [11:41<4:04:02,  2.27s/it]                                                    {'loss': 1.8163, 'learning_rate': 0.00039896863890400493, 'epoch': 0.05}
+  5%|▍         | 316/6779 [11:41<4:04:02,  2.27s/it]  5%|▍         | 317/6779 [11:43<3:57:58,  2.21s/it]                                                    {'loss': 1.8038, 'learning_rate': 0.00039895907547008244, 'epoch': 0.05}
+  5%|▍         | 317/6779 [11:43<3:57:58,  2.21s/it]  5%|▍         | 318/6779 [11:45<3:54:08,  2.17s/it]                                                    {'loss': 1.7993, 'learning_rate': 0.00039894946801711617, 'epoch': 0.05}
+  5%|▍         | 318/6779 [11:45<3:54:08,  2.17s/it]  5%|▍         | 319/6779 [11:48<4:06:34,  2.29s/it]                                                    {'loss': 1.9959, 'learning_rate': 0.00039893981654723164, 'epoch': 0.05}
+  5%|▍         | 319/6779 [11:48<4:06:34,  2.29s/it]  5%|▍         | 320/6779 [11:50<4:03:27,  2.26s/it]                                                    {'loss': 1.7966, 'learning_rate': 0.00039893012106256436, 'epoch': 0.05}
+  5%|▍         | 320/6779 [11:50<4:03:27,  2.26s/it]  5%|▍         | 321/6779 [11:52<3:59:09,  2.22s/it]                                                    {'loss': 1.8317, 'learning_rate': 0.00039892038156525924, 'epoch': 0.05}
+  5%|▍         | 321/6779 [11:52<3:59:09,  2.22s/it]  5%|▍         | 322/6779 [11:54<3:59:56,  2.23s/it]                                                    {'loss': 1.7131, 'learning_rate': 0.0003989105980574712, 'epoch': 0.05}
+  5%|▍         | 322/6779 [11:54<3:59:56,  2.23s/it]  5%|▍         | 323/6779 [11:56<3:57:47,  2.21s/it]                                                    {'loss': 1.8636, 'learning_rate': 0.00039890077054136486, 'epoch': 0.05}
+  5%|▍         | 323/6779 [11:56<3:57:47,  2.21s/it]  5%|▍         | 324/6779 [11:59<4:01:37,  2.25s/it]                                                    {'loss': 1.8316, 'learning_rate': 0.0003988908990191144, 'epoch': 0.05}
+  5%|▍         | 324/6779 [11:59<4:01:37,  2.25s/it]  5%|▍         | 325/6779 [12:01<4:06:10,  2.29s/it]                                                    {'loss': 1.8619, 'learning_rate': 0.000398880983492904, 'epoch': 0.05}
+  5%|▍         | 325/6779 [12:01<4:06:10,  2.29s/it]  5%|▍         | 326/6779 [12:03<4:01:27,  2.25s/it]                                                    {'loss': 1.8513, 'learning_rate': 0.00039887102396492734, 'epoch': 0.05}
+  5%|▍         | 326/6779 [12:03<4:01:27,  2.25s/it]  5%|▍         | 327/6779 [12:05<3:59:39,  2.23s/it]                                                    {'loss': 1.6909, 'learning_rate': 0.000398861020437388, 'epoch': 0.05}
+  5%|▍         | 327/6779 [12:05<3:59:39,  2.23s/it]  5%|▍         | 328/6779 [12:08<3:56:00,  2.20s/it]                                                    {'loss': 1.7864, 'learning_rate': 0.0003988509729124991, 'epoch': 0.05}
+  5%|▍         | 328/6779 [12:08<3:56:00,  2.20s/it]  5%|▍         | 329/6779 [12:10<3:48:13,  2.12s/it]                                                    {'loss': 1.8593, 'learning_rate': 0.0003988408813924838, 'epoch': 0.05}
+  5%|▍         | 329/6779 [12:10<3:48:13,  2.12s/it]  5%|▍         | 330/6779 [12:12<3:45:42,  2.10s/it]                                                    {'loss': 1.8248, 'learning_rate': 0.0003988307458795747, 'epoch': 0.05}
+  5%|▍         | 330/6779 [12:12<3:45:42,  2.10s/it]  5%|▍         | 331/6779 [12:14<3:49:00,  2.13s/it]                                                    {'loss': 1.7911, 'learning_rate': 0.00039882056637601426, 'epoch': 0.05}
+  5%|▍         | 331/6779 [12:14<3:49:00,  2.13s/it]  5%|▍         | 332/6779 [12:16<3:49:55,  2.14s/it]                                                    {'loss': 1.7673, 'learning_rate': 0.0003988103428840547, 'epoch': 0.05}
+  5%|▍         | 332/6779 [12:16<3:49:55,  2.14s/it]  5%|▍         | 333/6779 [12:18<3:46:50,  2.11s/it]                                                    {'loss': 1.8589, 'learning_rate': 0.00039880007540595794, 'epoch': 0.05}
+  5%|▍         | 333/6779 [12:18<3:46:50,  2.11s/it]  5%|▍         | 334/6779 [12:20<3:46:41,  2.11s/it]                                                    {'loss': 1.8383, 'learning_rate': 0.00039878976394399555, 'epoch': 0.05}
+  5%|▍         | 334/6779 [12:20<3:46:41,  2.11s/it]  5%|▍         | 335/6779 [12:22<3:51:11,  2.15s/it]                                                    {'loss': 1.6251, 'learning_rate': 0.000398779408500449, 'epoch': 0.05}
+  5%|▍         | 335/6779 [12:22<3:51:11,  2.15s/it]  5%|▍         | 336/6779 [12:25<3:51:44,  2.16s/it]                                                    {'loss': 1.7892, 'learning_rate': 0.0003987690090776093, 'epoch': 0.05}
+  5%|▍         | 336/6779 [12:25<3:51:44,  2.16s/it]  5%|▍         | 337/6779 [12:27<3:48:37,  2.13s/it]                                                    {'loss': 1.7274, 'learning_rate': 0.00039875856567777744, 'epoch': 0.05}
+  5%|▍         | 337/6779 [12:27<3:48:37,  2.13s/it]  5%|▍         | 338/6779 [12:29<3:48:39,  2.13s/it]                                                    {'loss': 1.8624, 'learning_rate': 0.0003987480783032638, 'epoch': 0.05}
+  5%|▍         | 338/6779 [12:29<3:48:39,  2.13s/it]  5%|▌         | 339/6779 [12:31<3:49:48,  2.14s/it]                                                    {'loss': 1.8218, 'learning_rate': 0.0003987375469563888, 'epoch': 0.05}
+  5%|▌         | 339/6779 [12:31<3:49:48,  2.14s/it]  5%|▌         | 340/6779 [12:33<3:59:42,  2.23s/it]                                                    {'loss': 1.8543, 'learning_rate': 0.00039872697163948243, 'epoch': 0.05}
+  5%|▌         | 340/6779 [12:33<3:59:42,  2.23s/it]  5%|▌         | 341/6779 [12:36<4:09:02,  2.32s/it]                                                    {'loss': 1.8423, 'learning_rate': 0.0003987163523548845, 'epoch': 0.05}
+  5%|▌         | 341/6779 [12:36<4:09:02,  2.32s/it]  5%|▌         | 342/6779 [12:38<3:57:49,  2.22s/it]                                                    {'loss': 1.8593, 'learning_rate': 0.00039870568910494434, 'epoch': 0.05}
+  5%|▌         | 342/6779 [12:38<3:57:49,  2.22s/it]  5%|▌         | 343/6779 [12:40<4:02:21,  2.26s/it]                                                    {'loss': 1.7345, 'learning_rate': 0.00039869498189202136, 'epoch': 0.05}
+  5%|▌         | 343/6779 [12:40<4:02:21,  2.26s/it]  5%|▌         | 344/6779 [12:42<3:55:30,  2.20s/it]                                                    {'loss': 1.8453, 'learning_rate': 0.0003986842307184843, 'epoch': 0.05}
+  5%|▌         | 344/6779 [12:42<3:55:30,  2.20s/it]  5%|▌         | 345/6779 [12:44<3:52:56,  2.17s/it]                                                    {'loss': 1.9135, 'learning_rate': 0.00039867343558671204, 'epoch': 0.05}
+  5%|▌         | 345/6779 [12:44<3:52:56,  2.17s/it]  5%|▌         | 346/6779 [12:46<3:50:20,  2.15s/it]                                                    {'loss': 1.8207, 'learning_rate': 0.0003986625964990927, 'epoch': 0.05}
+  5%|▌         | 346/6779 [12:46<3:50:20,  2.15s/it]  5%|▌         | 347/6779 [12:49<3:47:53,  2.13s/it]                                                    {'loss': 1.6494, 'learning_rate': 0.0003986517134580247, 'epoch': 0.05}
+  5%|▌         | 347/6779 [12:49<3:47:53,  2.13s/it]  5%|▌         | 348/6779 [12:51<3:47:48,  2.13s/it]                                                    {'loss': 1.79, 'learning_rate': 0.0003986407864659156, 'epoch': 0.05}
+  5%|▌         | 348/6779 [12:51<3:47:48,  2.13s/it]  5%|▌         | 349/6779 [12:53<3:55:04,  2.19s/it]                                                    {'loss': 1.6841, 'learning_rate': 0.0003986298155251831, 'epoch': 0.05}
+  5%|▌         | 349/6779 [12:53<3:55:04,  2.19s/it]  5%|▌         | 350/6779 [12:55<3:58:43,  2.23s/it]                                                    {'loss': 1.7476, 'learning_rate': 0.0003986188006382545, 'epoch': 0.05}
+  5%|▌         | 350/6779 [12:55<3:58:43,  2.23s/it]  5%|▌         | 351/6779 [12:58<3:58:29,  2.23s/it]                                                    {'loss': 1.7944, 'learning_rate': 0.0003986077418075667, 'epoch': 0.05}
+  5%|▌         | 351/6779 [12:58<3:58:29,  2.23s/it]  5%|▌         | 352/6779 [13:00<4:05:49,  2.29s/it]                                                    {'loss': 1.9451, 'learning_rate': 0.00039859663903556657, 'epoch': 0.05}
+  5%|▌         | 352/6779 [13:00<4:05:49,  2.29s/it]  5%|▌         | 353/6779 [13:02<3:57:18,  2.22s/it]                                                    {'loss': 1.965, 'learning_rate': 0.0003985854923247105, 'epoch': 0.05}
+  5%|▌         | 353/6779 [13:02<3:57:18,  2.22s/it]  5%|▌         | 354/6779 [13:04<3:56:25,  2.21s/it]                                                    {'loss': 1.734, 'learning_rate': 0.00039857430167746454, 'epoch': 0.05}
+  5%|▌         | 354/6779 [13:04<3:56:25,  2.21s/it]  5%|▌         | 355/6779 [13:06<3:58:41,  2.23s/it]                                                    {'loss': 1.8918, 'learning_rate': 0.00039856306709630475, 'epoch': 0.05}
+  5%|▌         | 355/6779 [13:07<3:58:41,  2.23s/it]  5%|▌         | 356/6779 [13:09<3:54:27,  2.19s/it]                                                    {'loss': 1.8399, 'learning_rate': 0.0003985517885837167, 'epoch': 0.05}
+  5%|▌         | 356/6779 [13:09<3:54:27,  2.19s/it]  5%|▌         | 357/6779 [13:11<3:53:38,  2.18s/it]                                                    {'loss': 1.753, 'learning_rate': 0.0003985404661421957, 'epoch': 0.05}
+  5%|▌         | 357/6779 [13:11<3:53:38,  2.18s/it]  5%|▌         | 358/6779 [13:13<4:05:24,  2.29s/it]                                                    {'loss': 1.781, 'learning_rate': 0.00039852909977424687, 'epoch': 0.05}
+  5%|▌         | 358/6779 [13:13<4:05:24,  2.29s/it]  5%|▌         | 359/6779 [13:15<3:59:11,  2.24s/it]                                                    {'loss': 1.7894, 'learning_rate': 0.0003985176894823849, 'epoch': 0.05}
+  5%|▌         | 359/6779 [13:15<3:59:11,  2.24s/it]  5%|▌         | 360/6779 [13:18<3:54:35,  2.19s/it]                                                    {'loss': 1.854, 'learning_rate': 0.00039850623526913433, 'epoch': 0.05}
+  5%|▌         | 360/6779 [13:18<3:54:35,  2.19s/it]  5%|▌         | 361/6779 [13:20<3:53:57,  2.19s/it]                                                    {'loss': 1.7999, 'learning_rate': 0.00039849473713702936, 'epoch': 0.05}
+  5%|▌         | 361/6779 [13:20<3:53:57,  2.19s/it]  5%|▌         | 362/6779 [13:22<3:53:51,  2.19s/it]                                                    {'loss': 1.8435, 'learning_rate': 0.00039848319508861387, 'epoch': 0.05}
+  5%|▌         | 362/6779 [13:22<3:53:51,  2.19s/it]  5%|▌         | 363/6779 [13:24<4:04:37,  2.29s/it]                                                    {'loss': 1.8206, 'learning_rate': 0.0003984716091264415, 'epoch': 0.05}
+  5%|▌         | 363/6779 [13:24<4:04:37,  2.29s/it]  5%|▌         | 364/6779 [13:27<4:00:27,  2.25s/it]                                                    {'loss': 1.7712, 'learning_rate': 0.0003984599792530757, 'epoch': 0.05}
+  5%|▌         | 364/6779 [13:27<4:00:27,  2.25s/it]  5%|▌         | 365/6779 [13:29<3:55:55,  2.21s/it]                                                    {'loss': 1.6843, 'learning_rate': 0.0003984483054710895, 'epoch': 0.05}
+  5%|▌         | 365/6779 [13:29<3:55:55,  2.21s/it]  5%|▌         | 366/6779 [13:31<3:47:54,  2.13s/it]                                                    {'loss': 1.7151, 'learning_rate': 0.0003984365877830656, 'epoch': 0.05}
+  5%|▌         | 366/6779 [13:31<3:47:54,  2.13s/it]  5%|▌         | 367/6779 [13:33<3:43:21,  2.09s/it]                                                    {'loss': 1.7526, 'learning_rate': 0.0003984248261915966, 'epoch': 0.05}
+  5%|▌         | 367/6779 [13:33<3:43:21,  2.09s/it]  5%|▌         | 368/6779 [13:35<3:41:36,  2.07s/it]                                                    {'loss': 1.8997, 'learning_rate': 0.00039841302069928465, 'epoch': 0.05}
+  5%|▌         | 368/6779 [13:35<3:41:36,  2.07s/it]  5%|▌         | 369/6779 [13:37<3:43:40,  2.09s/it]                                                    {'loss': 1.7865, 'learning_rate': 0.00039840117130874176, 'epoch': 0.05}
+  5%|▌         | 369/6779 [13:37<3:43:40,  2.09s/it]  5%|▌         | 370/6779 [13:39<3:46:12,  2.12s/it]                                                    {'loss': 1.8472, 'learning_rate': 0.00039838927802258946, 'epoch': 0.05}
+  5%|▌         | 370/6779 [13:39<3:46:12,  2.12s/it]  5%|▌         | 371/6779 [13:41<3:54:29,  2.20s/it]                                                    {'loss': 1.9315, 'learning_rate': 0.0003983773408434592, 'epoch': 0.05}
+  5%|▌         | 371/6779 [13:41<3:54:29,  2.20s/it]  5%|▌         | 372/6779 [13:44<3:55:42,  2.21s/it]                                                    {'loss': 1.7279, 'learning_rate': 0.00039836535977399193, 'epoch': 0.05}
+  5%|▌         | 372/6779 [13:44<3:55:42,  2.21s/it]  6%|▌         | 373/6779 [13:46<3:56:20,  2.21s/it]                                                    {'loss': 1.8795, 'learning_rate': 0.0003983533348168386, 'epoch': 0.06}
+  6%|▌         | 373/6779 [13:46<3:56:20,  2.21s/it]  6%|▌         | 374/6779 [13:48<3:55:19,  2.20s/it]                                                    {'loss': 1.8414, 'learning_rate': 0.0003983412659746595, 'epoch': 0.06}
+  6%|▌         | 374/6779 [13:48<3:55:19,  2.20s/it]  6%|▌         | 375/6779 [13:50<3:59:01,  2.24s/it]                                                    {'loss': 1.8032, 'learning_rate': 0.0003983291532501249, 'epoch': 0.06}
+  6%|▌         | 375/6779 [13:50<3:59:01,  2.24s/it]  6%|▌         | 376/6779 [13:53<3:58:13,  2.23s/it]                                                    {'loss': 1.7834, 'learning_rate': 0.0003983169966459148, 'epoch': 0.06}
+  6%|▌         | 376/6779 [13:53<3:58:13,  2.23s/it]  6%|▌         | 377/6779 [13:55<3:53:04,  2.18s/it]                                                    {'loss': 1.6585, 'learning_rate': 0.0003983047961647186, 'epoch': 0.06}
+  6%|▌         | 377/6779 [13:55<3:53:04,  2.18s/it]  6%|▌         | 378/6779 [13:57<3:52:19,  2.18s/it]                                                    {'loss': 1.8102, 'learning_rate': 0.00039829255180923574, 'epoch': 0.06}
+  6%|▌         | 378/6779 [13:57<3:52:19,  2.18s/it]  6%|▌         | 379/6779 [13:59<3:55:38,  2.21s/it]                                                    {'loss': 1.8267, 'learning_rate': 0.00039828026358217533, 'epoch': 0.06}
+  6%|▌         | 379/6779 [13:59<3:55:38,  2.21s/it]  6%|▌         | 380/6779 [14:01<3:55:18,  2.21s/it]                                                    {'loss': 1.772, 'learning_rate': 0.0003982679314862559, 'epoch': 0.06}
+  6%|▌         | 380/6779 [14:01<3:55:18,  2.21s/it]  6%|▌         | 381/6779 [14:03<3:47:06,  2.13s/it]                                                    {'loss': 1.7212, 'learning_rate': 0.00039825555552420604, 'epoch': 0.06}
+  6%|▌         | 381/6779 [14:03<3:47:06,  2.13s/it]  6%|▌         | 382/6779 [14:05<3:44:54,  2.11s/it]                                                    {'loss': 1.8234, 'learning_rate': 0.0003982431356987638, 'epoch': 0.06}
+  6%|▌         | 382/6779 [14:05<3:44:54,  2.11s/it]  6%|▌         | 383/6779 [14:07<3:46:56,  2.13s/it]                                                    {'loss': 1.8071, 'learning_rate': 0.00039823067201267713, 'epoch': 0.06}
+  6%|▌         | 383/6779 [14:07<3:46:56,  2.13s/it]  6%|▌         | 384/6779 [14:10<3:47:38,  2.14s/it]                                                    {'loss': 1.7077, 'learning_rate': 0.00039821816446870346, 'epoch': 0.06}
+  6%|▌         | 384/6779 [14:10<3:47:38,  2.14s/it]  6%|▌         | 385/6779 [14:12<3:52:00,  2.18s/it]                                                    {'loss': 1.741, 'learning_rate': 0.0003982056130696101, 'epoch': 0.06}
+  6%|▌         | 385/6779 [14:12<3:52:00,  2.18s/it]  6%|▌         | 386/6779 [14:14<3:55:34,  2.21s/it]                                                    {'loss': 1.862, 'learning_rate': 0.0003981930178181741, 'epoch': 0.06}
+  6%|▌         | 386/6779 [14:14<3:55:34,  2.21s/it]  6%|▌         | 387/6779 [14:16<3:58:16,  2.24s/it]                                                    {'loss': 1.8635, 'learning_rate': 0.0003981803787171819, 'epoch': 0.06}
+  6%|▌         | 387/6779 [14:16<3:58:16,  2.24s/it]  6%|▌         | 388/6779 [14:19<3:58:10,  2.24s/it]                                                    {'loss': 1.8943, 'learning_rate': 0.00039816769576943, 'epoch': 0.06}
+  6%|▌         | 388/6779 [14:19<3:58:10,  2.24s/it]  6%|▌         | 389/6779 [14:21<3:52:51,  2.19s/it]                                                    {'loss': 1.7162, 'learning_rate': 0.00039815496897772457, 'epoch': 0.06}
+  6%|▌         | 389/6779 [14:21<3:52:51,  2.19s/it]  6%|▌         | 390/6779 [14:23<3:56:19,  2.22s/it]                                                    {'loss': 1.8143, 'learning_rate': 0.00039814219834488114, 'epoch': 0.06}
+  6%|▌         | 390/6779 [14:23<3:56:19,  2.22s/it]  6%|▌         | 391/6779 [14:25<3:57:59,  2.24s/it]                                                    {'loss': 1.7148, 'learning_rate': 0.00039812938387372523, 'epoch': 0.06}
+  6%|▌         | 391/6779 [14:25<3:57:59,  2.24s/it]  6%|▌         | 392/6779 [14:28<3:59:59,  2.25s/it]                                                    {'loss': 1.8769, 'learning_rate': 0.0003981165255670921, 'epoch': 0.06}
+  6%|▌         | 392/6779 [14:28<3:59:59,  2.25s/it]  6%|▌         | 393/6779 [14:30<4:07:51,  2.33s/it]                                                    {'loss': 1.6237, 'learning_rate': 0.0003981036234278266, 'epoch': 0.06}
+  6%|▌         | 393/6779 [14:30<4:07:51,  2.33s/it]  6%|▌         | 394/6779 [14:32<4:03:42,  2.29s/it]                                                    {'loss': 1.8336, 'learning_rate': 0.00039809067745878317, 'epoch': 0.06}
+  6%|▌         | 394/6779 [14:32<4:03:42,  2.29s/it]  6%|▌         | 395/6779 [14:34<3:59:04,  2.25s/it]                                                    {'loss': 1.8808, 'learning_rate': 0.00039807768766282614, 'epoch': 0.06}
+  6%|▌         | 395/6779 [14:34<3:59:04,  2.25s/it]  6%|▌         | 396/6779 [14:36<3:52:14,  2.18s/it]                                                    {'loss': 1.8084, 'learning_rate': 0.0003980646540428295, 'epoch': 0.06}
+  6%|▌         | 396/6779 [14:36<3:52:14,  2.18s/it]  6%|▌         | 397/6779 [14:39<4:06:28,  2.32s/it]                                                    {'loss': 1.7587, 'learning_rate': 0.0003980515766016768, 'epoch': 0.06}
+  6%|▌         | 397/6779 [14:39<4:06:28,  2.32s/it]  6%|▌         | 398/6779 [14:41<4:03:37,  2.29s/it]                                                    {'loss': 1.9071, 'learning_rate': 0.00039803845534226143, 'epoch': 0.06}
+  6%|▌         | 398/6779 [14:41<4:03:37,  2.29s/it]  6%|▌         | 399/6779 [14:44<4:00:09,  2.26s/it]                                                    {'loss': 1.7408, 'learning_rate': 0.0003980252902674865, 'epoch': 0.06}
+  6%|▌         | 399/6779 [14:44<4:00:09,  2.26s/it]  6%|▌         | 400/6779 [14:46<4:05:15,  2.31s/it]                                                    {'loss': 1.7905, 'learning_rate': 0.00039801208138026456, 'epoch': 0.06}
+  6%|▌         | 400/6779 [14:46<4:05:15,  2.31s/it]  6%|▌         | 401/6779 [14:48<4:02:54,  2.29s/it]                                                    {'loss': 1.8778, 'learning_rate': 0.00039799882868351823, 'epoch': 0.06}
+  6%|▌         | 401/6779 [14:48<4:02:54,  2.29s/it]  6%|▌         | 402/6779 [14:50<4:02:33,  2.28s/it]                                                    {'loss': 1.8313, 'learning_rate': 0.00039798553218017943, 'epoch': 0.06}
+  6%|▌         | 402/6779 [14:50<4:02:33,  2.28s/it]  6%|▌         | 403/6779 [14:53<3:58:37,  2.25s/it]                                                    {'loss': 1.9472, 'learning_rate': 0.00039797219187319015, 'epoch': 0.06}
+  6%|▌         | 403/6779 [14:53<3:58:37,  2.25s/it]  6%|▌         | 404/6779 [14:55<3:55:35,  2.22s/it]                                                    {'loss': 1.7632, 'learning_rate': 0.0003979588077655018, 'epoch': 0.06}
+  6%|▌         | 404/6779 [14:55<3:55:35,  2.22s/it]  6%|▌         | 405/6779 [14:57<4:04:11,  2.30s/it]                                                    {'loss': 1.7821, 'learning_rate': 0.0003979453798600756, 'epoch': 0.06}
+  6%|▌         | 405/6779 [14:57<4:04:11,  2.30s/it]  6%|▌         | 406/6779 [15:00<4:05:11,  2.31s/it]                                                    {'loss': 1.8344, 'learning_rate': 0.00039793190815988233, 'epoch': 0.06}
+  6%|▌         | 406/6779 [15:00<4:05:11,  2.31s/it]  6%|▌         | 407/6779 [15:02<3:55:27,  2.22s/it]                                                    {'loss': 1.6997, 'learning_rate': 0.0003979183926679027, 'epoch': 0.06}
+  6%|▌         | 407/6779 [15:02<3:55:27,  2.22s/it]  6%|▌         | 408/6779 [15:04<3:47:20,  2.14s/it]                                                    {'loss': 1.956, 'learning_rate': 0.0003979048333871269, 'epoch': 0.06}
+  6%|▌         | 408/6779 [15:04<3:47:20,  2.14s/it]  6%|▌         | 409/6779 [15:06<3:50:52,  2.17s/it]                                                    {'loss': 1.756, 'learning_rate': 0.00039789123032055493, 'epoch': 0.06}
+  6%|▌         | 409/6779 [15:06<3:50:52,  2.17s/it]  6%|▌         | 410/6779 [15:08<3:54:27,  2.21s/it]                                                    {'loss': 1.8861, 'learning_rate': 0.00039787758347119626, 'epoch': 0.06}
+  6%|▌         | 410/6779 [15:08<3:54:27,  2.21s/it]  6%|▌         | 411/6779 [15:10<3:55:23,  2.22s/it]                                                    {'loss': 1.6501, 'learning_rate': 0.00039786389284207044, 'epoch': 0.06}
+  6%|▌         | 411/6779 [15:10<3:55:23,  2.22s/it]  6%|▌         | 412/6779 [15:12<3:48:20,  2.15s/it]                                                    {'loss': 1.8189, 'learning_rate': 0.0003978501584362063, 'epoch': 0.06}
+  6%|▌         | 412/6779 [15:12<3:48:20,  2.15s/it]  6%|▌         | 413/6779 [15:15<3:56:25,  2.23s/it]                                                    {'loss': 1.6048, 'learning_rate': 0.0003978363802566426, 'epoch': 0.06}
+  6%|▌         | 413/6779 [15:15<3:56:25,  2.23s/it]  6%|▌         | 414/6779 [15:17<3:53:40,  2.20s/it]                                                    {'loss': 1.7401, 'learning_rate': 0.00039782255830642777, 'epoch': 0.06}
+  6%|▌         | 414/6779 [15:17<3:53:40,  2.20s/it]  6%|▌         | 415/6779 [15:19<3:52:14,  2.19s/it]                                                    {'loss': 1.8954, 'learning_rate': 0.0003978086925886198, 'epoch': 0.06}
+  6%|▌         | 415/6779 [15:19<3:52:14,  2.19s/it]  6%|▌         | 416/6779 [15:21<3:50:16,  2.17s/it]                                                    {'loss': 1.8313, 'learning_rate': 0.00039779478310628645, 'epoch': 0.06}
+  6%|▌         | 416/6779 [15:21<3:50:16,  2.17s/it]  6%|▌         | 417/6779 [15:24<3:55:33,  2.22s/it]                                                    {'loss': 1.9141, 'learning_rate': 0.00039778082986250513, 'epoch': 0.06}
+  6%|▌         | 417/6779 [15:24<3:55:33,  2.22s/it]  6%|▌         | 418/6779 [15:26<3:50:20,  2.17s/it]                                                    {'loss': 1.6629, 'learning_rate': 0.00039776683286036295, 'epoch': 0.06}
+  6%|▌         | 418/6779 [15:26<3:50:20,  2.17s/it]  6%|▌         | 419/6779 [15:28<3:48:25,  2.15s/it]                                                    {'loss': 1.8725, 'learning_rate': 0.00039775279210295676, 'epoch': 0.06}
+  6%|▌         | 419/6779 [15:28<3:48:25,  2.15s/it]  6%|▌         | 420/6779 [15:30<3:48:09,  2.15s/it]                                                    {'loss': 1.6964, 'learning_rate': 0.00039773870759339297, 'epoch': 0.06}
+  6%|▌         | 420/6779 [15:30<3:48:09,  2.15s/it]  6%|▌         | 421/6779 [15:32<3:48:10,  2.15s/it]                                                    {'loss': 1.8059, 'learning_rate': 0.0003977245793347878, 'epoch': 0.06}
+  6%|▌         | 421/6779 [15:32<3:48:10,  2.15s/it]  6%|▌         | 422/6779 [15:34<3:42:55,  2.10s/it]                                                    {'loss': 1.7852, 'learning_rate': 0.00039771040733026697, 'epoch': 0.06}
+  6%|▌         | 422/6779 [15:34<3:42:55,  2.10s/it]  6%|▌         | 423/6779 [15:36<3:41:14,  2.09s/it]                                                    {'loss': 1.9568, 'learning_rate': 0.000397696191582966, 'epoch': 0.06}
+  6%|▌         | 423/6779 [15:36<3:41:14,  2.09s/it]  6%|▋         | 424/6779 [15:38<3:42:01,  2.10s/it]                                                    {'loss': 1.8273, 'learning_rate': 0.0003976819320960303, 'epoch': 0.06}
+  6%|▋         | 424/6779 [15:38<3:42:01,  2.10s/it]  6%|▋         | 425/6779 [15:40<3:50:04,  2.17s/it]                                                    {'loss': 1.8533, 'learning_rate': 0.00039766762887261445, 'epoch': 0.06}
+  6%|▋         | 425/6779 [15:40<3:50:04,  2.17s/it]  6%|▋         | 426/6779 [15:43<3:51:11,  2.18s/it]                                                    {'loss': 1.7547, 'learning_rate': 0.00039765328191588314, 'epoch': 0.06}
+  6%|▋         | 426/6779 [15:43<3:51:11,  2.18s/it]  6%|▋         | 427/6779 [15:45<3:52:05,  2.19s/it]                                                    {'loss': 1.8107, 'learning_rate': 0.0003976388912290105, 'epoch': 0.06}
+  6%|▋         | 427/6779 [15:45<3:52:05,  2.19s/it]  6%|▋         | 428/6779 [15:47<3:54:24,  2.21s/it]                                                    {'loss': 2.0183, 'learning_rate': 0.00039762445681518053, 'epoch': 0.06}
+  6%|▋         | 428/6779 [15:47<3:54:24,  2.21s/it]  6%|▋         | 429/6779 [15:49<3:51:17,  2.19s/it]                                                    {'loss': 1.7311, 'learning_rate': 0.0003976099786775867, 'epoch': 0.06}
+  6%|▋         | 429/6779 [15:49<3:51:17,  2.19s/it]  6%|▋         | 430/6779 [15:52<3:55:03,  2.22s/it]                                                    {'loss': 1.9018, 'learning_rate': 0.00039759545681943237, 'epoch': 0.06}
+  6%|▋         | 430/6779 [15:52<3:55:03,  2.22s/it]  6%|▋         | 431/6779 [15:54<3:49:19,  2.17s/it]                                                    {'loss': 1.6872, 'learning_rate': 0.00039758089124393035, 'epoch': 0.06}
+  6%|▋         | 431/6779 [15:54<3:49:19,  2.17s/it]  6%|▋         | 432/6779 [15:56<3:52:39,  2.20s/it]                                                    {'loss': 1.7358, 'learning_rate': 0.00039756628195430324, 'epoch': 0.06}
+  6%|▋         | 432/6779 [15:56<3:52:39,  2.20s/it]  6%|▋         | 433/6779 [15:58<3:56:02,  2.23s/it]                                                    {'loss': 1.6796, 'learning_rate': 0.00039755162895378326, 'epoch': 0.06}
+  6%|▋         | 433/6779 [15:58<3:56:02,  2.23s/it]  6%|▋         | 434/6779 [16:00<3:54:31,  2.22s/it]                                                    {'loss': 1.892, 'learning_rate': 0.0003975369322456125, 'epoch': 0.06}
+  6%|▋         | 434/6779 [16:00<3:54:31,  2.22s/it]  6%|▋         | 435/6779 [16:03<3:54:40,  2.22s/it]                                                    {'loss': 1.7282, 'learning_rate': 0.0003975221918330424, 'epoch': 0.06}
+  6%|▋         | 435/6779 [16:03<3:54:40,  2.22s/it]  6%|▋         | 436/6779 [16:05<4:03:28,  2.30s/it]                                                    {'loss': 1.9827, 'learning_rate': 0.00039750740771933417, 'epoch': 0.06}
+  6%|▋         | 436/6779 [16:05<4:03:28,  2.30s/it]  6%|▋         | 437/6779 [16:07<3:54:57,  2.22s/it]                                                    {'loss': 1.6816, 'learning_rate': 0.000397492579907759, 'epoch': 0.06}
+  6%|▋         | 437/6779 [16:07<3:54:57,  2.22s/it]  6%|▋         | 438/6779 [16:09<3:55:13,  2.23s/it]                                                    {'loss': 1.799, 'learning_rate': 0.0003974777084015973, 'epoch': 0.06}
+  6%|▋         | 438/6779 [16:09<3:55:13,  2.23s/it]  6%|▋         | 439/6779 [16:12<3:53:02,  2.21s/it]                                                    {'loss': 1.7513, 'learning_rate': 0.00039746279320413937, 'epoch': 0.06}
+  6%|▋         | 439/6779 [16:12<3:53:02,  2.21s/it]  6%|▋         | 440/6779 [16:15<4:16:47,  2.43s/it]                                                    {'loss': 1.8015, 'learning_rate': 0.00039744783431868515, 'epoch': 0.06}
+  6%|▋         | 440/6779 [16:15<4:16:47,  2.43s/it]  7%|▋         | 441/6779 [16:17<4:23:52,  2.50s/it]                                                    {'loss': 1.9568, 'learning_rate': 0.0003974328317485443, 'epoch': 0.07}
+  7%|▋         | 441/6779 [16:17<4:23:52,  2.50s/it]  7%|▋         | 442/6779 [16:20<4:22:20,  2.48s/it]                                                    {'loss': 1.7025, 'learning_rate': 0.0003974177854970361, 'epoch': 0.07}
+  7%|▋         | 442/6779 [16:20<4:22:20,  2.48s/it]  7%|▋         | 443/6779 [16:22<4:15:18,  2.42s/it]                                                    {'loss': 1.7496, 'learning_rate': 0.0003974026955674893, 'epoch': 0.07}
+  7%|▋         | 443/6779 [16:22<4:15:18,  2.42s/it]  7%|▋         | 444/6779 [16:24<4:08:19,  2.35s/it]                                                    {'loss': 1.7982, 'learning_rate': 0.00039738756196324267, 'epoch': 0.07}
+  7%|▋         | 444/6779 [16:24<4:08:19,  2.35s/it]  7%|▋         | 445/6779 [16:27<4:15:10,  2.42s/it]                                                    {'loss': 1.7978, 'learning_rate': 0.00039737238468764453, 'epoch': 0.07}
+  7%|▋         | 445/6779 [16:27<4:15:10,  2.42s/it]  7%|▋         | 446/6779 [16:29<4:06:36,  2.34s/it]                                                    {'loss': 1.8577, 'learning_rate': 0.0003973571637440526, 'epoch': 0.07}
+  7%|▋         | 446/6779 [16:29<4:06:36,  2.34s/it]  7%|▋         | 447/6779 [16:31<4:00:13,  2.28s/it]                                                    {'loss': 1.8767, 'learning_rate': 0.00039734189913583464, 'epoch': 0.07}
+  7%|▋         | 447/6779 [16:31<4:00:13,  2.28s/it]  7%|▋         | 448/6779 [16:33<3:57:05,  2.25s/it]                                                    {'loss': 1.7078, 'learning_rate': 0.0003973265908663678, 'epoch': 0.07}
+  7%|▋         | 448/6779 [16:33<3:57:05,  2.25s/it]  7%|▋         | 449/6779 [16:36<4:03:26,  2.31s/it]                                                    {'loss': 1.8624, 'learning_rate': 0.000397311238939039, 'epoch': 0.07}
+  7%|▋         | 449/6779 [16:36<4:03:26,  2.31s/it]  7%|▋         | 450/6779 [16:38<4:09:11,  2.36s/it]                                                    {'loss': 1.8064, 'learning_rate': 0.0003972958433572448, 'epoch': 0.07}
+  7%|▋         | 450/6779 [16:38<4:09:11,  2.36s/it]  7%|▋         | 451/6779 [16:40<4:01:18,  2.29s/it]                                                    {'loss': 1.8586, 'learning_rate': 0.00039728040412439147, 'epoch': 0.07}
+  7%|▋         | 451/6779 [16:40<4:01:18,  2.29s/it]  7%|▋         | 452/6779 [16:42<3:53:04,  2.21s/it]                                                    {'loss': 1.7813, 'learning_rate': 0.0003972649212438948, 'epoch': 0.07}
+  7%|▋         | 452/6779 [16:42<3:53:04,  2.21s/it]  7%|▋         | 453/6779 [16:44<3:48:57,  2.17s/it]                                                    {'loss': 1.7999, 'learning_rate': 0.00039724939471918043, 'epoch': 0.07}
+  7%|▋         | 453/6779 [16:44<3:48:57,  2.17s/it]  7%|▋         | 454/6779 [16:46<3:50:29,  2.19s/it]                                                    {'loss': 1.8336, 'learning_rate': 0.0003972338245536835, 'epoch': 0.07}
+  7%|▋         | 454/6779 [16:47<3:50:29,  2.19s/it]  7%|▋         | 455/6779 [16:49<3:45:41,  2.14s/it]                                                    {'loss': 1.7335, 'learning_rate': 0.00039721821075084886, 'epoch': 0.07}
+  7%|▋         | 455/6779 [16:49<3:45:41,  2.14s/it]  7%|▋         | 456/6779 [16:51<4:01:21,  2.29s/it]                                                    {'loss': 1.727, 'learning_rate': 0.00039720255331413104, 'epoch': 0.07}
+  7%|▋         | 456/6779 [16:51<4:01:21,  2.29s/it]  7%|▋         | 457/6779 [16:54<4:17:44,  2.45s/it]                                                    {'loss': 1.8477, 'learning_rate': 0.0003971868522469941, 'epoch': 0.07}
+  7%|▋         | 457/6779 [16:54<4:17:44,  2.45s/it]  7%|▋         | 458/6779 [16:56<4:03:58,  2.32s/it]                                                    {'loss': 1.6951, 'learning_rate': 0.000397171107552912, 'epoch': 0.07}
+  7%|▋         | 458/6779 [16:56<4:03:58,  2.32s/it]  7%|▋         | 459/6779 [16:58<4:03:51,  2.32s/it]                                                    {'loss': 1.6504, 'learning_rate': 0.00039715531923536807, 'epoch': 0.07}
+  7%|▋         | 459/6779 [16:58<4:03:51,  2.32s/it]  7%|▋         | 460/6779 [17:01<3:59:58,  2.28s/it]                                                    {'loss': 1.9051, 'learning_rate': 0.00039713948729785546, 'epoch': 0.07}
+  7%|▋         | 460/6779 [17:01<3:59:58,  2.28s/it]  7%|▋         | 461/6779 [17:03<3:54:43,  2.23s/it]                                                    {'loss': 1.8366, 'learning_rate': 0.000397123611743877, 'epoch': 0.07}
+  7%|▋         | 461/6779 [17:03<3:54:43,  2.23s/it]  7%|▋         | 462/6779 [17:05<3:46:51,  2.15s/it]                                                    {'loss': 1.8481, 'learning_rate': 0.000397107692576945, 'epoch': 0.07}
+  7%|▋         | 462/6779 [17:05<3:46:51,  2.15s/it]  7%|▋         | 463/6779 [17:07<3:43:15,  2.12s/it]                                                    {'loss': 1.8254, 'learning_rate': 0.00039709172980058164, 'epoch': 0.07}
+  7%|▋         | 463/6779 [17:07<3:43:15,  2.12s/it]  7%|▋         | 464/6779 [17:09<3:42:54,  2.12s/it]                                                    {'loss': 1.8252, 'learning_rate': 0.0003970757234183185, 'epoch': 0.07}
+  7%|▋         | 464/6779 [17:09<3:42:54,  2.12s/it]  7%|▋         | 465/6779 [17:11<3:46:13,  2.15s/it]                                                    {'loss': 1.6986, 'learning_rate': 0.00039705967343369705, 'epoch': 0.07}
+  7%|▋         | 465/6779 [17:11<3:46:13,  2.15s/it]  7%|▋         | 466/6779 [17:13<3:45:10,  2.14s/it]                                                    {'loss': 1.7434, 'learning_rate': 0.0003970435798502683, 'epoch': 0.07}
+  7%|▋         | 466/6779 [17:13<3:45:10,  2.14s/it]  7%|▋         | 467/6779 [17:15<3:50:03,  2.19s/it]                                                    {'loss': 1.7413, 'learning_rate': 0.0003970274426715928, 'epoch': 0.07}
+  7%|▋         | 467/6779 [17:15<3:50:03,  2.19s/it]  7%|▋         | 468/6779 [17:18<3:52:02,  2.21s/it]                                                    {'loss': 1.7657, 'learning_rate': 0.00039701126190124094, 'epoch': 0.07}
+  7%|▋         | 468/6779 [17:18<3:52:02,  2.21s/it]  7%|▋         | 469/6779 [17:20<3:46:58,  2.16s/it]                                                    {'loss': 1.7052, 'learning_rate': 0.00039699503754279264, 'epoch': 0.07}
+  7%|▋         | 469/6779 [17:20<3:46:58,  2.16s/it]  7%|▋         | 470/6779 [17:22<3:45:11,  2.14s/it]                                                    {'loss': 1.8257, 'learning_rate': 0.0003969787695998374, 'epoch': 0.07}
+  7%|▋         | 470/6779 [17:22<3:45:11,  2.14s/it]  7%|▋         | 471/6779 [17:24<3:43:15,  2.12s/it]                                                    {'loss': 1.8254, 'learning_rate': 0.0003969624580759746, 'epoch': 0.07}
+  7%|▋         | 471/6779 [17:24<3:43:15,  2.12s/it]  7%|▋         | 472/6779 [17:26<3:49:57,  2.19s/it]                                                    {'loss': 1.8684, 'learning_rate': 0.00039694610297481305, 'epoch': 0.07}
+  7%|▋         | 472/6779 [17:26<3:49:57,  2.19s/it]  7%|▋         | 473/6779 [17:29<3:53:25,  2.22s/it]                                                    {'loss': 1.8561, 'learning_rate': 0.0003969297042999712, 'epoch': 0.07}
+  7%|▋         | 473/6779 [17:29<3:53:25,  2.22s/it]  7%|▋         | 474/6779 [17:31<3:59:12,  2.28s/it]                                                    {'loss': 1.7693, 'learning_rate': 0.00039691326205507717, 'epoch': 0.07}
+  7%|▋         | 474/6779 [17:31<3:59:12,  2.28s/it]  7%|▋         | 475/6779 [17:33<3:52:50,  2.22s/it]                                                    {'loss': 1.8749, 'learning_rate': 0.00039689677624376896, 'epoch': 0.07}
+  7%|▋         | 475/6779 [17:33<3:52:50,  2.22s/it]  7%|▋         | 476/6779 [17:35<3:50:12,  2.19s/it]                                                    {'loss': 1.8235, 'learning_rate': 0.00039688024686969386, 'epoch': 0.07}
+  7%|▋         | 476/6779 [17:35<3:50:12,  2.19s/it]  7%|▋         | 477/6779 [17:37<3:53:54,  2.23s/it]                                                    {'loss': 1.6995, 'learning_rate': 0.00039686367393650893, 'epoch': 0.07}
+  7%|▋         | 477/6779 [17:37<3:53:54,  2.23s/it]  7%|▋         | 478/6779 [17:40<3:56:16,  2.25s/it]                                                    {'loss': 1.5403, 'learning_rate': 0.0003968470574478809, 'epoch': 0.07}
+  7%|▋         | 478/6779 [17:40<3:56:16,  2.25s/it]  7%|▋         | 479/6779 [17:42<3:53:34,  2.22s/it]                                                    {'loss': 1.8066, 'learning_rate': 0.00039683039740748613, 'epoch': 0.07}
+  7%|▋         | 479/6779 [17:42<3:53:34,  2.22s/it]  7%|▋         | 480/6779 [17:44<3:56:33,  2.25s/it]                                                    {'loss': 1.8615, 'learning_rate': 0.0003968136938190106, 'epoch': 0.07}
+  7%|▋         | 480/6779 [17:44<3:56:33,  2.25s/it]  7%|▋         | 481/6779 [17:46<3:51:51,  2.21s/it]                                                    {'loss': 1.5913, 'learning_rate': 0.00039679694668614987, 'epoch': 0.07}
+  7%|▋         | 481/6779 [17:46<3:51:51,  2.21s/it]  7%|▋         | 482/6779 [17:49<3:56:17,  2.25s/it]                                                    {'loss': 1.8386, 'learning_rate': 0.00039678015601260925, 'epoch': 0.07}
+  7%|▋         | 482/6779 [17:49<3:56:17,  2.25s/it]  7%|▋         | 483/6779 [17:51<3:51:27,  2.21s/it]                                                    {'loss': 1.8947, 'learning_rate': 0.00039676332180210364, 'epoch': 0.07}
+  7%|▋         | 483/6779 [17:51<3:51:27,  2.21s/it]  7%|▋         | 484/6779 [17:53<4:02:42,  2.31s/it]                                                    {'loss': 1.8435, 'learning_rate': 0.0003967464440583574, 'epoch': 0.07}
+  7%|▋         | 484/6779 [17:53<4:02:42,  2.31s/it]  7%|▋         | 485/6779 [17:55<3:55:24,  2.24s/it]                                                    {'loss': 1.7903, 'learning_rate': 0.00039672952278510494, 'epoch': 0.07}
+  7%|▋         | 485/6779 [17:55<3:55:24,  2.24s/it]  7%|▋         | 486/6779 [17:57<3:49:30,  2.19s/it]                                                    {'loss': 1.8439, 'learning_rate': 0.00039671255798608975, 'epoch': 0.07}
+  7%|▋         | 486/6779 [17:57<3:49:30,  2.19s/it]  7%|▋         | 487/6779 [18:00<3:54:33,  2.24s/it]                                                    {'loss': 1.8488, 'learning_rate': 0.00039669554966506544, 'epoch': 0.07}
+  7%|▋         | 487/6779 [18:00<3:54:33,  2.24s/it]  7%|▋         | 488/6779 [18:02<3:56:49,  2.26s/it]                                                    {'loss': 1.7086, 'learning_rate': 0.000396678497825795, 'epoch': 0.07}
+  7%|▋         | 488/6779 [18:02<3:56:49,  2.26s/it]  7%|▋         | 489/6779 [18:04<3:53:03,  2.22s/it]                                                    {'loss': 1.792, 'learning_rate': 0.000396661402472051, 'epoch': 0.07}
+  7%|▋         | 489/6779 [18:04<3:53:03,  2.22s/it]  7%|▋         | 490/6779 [18:07<3:55:10,  2.24s/it]                                                    {'loss': 1.8584, 'learning_rate': 0.00039664426360761586, 'epoch': 0.07}
+  7%|▋         | 490/6779 [18:07<3:55:10,  2.24s/it]  7%|▋         | 491/6779 [18:09<3:49:37,  2.19s/it]                                                    {'loss': 1.629, 'learning_rate': 0.0003966270812362814, 'epoch': 0.07}
+  7%|▋         | 491/6779 [18:09<3:49:37,  2.19s/it]  7%|▋         | 492/6779 [18:11<3:47:35,  2.17s/it]                                                    {'loss': 1.6584, 'learning_rate': 0.0003966098553618493, 'epoch': 0.07}
+  7%|▋         | 492/6779 [18:11<3:47:35,  2.17s/it]  7%|▋         | 493/6779 [18:14<4:12:10,  2.41s/it]                                                    {'loss': 1.6464, 'learning_rate': 0.00039659258598813055, 'epoch': 0.07}
+  7%|▋         | 493/6779 [18:14<4:12:10,  2.41s/it]  7%|▋         | 494/6779 [18:16<4:01:01,  2.30s/it]                                                    {'loss': 1.7918, 'learning_rate': 0.00039657527311894606, 'epoch': 0.07}
+  7%|▋         | 494/6779 [18:16<4:01:01,  2.30s/it]  7%|▋         | 495/6779 [18:18<3:55:57,  2.25s/it]                                                    {'loss': 1.6825, 'learning_rate': 0.00039655791675812614, 'epoch': 0.07}
+  7%|▋         | 495/6779 [18:18<3:55:57,  2.25s/it]  7%|▋         | 496/6779 [18:20<4:03:54,  2.33s/it]                                                    {'loss': 1.7429, 'learning_rate': 0.00039654051690951093, 'epoch': 0.07}
+  7%|▋         | 496/6779 [18:20<4:03:54,  2.33s/it]  7%|▋         | 497/6779 [18:23<4:03:48,  2.33s/it]                                                    {'loss': 1.7522, 'learning_rate': 0.00039652307357695006, 'epoch': 0.07}
+  7%|▋         | 497/6779 [18:23<4:03:48,  2.33s/it]  7%|▋         | 498/6779 [18:25<4:02:15,  2.31s/it]                                                    {'loss': 1.723, 'learning_rate': 0.00039650558676430285, 'epoch': 0.07}
+  7%|▋         | 498/6779 [18:25<4:02:15,  2.31s/it]  7%|▋         | 499/6779 [18:27<3:55:50,  2.25s/it]                                                    {'loss': 1.6514, 'learning_rate': 0.0003964880564754381, 'epoch': 0.07}
+  7%|▋         | 499/6779 [18:27<3:55:50,  2.25s/it]  7%|▋         | 500/6779 [18:29<3:55:49,  2.25s/it]                                                    {'loss': 1.7737, 'learning_rate': 0.0003964704827142344, 'epoch': 0.07}
+  7%|▋         | 500/6779 [18:29<3:55:49,  2.25s/it]  7%|▋         | 501/6779 [18:32<3:57:49,  2.27s/it]                                                    {'loss': 1.9399, 'learning_rate': 0.00039645286548457994, 'epoch': 0.07}
+  7%|▋         | 501/6779 [18:32<3:57:49,  2.27s/it]  7%|▋         | 502/6779 [18:34<3:52:30,  2.22s/it]                                                    {'loss': 1.7434, 'learning_rate': 0.0003964352047903723, 'epoch': 0.07}
+  7%|▋         | 502/6779 [18:34<3:52:30,  2.22s/it]  7%|▋         | 503/6779 [18:36<3:53:39,  2.23s/it]                                                    {'loss': 1.8614, 'learning_rate': 0.000396417500635519, 'epoch': 0.07}
+  7%|▋         | 503/6779 [18:36<3:53:39,  2.23s/it]  7%|▋         | 504/6779 [18:38<3:48:23,  2.18s/it]                                                    {'loss': 1.7248, 'learning_rate': 0.000396399753023937, 'epoch': 0.07}
+  7%|▋         | 504/6779 [18:38<3:48:23,  2.18s/it]  7%|▋         | 505/6779 [18:40<3:50:16,  2.20s/it]                                                    {'loss': 1.8147, 'learning_rate': 0.00039638196195955293, 'epoch': 0.07}
+  7%|▋         | 505/6779 [18:40<3:50:16,  2.20s/it]  7%|▋         | 506/6779 [18:42<3:46:04,  2.16s/it]                                                    {'loss': 1.7088, 'learning_rate': 0.0003963641274463029, 'epoch': 0.07}
+  7%|▋         | 506/6779 [18:42<3:46:04,  2.16s/it]  7%|▋         | 507/6779 [18:45<3:55:36,  2.25s/it]                                                    {'loss': 1.6859, 'learning_rate': 0.0003963462494881328, 'epoch': 0.07}
+  7%|▋         | 507/6779 [18:45<3:55:36,  2.25s/it]  7%|▋         | 508/6779 [18:47<3:50:33,  2.21s/it]                                                    {'loss': 1.8509, 'learning_rate': 0.00039632832808899807, 'epoch': 0.07}
+  7%|▋         | 508/6779 [18:47<3:50:33,  2.21s/it]  8%|▊         | 509/6779 [18:49<3:45:18,  2.16s/it]                                                    {'loss': 1.7807, 'learning_rate': 0.0003963103632528638, 'epoch': 0.08}
+  8%|▊         | 509/6779 [18:49<3:45:18,  2.16s/it]  8%|▊         | 510/6779 [18:51<3:41:33,  2.12s/it]                                                    {'loss': 1.8307, 'learning_rate': 0.00039629235498370456, 'epoch': 0.08}
+  8%|▊         | 510/6779 [18:51<3:41:33,  2.12s/it]  8%|▊         | 511/6779 [18:53<3:39:54,  2.11s/it]                                                    {'loss': 1.776, 'learning_rate': 0.0003962743032855047, 'epoch': 0.08}
+  8%|▊         | 511/6779 [18:53<3:39:54,  2.11s/it]  8%|▊         | 512/6779 [18:55<3:38:48,  2.09s/it]                                                    {'loss': 1.7817, 'learning_rate': 0.000396256208162258, 'epoch': 0.08}
+  8%|▊         | 512/6779 [18:55<3:38:48,  2.09s/it]  8%|▊         | 513/6779 [18:57<3:42:45,  2.13s/it]                                                    {'loss': 1.7335, 'learning_rate': 0.00039623806961796806, 'epoch': 0.08}
+  8%|▊         | 513/6779 [18:57<3:42:45,  2.13s/it]  8%|▊         | 514/6779 [19:00<3:52:04,  2.22s/it]                                                    {'loss': 1.7618, 'learning_rate': 0.000396219887656648, 'epoch': 0.08}
+  8%|▊         | 514/6779 [19:00<3:52:04,  2.22s/it]  8%|▊         | 515/6779 [19:02<3:49:38,  2.20s/it]                                                    {'loss': 1.7928, 'learning_rate': 0.0003962016622823204, 'epoch': 0.08}
+  8%|▊         | 515/6779 [19:02<3:49:38,  2.20s/it]  8%|▊         | 516/6779 [19:04<3:52:40,  2.23s/it]                                                    {'loss': 1.7305, 'learning_rate': 0.0003961833934990176, 'epoch': 0.08}
+  8%|▊         | 516/6779 [19:04<3:52:40,  2.23s/it]  8%|▊         | 517/6779 [19:07<3:56:56,  2.27s/it]                                                    {'loss': 1.8676, 'learning_rate': 0.00039616508131078154, 'epoch': 0.08}
+  8%|▊         | 517/6779 [19:07<3:56:56,  2.27s/it]  8%|▊         | 518/6779 [19:09<3:59:00,  2.29s/it]                                                    {'loss': 1.8546, 'learning_rate': 0.00039614672572166364, 'epoch': 0.08}
+  8%|▊         | 518/6779 [19:09<3:59:00,  2.29s/it]  8%|▊         | 519/6779 [19:11<3:54:25,  2.25s/it]                                                    {'loss': 1.7474, 'learning_rate': 0.0003961283267357252, 'epoch': 0.08}
+  8%|▊         | 519/6779 [19:11<3:54:25,  2.25s/it]  8%|▊         | 520/6779 [19:13<3:52:30,  2.23s/it]                                                    {'loss': 1.7562, 'learning_rate': 0.0003961098843570367, 'epoch': 0.08}
+  8%|▊         | 520/6779 [19:13<3:52:30,  2.23s/it]  8%|▊         | 521/6779 [19:16<3:54:12,  2.25s/it]                                                    {'loss': 1.7885, 'learning_rate': 0.00039609139858967873, 'epoch': 0.08}
+  8%|▊         | 521/6779 [19:16<3:54:12,  2.25s/it]  8%|▊         | 522/6779 [19:18<4:02:05,  2.32s/it]                                                    {'loss': 1.9507, 'learning_rate': 0.00039607286943774096, 'epoch': 0.08}
+  8%|▊         | 522/6779 [19:18<4:02:05,  2.32s/it]  8%|▊         | 523/6779 [19:20<3:57:36,  2.28s/it]                                                    {'loss': 1.7405, 'learning_rate': 0.000396054296905323, 'epoch': 0.08}
+  8%|▊         | 523/6779 [19:20<3:57:36,  2.28s/it]  8%|▊         | 524/6779 [19:23<3:54:39,  2.25s/it]                                                    {'loss': 1.6542, 'learning_rate': 0.00039603568099653394, 'epoch': 0.08}
+  8%|▊         | 524/6779 [19:23<3:54:39,  2.25s/it]  8%|▊         | 525/6779 [19:25<3:57:21,  2.28s/it]                                                    {'loss': 1.9583, 'learning_rate': 0.0003960170217154926, 'epoch': 0.08}
+  8%|▊         | 525/6779 [19:25<3:57:21,  2.28s/it]  8%|▊         | 526/6779 [19:27<4:02:57,  2.33s/it]                                                    {'loss': 1.8323, 'learning_rate': 0.0003959983190663271, 'epoch': 0.08}
+  8%|▊         | 526/6779 [19:27<4:02:57,  2.33s/it]  8%|▊         | 527/6779 [19:30<3:58:38,  2.29s/it]                                                    {'loss': 1.8341, 'learning_rate': 0.0003959795730531755, 'epoch': 0.08}
+  8%|▊         | 527/6779 [19:30<3:58:38,  2.29s/it]  8%|▊         | 528/6779 [19:32<3:52:53,  2.24s/it]                                                    {'loss': 1.7341, 'learning_rate': 0.0003959607836801852, 'epoch': 0.08}
+  8%|▊         | 528/6779 [19:32<3:52:53,  2.24s/it]  8%|▊         | 529/6779 [19:34<3:54:57,  2.26s/it]                                                    {'loss': 1.913, 'learning_rate': 0.0003959419509515133, 'epoch': 0.08}
+  8%|▊         | 529/6779 [19:34<3:54:57,  2.26s/it]  8%|▊         | 530/6779 [19:36<3:55:32,  2.26s/it]                                                    {'loss': 1.8376, 'learning_rate': 0.0003959230748713265, 'epoch': 0.08}
+  8%|▊         | 530/6779 [19:36<3:55:32,  2.26s/it]  8%|▊         | 531/6779 [19:38<3:56:34,  2.27s/it]                                                    {'loss': 1.8546, 'learning_rate': 0.0003959041554438011, 'epoch': 0.08}
+  8%|▊         | 531/6779 [19:39<3:56:34,  2.27s/it]  8%|▊         | 532/6779 [19:41<3:56:17,  2.27s/it]                                                    {'loss': 1.6754, 'learning_rate': 0.0003958851926731229, 'epoch': 0.08}
+  8%|▊         | 532/6779 [19:41<3:56:17,  2.27s/it]  8%|▊         | 533/6779 [19:43<3:53:47,  2.25s/it]                                                    {'loss': 1.772, 'learning_rate': 0.00039586618656348735, 'epoch': 0.08}
+  8%|▊         | 533/6779 [19:43<3:53:47,  2.25s/it]  8%|▊         | 534/6779 [19:45<3:47:42,  2.19s/it]                                                    {'loss': 1.7421, 'learning_rate': 0.00039584713711909956, 'epoch': 0.08}
+  8%|▊         | 534/6779 [19:45<3:47:42,  2.19s/it]  8%|▊         | 535/6779 [19:47<3:44:15,  2.16s/it]                                                    {'loss': 1.7301, 'learning_rate': 0.0003958280443441741, 'epoch': 0.08}
+  8%|▊         | 535/6779 [19:47<3:44:15,  2.16s/it]  8%|▊         | 536/6779 [19:49<3:46:30,  2.18s/it]                                                    {'loss': 1.7809, 'learning_rate': 0.00039580890824293517, 'epoch': 0.08}
+  8%|▊         | 536/6779 [19:49<3:46:30,  2.18s/it]  8%|▊         | 537/6779 [19:52<3:47:33,  2.19s/it]                                                    {'loss': 1.956, 'learning_rate': 0.00039578972881961665, 'epoch': 0.08}
+  8%|▊         | 537/6779 [19:52<3:47:33,  2.19s/it]  8%|▊         | 538/6779 [19:54<3:46:48,  2.18s/it]                                                    {'loss': 1.8369, 'learning_rate': 0.0003957705060784619, 'epoch': 0.08}
+  8%|▊         | 538/6779 [19:54<3:46:48,  2.18s/it]  8%|▊         | 539/6779 [19:56<3:40:13,  2.12s/it]                                                    {'loss': 1.8083, 'learning_rate': 0.0003957512400237238, 'epoch': 0.08}
+  8%|▊         | 539/6779 [19:56<3:40:13,  2.12s/it]  8%|▊         | 540/6779 [19:58<3:43:18,  2.15s/it]                                                    {'loss': 1.9556, 'learning_rate': 0.00039573193065966497, 'epoch': 0.08}
+  8%|▊         | 540/6779 [19:58<3:43:18,  2.15s/it]  8%|▊         | 541/6779 [20:00<3:47:10,  2.19s/it]                                                    {'loss': 1.7622, 'learning_rate': 0.00039571257799055754, 'epoch': 0.08}
+  8%|▊         | 541/6779 [20:00<3:47:10,  2.19s/it]  8%|▊         | 542/6779 [20:02<3:46:06,  2.18s/it]                                                    {'loss': 1.8417, 'learning_rate': 0.0003956931820206832, 'epoch': 0.08}
+  8%|▊         | 542/6779 [20:02<3:46:06,  2.18s/it]  8%|▊         | 543/6779 [20:04<3:41:45,  2.13s/it]                                                    {'loss': 1.8039, 'learning_rate': 0.0003956737427543333, 'epoch': 0.08}
+  8%|▊         | 543/6779 [20:04<3:41:45,  2.13s/it]  8%|▊         | 544/6779 [20:06<3:39:31,  2.11s/it]                                                    {'loss': 1.6701, 'learning_rate': 0.0003956542601958087, 'epoch': 0.08}
+  8%|▊         | 544/6779 [20:06<3:39:31,  2.11s/it]  8%|▊         | 545/6779 [20:09<3:54:13,  2.25s/it]                                                    {'loss': 1.7418, 'learning_rate': 0.0003956347343494198, 'epoch': 0.08}
+  8%|▊         | 545/6779 [20:09<3:54:13,  2.25s/it]  8%|▊         | 546/6779 [20:11<3:46:54,  2.18s/it]                                                    {'loss': 1.7193, 'learning_rate': 0.0003956151652194866, 'epoch': 0.08}
+  8%|▊         | 546/6779 [20:11<3:46:54,  2.18s/it]  8%|▊         | 547/6779 [20:13<3:42:06,  2.14s/it]                                                    {'loss': 1.7874, 'learning_rate': 0.0003955955528103389, 'epoch': 0.08}
+  8%|▊         | 547/6779 [20:13<3:42:06,  2.14s/it]  8%|▊         | 548/6779 [20:15<3:45:56,  2.18s/it]                                                    {'loss': 1.7425, 'learning_rate': 0.0003955758971263157, 'epoch': 0.08}
+  8%|▊         | 548/6779 [20:15<3:45:56,  2.18s/it]  8%|▊         | 549/6779 [20:17<3:43:23,  2.15s/it]                                                    {'loss': 1.9046, 'learning_rate': 0.00039555619817176576, 'epoch': 0.08}
+  8%|▊         | 549/6779 [20:17<3:43:23,  2.15s/it]  8%|▊         | 550/6779 [20:20<3:45:10,  2.17s/it]                                                    {'loss': 1.6623, 'learning_rate': 0.00039553645595104747, 'epoch': 0.08}
+  8%|▊         | 550/6779 [20:20<3:45:10,  2.17s/it]  8%|▊         | 551/6779 [20:22<3:40:45,  2.13s/it]                                                    {'loss': 1.7682, 'learning_rate': 0.00039551667046852873, 'epoch': 0.08}
+  8%|▊         | 551/6779 [20:22<3:40:45,  2.13s/it]  8%|▊         | 552/6779 [20:24<3:43:02,  2.15s/it]                                                    {'loss': 1.8296, 'learning_rate': 0.000395496841728587, 'epoch': 0.08}
+  8%|▊         | 552/6779 [20:24<3:43:02,  2.15s/it]  8%|▊         | 553/6779 [20:26<3:42:25,  2.14s/it]                                                    {'loss': 1.8189, 'learning_rate': 0.0003954769697356093, 'epoch': 0.08}
+  8%|▊         | 553/6779 [20:26<3:42:25,  2.14s/it]  8%|▊         | 554/6779 [20:28<3:43:11,  2.15s/it]                                                    {'loss': 1.7958, 'learning_rate': 0.0003954570544939923, 'epoch': 0.08}
+  8%|▊         | 554/6779 [20:28<3:43:11,  2.15s/it]  8%|▊         | 555/6779 [20:30<3:46:04,  2.18s/it]                                                    {'loss': 1.7713, 'learning_rate': 0.00039543709600814214, 'epoch': 0.08}
+  8%|▊         | 555/6779 [20:30<3:46:04,  2.18s/it]  8%|▊         | 556/6779 [20:32<3:42:35,  2.15s/it]                                                    {'loss': 1.7116, 'learning_rate': 0.0003954170942824746, 'epoch': 0.08}
+  8%|▊         | 556/6779 [20:32<3:42:35,  2.15s/it]  8%|▊         | 557/6779 [20:35<3:48:02,  2.20s/it]                                                    {'loss': 1.7419, 'learning_rate': 0.00039539704932141487, 'epoch': 0.08}
+  8%|▊         | 557/6779 [20:35<3:48:02,  2.20s/it]  8%|▊         | 558/6779 [20:37<3:46:39,  2.19s/it]                                                    {'loss': 1.9713, 'learning_rate': 0.00039537696112939804, 'epoch': 0.08}
+  8%|▊         | 558/6779 [20:37<3:46:39,  2.19s/it]  8%|▊         | 559/6779 [20:39<3:44:15,  2.16s/it]                                                    {'loss': 1.9347, 'learning_rate': 0.00039535682971086845, 'epoch': 0.08}
+  8%|▊         | 559/6779 [20:39<3:44:15,  2.16s/it]  8%|▊         | 560/6779 [20:41<3:45:24,  2.17s/it]                                                    {'loss': 1.775, 'learning_rate': 0.00039533665507028007, 'epoch': 0.08}
+  8%|▊         | 560/6779 [20:41<3:45:24,  2.17s/it]  8%|▊         | 561/6779 [20:43<3:41:55,  2.14s/it]                                                    {'loss': 1.73, 'learning_rate': 0.00039531643721209654, 'epoch': 0.08}
+  8%|▊         | 561/6779 [20:43<3:41:55,  2.14s/it]  8%|▊         | 562/6779 [20:46<3:44:32,  2.17s/it]                                                    {'loss': 1.7471, 'learning_rate': 0.000395296176140791, 'epoch': 0.08}
+  8%|▊         | 562/6779 [20:46<3:44:32,  2.17s/it]  8%|▊         | 563/6779 [20:48<3:46:41,  2.19s/it]                                                    {'loss': 1.817, 'learning_rate': 0.00039527587186084605, 'epoch': 0.08}
+  8%|▊         | 563/6779 [20:48<3:46:41,  2.19s/it]  8%|▊         | 564/6779 [20:50<3:49:01,  2.21s/it]                                                    {'loss': 1.7526, 'learning_rate': 0.00039525552437675405, 'epoch': 0.08}
+  8%|▊         | 564/6779 [20:50<3:49:01,  2.21s/it]  8%|▊         | 565/6779 [20:52<3:49:55,  2.22s/it]                                                    {'loss': 1.7034, 'learning_rate': 0.00039523513369301675, 'epoch': 0.08}
+  8%|▊         | 565/6779 [20:52<3:49:55,  2.22s/it]  8%|▊         | 566/6779 [20:54<3:45:23,  2.18s/it]                                                    {'loss': 1.7872, 'learning_rate': 0.00039521469981414556, 'epoch': 0.08}
+  8%|▊         | 566/6779 [20:54<3:45:23,  2.18s/it]  8%|▊         | 567/6779 [20:57<3:46:31,  2.19s/it]                                                    {'loss': 1.8387, 'learning_rate': 0.0003951942227446614, 'epoch': 0.08}
+  8%|▊         | 567/6779 [20:57<3:46:31,  2.19s/it]  8%|▊         | 568/6779 [20:59<3:46:27,  2.19s/it]                                                    {'loss': 1.8827, 'learning_rate': 0.0003951737024890948, 'epoch': 0.08}
+  8%|▊         | 568/6779 [20:59<3:46:27,  2.19s/it]  8%|▊         | 569/6779 [21:01<3:39:55,  2.12s/it]                                                    {'loss': 1.7602, 'learning_rate': 0.00039515313905198567, 'epoch': 0.08}
+  8%|▊         | 569/6779 [21:01<3:39:55,  2.12s/it]  8%|▊         | 570/6779 [21:03<3:39:44,  2.12s/it]                                                    {'loss': 1.6599, 'learning_rate': 0.00039513253243788374, 'epoch': 0.08}
+  8%|▊         | 570/6779 [21:03<3:39:44,  2.12s/it]  8%|▊         | 571/6779 [21:05<3:39:02,  2.12s/it]                                                    {'loss': 1.7409, 'learning_rate': 0.0003951118826513481, 'epoch': 0.08}
+  8%|▊         | 571/6779 [21:05<3:39:02,  2.12s/it]  8%|▊         | 572/6779 [21:07<3:40:46,  2.13s/it]                                                    {'loss': 1.8524, 'learning_rate': 0.00039509118969694736, 'epoch': 0.08}
+  8%|▊         | 572/6779 [21:07<3:40:46,  2.13s/it]  8%|▊         | 573/6779 [21:09<3:39:46,  2.12s/it]                                                    {'loss': 1.718, 'learning_rate': 0.00039507045357926, 'epoch': 0.08}
+  8%|▊         | 573/6779 [21:09<3:39:46,  2.12s/it]  8%|▊         | 574/6779 [21:11<3:43:06,  2.16s/it]                                                    {'loss': 1.8281, 'learning_rate': 0.0003950496743028736, 'epoch': 0.08}
+  8%|▊         | 574/6779 [21:11<3:43:06,  2.16s/it]  8%|▊         | 575/6779 [21:14<3:48:01,  2.21s/it]                                                    {'loss': 1.7044, 'learning_rate': 0.0003950288518723856, 'epoch': 0.08}
+  8%|▊         | 575/6779 [21:14<3:48:01,  2.21s/it]  8%|▊         | 576/6779 [21:16<3:46:04,  2.19s/it]                                                    {'loss': 1.6658, 'learning_rate': 0.0003950079862924028, 'epoch': 0.08}
+  8%|▊         | 576/6779 [21:16<3:46:04,  2.19s/it]  9%|▊         | 577/6779 [21:18<3:45:54,  2.19s/it]                                                    {'loss': 1.8943, 'learning_rate': 0.00039498707756754176, 'epoch': 0.09}
+  9%|▊         | 577/6779 [21:18<3:45:54,  2.19s/it]  9%|▊         | 578/6779 [21:20<3:49:46,  2.22s/it]                                                    {'loss': 1.8424, 'learning_rate': 0.00039496612570242846, 'epoch': 0.09}
+  9%|▊         | 578/6779 [21:20<3:49:46,  2.22s/it]  9%|▊         | 579/6779 [21:22<3:45:08,  2.18s/it]                                                    {'loss': 1.8056, 'learning_rate': 0.00039494513070169833, 'epoch': 0.09}
+  9%|▊         | 579/6779 [21:22<3:45:08,  2.18s/it]  9%|▊         | 580/6779 [21:25<3:47:14,  2.20s/it]                                                    {'loss': 1.7077, 'learning_rate': 0.0003949240925699966, 'epoch': 0.09}
+  9%|▊         | 580/6779 [21:25<3:47:14,  2.20s/it]  9%|▊         | 581/6779 [21:27<3:41:35,  2.15s/it]                                                    {'loss': 1.7672, 'learning_rate': 0.0003949030113119777, 'epoch': 0.09}
+  9%|▊         | 581/6779 [21:27<3:41:35,  2.15s/it]  9%|▊         | 582/6779 [21:29<3:51:40,  2.24s/it]                                                    {'loss': 1.8221, 'learning_rate': 0.00039488188693230595, 'epoch': 0.09}
+  9%|▊         | 582/6779 [21:29<3:51:40,  2.24s/it]  9%|▊         | 583/6779 [21:31<3:42:05,  2.15s/it]                                                    {'loss': 1.6537, 'learning_rate': 0.00039486071943565495, 'epoch': 0.09}
+  9%|▊         | 583/6779 [21:31<3:42:05,  2.15s/it]  9%|▊         | 584/6779 [21:33<3:44:22,  2.17s/it]                                                    {'loss': 1.7519, 'learning_rate': 0.00039483950882670805, 'epoch': 0.09}
+  9%|▊         | 584/6779 [21:33<3:44:22,  2.17s/it]  9%|▊         | 585/6779 [21:36<3:47:57,  2.21s/it]                                                    {'loss': 1.7035, 'learning_rate': 0.0003948182551101579, 'epoch': 0.09}
+  9%|▊         | 585/6779 [21:36<3:47:57,  2.21s/it]  9%|▊         | 586/6779 [21:38<3:50:21,  2.23s/it]                                                    {'loss': 1.7506, 'learning_rate': 0.00039479695829070687, 'epoch': 0.09}
+  9%|▊         | 586/6779 [21:38<3:50:21,  2.23s/it]  9%|▊         | 587/6779 [21:40<3:51:44,  2.25s/it]                                                    {'loss': 1.7805, 'learning_rate': 0.0003947756183730668, 'epoch': 0.09}
+  9%|▊         | 587/6779 [21:40<3:51:44,  2.25s/it]  9%|▊         | 588/6779 [21:42<3:43:08,  2.16s/it]                                                    {'loss': 1.7556, 'learning_rate': 0.0003947542353619591, 'epoch': 0.09}
+  9%|▊         | 588/6779 [21:42<3:43:08,  2.16s/it]  9%|▊         | 589/6779 [21:44<3:46:15,  2.19s/it]                                                    {'loss': 1.9552, 'learning_rate': 0.0003947328092621147, 'epoch': 0.09}
+  9%|▊         | 589/6779 [21:44<3:46:15,  2.19s/it]  9%|▊         | 590/6779 [21:47<3:46:39,  2.20s/it]                                                    {'loss': 1.7991, 'learning_rate': 0.00039471134007827404, 'epoch': 0.09}
+  9%|▊         | 590/6779 [21:47<3:46:39,  2.20s/it]  9%|▊         | 591/6779 [21:49<3:47:07,  2.20s/it]                                                    {'loss': 1.8624, 'learning_rate': 0.00039468982781518705, 'epoch': 0.09}
+  9%|▊         | 591/6779 [21:49<3:47:07,  2.20s/it]  9%|▊         | 592/6779 [21:51<3:49:19,  2.22s/it]                                                    {'loss': 1.9038, 'learning_rate': 0.00039466827247761337, 'epoch': 0.09}
+  9%|▊         | 592/6779 [21:51<3:49:19,  2.22s/it]  9%|▊         | 593/6779 [21:54<3:59:25,  2.32s/it]                                                    {'loss': 1.9206, 'learning_rate': 0.0003946466740703219, 'epoch': 0.09}
+  9%|▊         | 593/6779 [21:54<3:59:25,  2.32s/it]  9%|▉         | 594/6779 [21:56<3:50:36,  2.24s/it]                                                    {'loss': 1.9064, 'learning_rate': 0.00039462503259809134, 'epoch': 0.09}
+  9%|▉         | 594/6779 [21:56<3:50:36,  2.24s/it]  9%|▉         | 595/6779 [21:58<3:46:33,  2.20s/it]                                                    {'loss': 1.7476, 'learning_rate': 0.0003946033480657097, 'epoch': 0.09}
+  9%|▉         | 595/6779 [21:58<3:46:33,  2.20s/it]  9%|▉         | 596/6779 [22:00<3:48:42,  2.22s/it]                                                    {'loss': 1.7746, 'learning_rate': 0.0003945816204779747, 'epoch': 0.09}
+  9%|▉         | 596/6779 [22:00<3:48:42,  2.22s/it]  9%|▉         | 597/6779 [22:02<3:49:29,  2.23s/it]                                                    {'loss': 1.7362, 'learning_rate': 0.00039455984983969346, 'epoch': 0.09}
+  9%|▉         | 597/6779 [22:02<3:49:29,  2.23s/it]  9%|▉         | 598/6779 [22:05<3:47:30,  2.21s/it]                                                    {'loss': 1.7308, 'learning_rate': 0.00039453803615568266, 'epoch': 0.09}
+  9%|▉         | 598/6779 [22:05<3:47:30,  2.21s/it]  9%|▉         | 599/6779 [22:07<3:49:42,  2.23s/it]                                                    {'loss': 1.6835, 'learning_rate': 0.00039451617943076845, 'epoch': 0.09}
+  9%|▉         | 599/6779 [22:07<3:49:42,  2.23s/it]  9%|▉         | 600/6779 [22:09<3:42:36,  2.16s/it]                                                    {'loss': 1.7648, 'learning_rate': 0.0003944942796697867, 'epoch': 0.09}
+  9%|▉         | 600/6779 [22:09<3:42:36,  2.16s/it]  9%|▉         | 601/6779 [22:11<3:40:27,  2.14s/it]                                                    {'loss': 1.7818, 'learning_rate': 0.0003944723368775825, 'epoch': 0.09}
+  9%|▉         | 601/6779 [22:11<3:40:27,  2.14s/it]  9%|▉         | 602/6779 [22:13<3:34:01,  2.08s/it]                                                    {'loss': 1.7973, 'learning_rate': 0.0003944503510590107, 'epoch': 0.09}
+  9%|▉         | 602/6779 [22:13<3:34:01,  2.08s/it]  9%|▉         | 603/6779 [22:15<3:44:24,  2.18s/it]                                                    {'loss': 1.9494, 'learning_rate': 0.00039442832221893567, 'epoch': 0.09}
+  9%|▉         | 603/6779 [22:15<3:44:24,  2.18s/it]  9%|▉         | 604/6779 [22:18<3:49:09,  2.23s/it]                                                    {'loss': 1.7235, 'learning_rate': 0.00039440625036223103, 'epoch': 0.09}
+  9%|▉         | 604/6779 [22:18<3:49:09,  2.23s/it]  9%|▉         | 605/6779 [22:20<3:43:10,  2.17s/it]                                                    {'loss': 1.6461, 'learning_rate': 0.00039438413549378027, 'epoch': 0.09}
+  9%|▉         | 605/6779 [22:20<3:43:10,  2.17s/it]  9%|▉         | 606/6779 [22:22<3:41:58,  2.16s/it]                                                    {'loss': 1.8894, 'learning_rate': 0.00039436197761847616, 'epoch': 0.09}
+  9%|▉         | 606/6779 [22:22<3:41:58,  2.16s/it]  9%|▉         | 607/6779 [22:24<3:42:37,  2.16s/it]                                                    {'loss': 1.7474, 'learning_rate': 0.00039433977674122105, 'epoch': 0.09}
+  9%|▉         | 607/6779 [22:24<3:42:37,  2.16s/it]  9%|▉         | 608/6779 [22:26<3:39:25,  2.13s/it]                                                    {'loss': 1.7687, 'learning_rate': 0.0003943175328669269, 'epoch': 0.09}
+  9%|▉         | 608/6779 [22:26<3:39:25,  2.13s/it]  9%|▉         | 609/6779 [22:28<3:46:15,  2.20s/it]                                                    {'loss': 1.8025, 'learning_rate': 0.00039429524600051495, 'epoch': 0.09}
+  9%|▉         | 609/6779 [22:28<3:46:15,  2.20s/it]  9%|▉         | 610/6779 [22:30<3:40:34,  2.15s/it]                                                    {'loss': 1.8003, 'learning_rate': 0.0003942729161469162, 'epoch': 0.09}
+  9%|▉         | 610/6779 [22:30<3:40:34,  2.15s/it]  9%|▉         | 611/6779 [22:32<3:37:09,  2.11s/it]                                                    {'loss': 1.8271, 'learning_rate': 0.000394250543311071, 'epoch': 0.09}
+  9%|▉         | 611/6779 [22:32<3:37:09,  2.11s/it]  9%|▉         | 612/6779 [22:35<3:38:12,  2.12s/it]                                                    {'loss': 1.7797, 'learning_rate': 0.0003942281274979293, 'epoch': 0.09}
+  9%|▉         | 612/6779 [22:35<3:38:12,  2.12s/it]  9%|▉         | 613/6779 [22:37<3:40:09,  2.14s/it]                                                    {'loss': 1.7347, 'learning_rate': 0.0003942056687124506, 'epoch': 0.09}
+  9%|▉         | 613/6779 [22:37<3:40:09,  2.14s/it]  9%|▉         | 614/6779 [22:39<3:43:55,  2.18s/it]                                                    {'loss': 1.7033, 'learning_rate': 0.0003941831669596037, 'epoch': 0.09}
+  9%|▉         | 614/6779 [22:39<3:43:55,  2.18s/it]  9%|▉         | 615/6779 [22:42<4:02:04,  2.36s/it]                                                    {'loss': 1.9121, 'learning_rate': 0.0003941606222443671, 'epoch': 0.09}
+  9%|▉         | 615/6779 [22:42<4:02:04,  2.36s/it]  9%|▉         | 616/6779 [22:44<3:56:28,  2.30s/it]                                                    {'loss': 1.7977, 'learning_rate': 0.0003941380345717287, 'epoch': 0.09}
+  9%|▉         | 616/6779 [22:44<3:56:28,  2.30s/it]  9%|▉         | 617/6779 [22:46<3:54:26,  2.28s/it]                                                    {'loss': 1.8368, 'learning_rate': 0.000394115403946686, 'epoch': 0.09}
+  9%|▉         | 617/6779 [22:46<3:54:26,  2.28s/it]  9%|▉         | 618/6779 [22:48<3:50:51,  2.25s/it]                                                    {'loss': 1.7594, 'learning_rate': 0.000394092730374246, 'epoch': 0.09}
+  9%|▉         | 618/6779 [22:48<3:50:51,  2.25s/it]  9%|▉         | 619/6779 [22:51<3:48:23,  2.22s/it]                                                    {'loss': 1.881, 'learning_rate': 0.00039407001385942505, 'epoch': 0.09}
+  9%|▉         | 619/6779 [22:51<3:48:23,  2.22s/it]  9%|▉         | 620/6779 [22:53<3:51:02,  2.25s/it]                                                    {'loss': 1.6392, 'learning_rate': 0.0003940472544072491, 'epoch': 0.09}
+  9%|▉         | 620/6779 [22:53<3:51:02,  2.25s/it]  9%|▉         | 621/6779 [22:55<3:45:54,  2.20s/it]                                                    {'loss': 1.8244, 'learning_rate': 0.00039402445202275373, 'epoch': 0.09}
+  9%|▉         | 621/6779 [22:55<3:45:54,  2.20s/it]  9%|▉         | 622/6779 [22:57<3:44:15,  2.19s/it]                                                    {'loss': 1.9341, 'learning_rate': 0.00039400160671098375, 'epoch': 0.09}
+  9%|▉         | 622/6779 [22:57<3:44:15,  2.19s/it]  9%|▉         | 623/6779 [22:59<3:45:20,  2.20s/it]                                                    {'loss': 1.5803, 'learning_rate': 0.0003939787184769937, 'epoch': 0.09}
+  9%|▉         | 623/6779 [22:59<3:45:20,  2.20s/it]  9%|▉         | 624/6779 [23:01<3:42:53,  2.17s/it]                                                    {'loss': 1.9318, 'learning_rate': 0.0003939557873258475, 'epoch': 0.09}
+  9%|▉         | 624/6779 [23:01<3:42:53,  2.17s/it]  9%|▉         | 625/6779 [23:04<3:43:43,  2.18s/it]                                                    {'loss': 1.7603, 'learning_rate': 0.00039393281326261854, 'epoch': 0.09}
+  9%|▉         | 625/6779 [23:04<3:43:43,  2.18s/it]  9%|▉         | 626/6779 [23:06<3:41:23,  2.16s/it]                                                    {'loss': 1.7598, 'learning_rate': 0.0003939097962923899, 'epoch': 0.09}
+  9%|▉         | 626/6779 [23:06<3:41:23,  2.16s/it]  9%|▉         | 627/6779 [23:08<3:44:18,  2.19s/it]                                                    {'loss': 1.898, 'learning_rate': 0.00039388673642025385, 'epoch': 0.09}
+  9%|▉         | 627/6779 [23:08<3:44:18,  2.19s/it]  9%|▉         | 628/6779 [23:10<3:45:12,  2.20s/it]                                                    {'loss': 1.603, 'learning_rate': 0.0003938636336513124, 'epoch': 0.09}
+  9%|▉         | 628/6779 [23:10<3:45:12,  2.20s/it]  9%|▉         | 629/6779 [23:13<3:50:41,  2.25s/it]                                                    {'loss': 1.7666, 'learning_rate': 0.0003938404879906769, 'epoch': 0.09}
+  9%|▉         | 629/6779 [23:13<3:50:41,  2.25s/it]  9%|▉         | 630/6779 [23:16<4:11:19,  2.45s/it]                                                    {'loss': 1.7157, 'learning_rate': 0.00039381729944346837, 'epoch': 0.09}
+  9%|▉         | 630/6779 [23:16<4:11:19,  2.45s/it]  9%|▉         | 631/6779 [23:18<4:09:29,  2.43s/it]                                                    {'loss': 1.6146, 'learning_rate': 0.00039379406801481713, 'epoch': 0.09}
+  9%|▉         | 631/6779 [23:18<4:09:29,  2.43s/it]  9%|▉         | 632/6779 [23:20<4:03:09,  2.37s/it]                                                    {'loss': 1.7091, 'learning_rate': 0.00039377079370986296, 'epoch': 0.09}
+  9%|▉         | 632/6779 [23:20<4:03:09,  2.37s/it]  9%|▉         | 633/6779 [23:23<4:05:16,  2.39s/it]                                                    {'loss': 1.8471, 'learning_rate': 0.0003937474765337554, 'epoch': 0.09}
+  9%|▉         | 633/6779 [23:23<4:05:16,  2.39s/it]  9%|▉         | 634/6779 [23:25<3:55:45,  2.30s/it]                                                    {'loss': 1.824, 'learning_rate': 0.00039372411649165316, 'epoch': 0.09}
+  9%|▉         | 634/6779 [23:25<3:55:45,  2.30s/it]  9%|▉         | 635/6779 [23:27<3:48:27,  2.23s/it]                                                    {'loss': 1.6942, 'learning_rate': 0.0003937007135887246, 'epoch': 0.09}
+  9%|▉         | 635/6779 [23:27<3:48:27,  2.23s/it]  9%|▉         | 636/6779 [23:29<3:52:13,  2.27s/it]                                                    {'loss': 1.9742, 'learning_rate': 0.0003936772678301476, 'epoch': 0.09}
+  9%|▉         | 636/6779 [23:29<3:52:13,  2.27s/it]  9%|▉         | 637/6779 [23:31<3:54:51,  2.29s/it]                                                    {'loss': 1.6744, 'learning_rate': 0.00039365377922110945, 'epoch': 0.09}
+  9%|▉         | 637/6779 [23:31<3:54:51,  2.29s/it]  9%|▉         | 638/6779 [23:34<3:49:01,  2.24s/it]                                                    {'loss': 1.7982, 'learning_rate': 0.0003936302477668068, 'epoch': 0.09}
+  9%|▉         | 638/6779 [23:34<3:49:01,  2.24s/it]  9%|▉         | 639/6779 [23:36<3:53:07,  2.28s/it]                                                    {'loss': 1.7557, 'learning_rate': 0.0003936066734724461, 'epoch': 0.09}
+  9%|▉         | 639/6779 [23:36<3:53:07,  2.28s/it]  9%|▉         | 640/6779 [23:38<3:43:09,  2.18s/it]                                                    {'loss': 1.8011, 'learning_rate': 0.000393583056343243, 'epoch': 0.09}
+  9%|▉         | 640/6779 [23:38<3:43:09,  2.18s/it]  9%|▉         | 641/6779 [23:40<3:45:28,  2.20s/it]                                                    {'loss': 1.8658, 'learning_rate': 0.0003935593963844226, 'epoch': 0.09}
+  9%|▉         | 641/6779 [23:40<3:45:28,  2.20s/it]  9%|▉         | 642/6779 [23:42<3:48:04,  2.23s/it]                                                    {'loss': 1.8232, 'learning_rate': 0.0003935356936012198, 'epoch': 0.09}
+  9%|▉         | 642/6779 [23:42<3:48:04,  2.23s/it]  9%|▉         | 643/6779 [23:45<3:47:45,  2.23s/it]                                                    {'loss': 1.6556, 'learning_rate': 0.0003935119479988786, 'epoch': 0.09}
+  9%|▉         | 643/6779 [23:45<3:47:45,  2.23s/it]  9%|▉         | 644/6779 [23:47<3:46:22,  2.21s/it]                                                    {'loss': 1.8603, 'learning_rate': 0.0003934881595826527, 'epoch': 0.09}
+  9%|▉         | 644/6779 [23:47<3:46:22,  2.21s/it] 10%|▉         | 645/6779 [23:49<3:40:24,  2.16s/it]                                                    {'loss': 1.8944, 'learning_rate': 0.00039346432835780514, 'epoch': 0.1}
+ 10%|▉         | 645/6779 [23:49<3:40:24,  2.16s/it] 10%|▉         | 646/6779 [23:51<3:43:44,  2.19s/it]                                                    {'loss': 1.6288, 'learning_rate': 0.00039344045432960866, 'epoch': 0.1}
+ 10%|▉         | 646/6779 [23:51<3:43:44,  2.19s/it] 10%|▉         | 647/6779 [23:53<3:43:33,  2.19s/it]                                                    {'loss': 1.9315, 'learning_rate': 0.0003934165375033451, 'epoch': 0.1}
+ 10%|▉         | 647/6779 [23:53<3:43:33,  2.19s/it] 10%|▉         | 648/6779 [23:56<3:47:10,  2.22s/it]                                                    {'loss': 1.8987, 'learning_rate': 0.00039339257788430617, 'epoch': 0.1}
+ 10%|▉         | 648/6779 [23:56<3:47:10,  2.22s/it] 10%|▉         | 649/6779 [23:58<3:46:48,  2.22s/it]                                                    {'loss': 1.6569, 'learning_rate': 0.00039336857547779276, 'epoch': 0.1}
+ 10%|▉         | 649/6779 [23:58<3:46:48,  2.22s/it] 10%|▉         | 650/6779 [24:00<3:52:49,  2.28s/it]                                                    {'loss': 1.7239, 'learning_rate': 0.0003933445302891153, 'epoch': 0.1}
+ 10%|▉         | 650/6779 [24:00<3:52:49,  2.28s/it] 10%|▉         | 651/6779 [24:03<3:55:46,  2.31s/it]                                                    {'loss': 1.9766, 'learning_rate': 0.0003933204423235938, 'epoch': 0.1}
+ 10%|▉         | 651/6779 [24:03<3:55:46,  2.31s/it] 10%|▉         | 652/6779 [24:05<3:52:25,  2.28s/it]                                                    {'loss': 1.8746, 'learning_rate': 0.0003932963115865576, 'epoch': 0.1}
+ 10%|▉         | 652/6779 [24:05<3:52:25,  2.28s/it] 10%|▉         | 653/6779 [24:07<3:48:12,  2.24s/it]                                                    {'loss': 1.8845, 'learning_rate': 0.00039327213808334544, 'epoch': 0.1}
+ 10%|▉         | 653/6779 [24:07<3:48:12,  2.24s/it] 10%|▉         | 654/6779 [24:09<3:53:07,  2.28s/it]                                                    {'loss': 1.8293, 'learning_rate': 0.00039324792181930584, 'epoch': 0.1}
+ 10%|▉         | 654/6779 [24:09<3:53:07,  2.28s/it] 10%|▉         | 655/6779 [24:11<3:48:44,  2.24s/it]                                                    {'loss': 1.8071, 'learning_rate': 0.00039322366279979644, 'epoch': 0.1}
+ 10%|▉         | 655/6779 [24:11<3:48:44,  2.24s/it] 10%|▉         | 656/6779 [24:14<3:47:02,  2.22s/it]                                                    {'loss': 1.6595, 'learning_rate': 0.0003931993610301845, 'epoch': 0.1}
+ 10%|▉         | 656/6779 [24:14<3:47:02,  2.22s/it] 10%|▉         | 657/6779 [24:16<3:41:10,  2.17s/it]                                                    {'loss': 1.6616, 'learning_rate': 0.0003931750165158466, 'epoch': 0.1}
+ 10%|▉         | 657/6779 [24:16<3:41:10,  2.17s/it] 10%|▉         | 658/6779 [24:18<3:44:06,  2.20s/it]                                                    {'loss': 1.7848, 'learning_rate': 0.00039315062926216905, 'epoch': 0.1}
+ 10%|▉         | 658/6779 [24:18<3:44:06,  2.20s/it] 10%|▉         | 659/6779 [24:20<3:40:40,  2.16s/it]                                                    {'loss': 1.6559, 'learning_rate': 0.0003931261992745474, 'epoch': 0.1}
+ 10%|▉         | 659/6779 [24:20<3:40:40,  2.16s/it] 10%|▉         | 660/6779 [24:22<3:42:31,  2.18s/it]                                                    {'loss': 1.874, 'learning_rate': 0.0003931017265583866, 'epoch': 0.1}
+ 10%|▉         | 660/6779 [24:22<3:42:31,  2.18s/it] 10%|▉         | 661/6779 [24:24<3:42:22,  2.18s/it]                                                    {'loss': 1.7907, 'learning_rate': 0.0003930772111191013, 'epoch': 0.1}
+ 10%|▉         | 661/6779 [24:24<3:42:22,  2.18s/it] 10%|▉         | 662/6779 [24:27<3:44:43,  2.20s/it]                                                    {'loss': 1.7394, 'learning_rate': 0.0003930526529621154, 'epoch': 0.1}
+ 10%|▉         | 662/6779 [24:27<3:44:43,  2.20s/it] 10%|▉         | 663/6779 [24:29<3:44:15,  2.20s/it]                                                    {'loss': 1.8215, 'learning_rate': 0.00039302805209286227, 'epoch': 0.1}
+ 10%|▉         | 663/6779 [24:29<3:44:15,  2.20s/it] 10%|▉         | 664/6779 [24:32<3:58:03,  2.34s/it]                                                    {'loss': 1.7144, 'learning_rate': 0.0003930034085167848, 'epoch': 0.1}
+ 10%|▉         | 664/6779 [24:32<3:58:03,  2.34s/it] 10%|▉         | 665/6779 [24:34<3:50:12,  2.26s/it]                                                    {'loss': 1.6354, 'learning_rate': 0.0003929787222393354, 'epoch': 0.1}
+ 10%|▉         | 665/6779 [24:34<3:50:12,  2.26s/it] 10%|▉         | 666/6779 [24:36<3:48:58,  2.25s/it]                                                    {'loss': 1.8895, 'learning_rate': 0.0003929539932659757, 'epoch': 0.1}
+ 10%|▉         | 666/6779 [24:36<3:48:58,  2.25s/it] 10%|▉         | 667/6779 [24:38<3:42:59,  2.19s/it]                                                    {'loss': 1.8758, 'learning_rate': 0.0003929292216021769, 'epoch': 0.1}
+ 10%|▉         | 667/6779 [24:38<3:42:59,  2.19s/it] 10%|▉         | 668/6779 [24:40<3:43:29,  2.19s/it]                                                    {'loss': 1.7979, 'learning_rate': 0.00039290440725341975, 'epoch': 0.1}
+ 10%|▉         | 668/6779 [24:40<3:43:29,  2.19s/it] 10%|▉         | 669/6779 [24:43<3:49:32,  2.25s/it]                                                    {'loss': 1.762, 'learning_rate': 0.00039287955022519424, 'epoch': 0.1}
+ 10%|▉         | 669/6779 [24:43<3:49:32,  2.25s/it] 10%|▉         | 670/6779 [24:45<3:46:07,  2.22s/it]                                                    {'loss': 1.6985, 'learning_rate': 0.000392854650523, 'epoch': 0.1}
+ 10%|▉         | 670/6779 [24:45<3:46:07,  2.22s/it] 10%|▉         | 671/6779 [24:47<3:44:27,  2.20s/it]                                                    {'loss': 1.6646, 'learning_rate': 0.000392829708152346, 'epoch': 0.1}
+ 10%|▉         | 671/6779 [24:47<3:44:27,  2.20s/it] 10%|▉         | 672/6779 [24:49<3:45:52,  2.22s/it]                                                    {'loss': 1.8946, 'learning_rate': 0.00039280472311875055, 'epoch': 0.1}
+ 10%|▉         | 672/6779 [24:49<3:45:52,  2.22s/it] 10%|▉         | 673/6779 [24:51<3:49:26,  2.25s/it]                                                    {'loss': 1.6791, 'learning_rate': 0.0003927796954277416, 'epoch': 0.1}
+ 10%|▉         | 673/6779 [24:51<3:49:26,  2.25s/it] 10%|▉         | 674/6779 [24:54<3:51:39,  2.28s/it]                                                    {'loss': 1.849, 'learning_rate': 0.0003927546250848564, 'epoch': 0.1}
+ 10%|▉         | 674/6779 [24:54<3:51:39,  2.28s/it] 10%|▉         | 675/6779 [24:56<3:40:36,  2.17s/it]                                                    {'loss': 1.5823, 'learning_rate': 0.00039272951209564174, 'epoch': 0.1}
+ 10%|▉         | 675/6779 [24:56<3:40:36,  2.17s/it] 10%|▉         | 676/6779 [24:58<3:37:42,  2.14s/it]                                                    {'loss': 1.8089, 'learning_rate': 0.0003927043564656538, 'epoch': 0.1}
+ 10%|▉         | 676/6779 [24:58<3:37:42,  2.14s/it] 10%|▉         | 677/6779 [25:00<3:33:39,  2.10s/it]                                                    {'loss': 1.6028, 'learning_rate': 0.00039267915820045805, 'epoch': 0.1}
+ 10%|▉         | 677/6779 [25:00<3:33:39,  2.10s/it] 10%|█         | 678/6779 [25:02<3:37:22,  2.14s/it]                                                    {'loss': 1.7725, 'learning_rate': 0.0003926539173056296, 'epoch': 0.1}
+ 10%|█         | 678/6779 [25:02<3:37:22,  2.14s/it] 10%|█         | 679/6779 [25:04<3:40:07,  2.17s/it]                                                    {'loss': 1.7096, 'learning_rate': 0.00039262863378675296, 'epoch': 0.1}
+ 10%|█         | 679/6779 [25:04<3:40:07,  2.17s/it] 10%|█         | 680/6779 [25:07<3:50:36,  2.27s/it]                                                    {'loss': 1.8553, 'learning_rate': 0.000392603307649422, 'epoch': 0.1}
+ 10%|█         | 680/6779 [25:07<3:50:36,  2.27s/it] 10%|█         | 681/6779 [25:09<3:50:00,  2.26s/it]                                                    {'loss': 1.6939, 'learning_rate': 0.00039257793889923995, 'epoch': 0.1}
+ 10%|█         | 681/6779 [25:09<3:50:00,  2.26s/it] 10%|█         | 682/6779 [25:11<3:58:09,  2.34s/it]                                                    {'loss': 1.8044, 'learning_rate': 0.00039255252754181975, 'epoch': 0.1}
+ 10%|█         | 682/6779 [25:11<3:58:09,  2.34s/it] 10%|█         | 683/6779 [25:14<4:03:40,  2.40s/it]                                                    {'loss': 1.7454, 'learning_rate': 0.00039252707358278336, 'epoch': 0.1}
+ 10%|█         | 683/6779 [25:14<4:03:40,  2.40s/it] 10%|█         | 684/6779 [25:16<3:56:59,  2.33s/it]                                                    {'loss': 1.9034, 'learning_rate': 0.0003925015770277626, 'epoch': 0.1}
+ 10%|█         | 684/6779 [25:16<3:56:59,  2.33s/it] 10%|█         | 685/6779 [25:19<3:56:56,  2.33s/it]                                                    {'loss': 1.7624, 'learning_rate': 0.0003924760378823984, 'epoch': 0.1}
+ 10%|█         | 685/6779 [25:19<3:56:56,  2.33s/it] 10%|█         | 686/6779 [25:21<3:59:06,  2.35s/it]                                                    {'loss': 1.7312, 'learning_rate': 0.00039245045615234113, 'epoch': 0.1}
+ 10%|█         | 686/6779 [25:21<3:59:06,  2.35s/it] 10%|█         | 687/6779 [25:23<3:51:35,  2.28s/it]                                                    {'loss': 1.7426, 'learning_rate': 0.00039242483184325074, 'epoch': 0.1}
+ 10%|█         | 687/6779 [25:23<3:51:35,  2.28s/it] 10%|█         | 688/6779 [25:25<3:44:55,  2.22s/it]                                                    {'loss': 1.6026, 'learning_rate': 0.00039239916496079663, 'epoch': 0.1}
+ 10%|█         | 688/6779 [25:25<3:44:55,  2.22s/it] 10%|█         | 689/6779 [25:27<3:35:11,  2.12s/it]                                                    {'loss': 1.7428, 'learning_rate': 0.00039237345551065736, 'epoch': 0.1}
+ 10%|█         | 689/6779 [25:27<3:35:11,  2.12s/it] 10%|█         | 690/6779 [25:29<3:39:22,  2.16s/it]                                                    {'loss': 1.8156, 'learning_rate': 0.0003923477034985211, 'epoch': 0.1}
+ 10%|█         | 690/6779 [25:29<3:39:22,  2.16s/it] 10%|█         | 691/6779 [25:31<3:38:02,  2.15s/it]                                                    {'loss': 1.7864, 'learning_rate': 0.0003923219089300854, 'epoch': 0.1}
+ 10%|█         | 691/6779 [25:31<3:38:02,  2.15s/it] 10%|█         | 692/6779 [25:34<3:53:35,  2.30s/it]                                                    {'loss': 1.7577, 'learning_rate': 0.00039229607181105725, 'epoch': 0.1}
+ 10%|█         | 692/6779 [25:34<3:53:35,  2.30s/it] 10%|█         | 693/6779 [25:37<4:02:11,  2.39s/it]                                                    {'loss': 1.8737, 'learning_rate': 0.000392270192147153, 'epoch': 0.1}
+ 10%|█         | 693/6779 [25:37<4:02:11,  2.39s/it] 10%|█         | 694/6779 [25:39<3:59:25,  2.36s/it]                                                    {'loss': 1.7715, 'learning_rate': 0.0003922442699440985, 'epoch': 0.1}
+ 10%|█         | 694/6779 [25:39<3:59:25,  2.36s/it] 10%|█         | 695/6779 [25:41<3:48:50,  2.26s/it]                                                    {'loss': 1.705, 'learning_rate': 0.00039221830520762887, 'epoch': 0.1}
+ 10%|█         | 695/6779 [25:41<3:48:50,  2.26s/it] 10%|█         | 696/6779 [25:43<3:47:46,  2.25s/it]                                                    {'loss': 1.8942, 'learning_rate': 0.00039219229794348876, 'epoch': 0.1}
+ 10%|█         | 696/6779 [25:43<3:47:46,  2.25s/it] 10%|█         | 697/6779 [25:45<3:42:42,  2.20s/it]                                                    {'loss': 1.8134, 'learning_rate': 0.0003921662481574322, 'epoch': 0.1}
+ 10%|█         | 697/6779 [25:45<3:42:42,  2.20s/it] 10%|█         | 698/6779 [25:47<3:43:01,  2.20s/it]                                                    {'loss': 1.7587, 'learning_rate': 0.00039214015585522263, 'epoch': 0.1}
+ 10%|█         | 698/6779 [25:47<3:43:01,  2.20s/it] 10%|█         | 699/6779 [25:50<3:42:14,  2.19s/it]                                                    {'loss': 1.7706, 'learning_rate': 0.00039211402104263285, 'epoch': 0.1}
+ 10%|█         | 699/6779 [25:50<3:42:14,  2.19s/it] 10%|█         | 700/6779 [25:52<3:42:27,  2.20s/it]                                                    {'loss': 2.0668, 'learning_rate': 0.00039208784372544514, 'epoch': 0.1}
+ 10%|█         | 700/6779 [25:52<3:42:27,  2.20s/it] 10%|█         | 701/6779 [25:54<3:40:38,  2.18s/it]                                                    {'loss': 1.8216, 'learning_rate': 0.00039206162390945115, 'epoch': 0.1}
+ 10%|█         | 701/6779 [25:54<3:40:38,  2.18s/it] 10%|█         | 702/6779 [25:56<3:42:23,  2.20s/it]                                                    {'loss': 1.866, 'learning_rate': 0.00039203536160045183, 'epoch': 0.1}
+ 10%|█         | 702/6779 [25:56<3:42:23,  2.20s/it] 10%|█         | 703/6779 [25:58<3:40:46,  2.18s/it]                                                    {'loss': 1.9576, 'learning_rate': 0.0003920090568042577, 'epoch': 0.1}
+ 10%|█         | 703/6779 [25:58<3:40:46,  2.18s/it] 10%|█         | 704/6779 [26:01<3:41:31,  2.19s/it]                                                    {'loss': 1.6466, 'learning_rate': 0.0003919827095266887, 'epoch': 0.1}
+ 10%|█         | 704/6779 [26:01<3:41:31,  2.19s/it] 10%|█         | 705/6779 [26:03<3:40:31,  2.18s/it]                                                    {'loss': 1.8085, 'learning_rate': 0.00039195631977357394, 'epoch': 0.1}
+ 10%|█         | 705/6779 [26:03<3:40:31,  2.18s/it] 10%|█         | 706/6779 [26:05<3:43:23,  2.21s/it]                                                    {'loss': 1.825, 'learning_rate': 0.00039192988755075214, 'epoch': 0.1}
+ 10%|█         | 706/6779 [26:05<3:43:23,  2.21s/it] 10%|█         | 707/6779 [26:07<3:41:18,  2.19s/it]                                                    {'loss': 1.6463, 'learning_rate': 0.00039190341286407125, 'epoch': 0.1}
+ 10%|█         | 707/6779 [26:07<3:41:18,  2.19s/it] 10%|█         | 708/6779 [26:09<3:39:35,  2.17s/it]                                                    {'loss': 1.8484, 'learning_rate': 0.0003918768957193889, 'epoch': 0.1}
+ 10%|█         | 708/6779 [26:09<3:39:35,  2.17s/it] 10%|█         | 709/6779 [26:11<3:41:12,  2.19s/it]                                                    {'loss': 1.8845, 'learning_rate': 0.0003918503361225717, 'epoch': 0.1}
+ 10%|█         | 709/6779 [26:11<3:41:12,  2.19s/it] 10%|█         | 710/6779 [26:14<3:45:29,  2.23s/it]                                                    {'loss': 1.7638, 'learning_rate': 0.000391823734079496, 'epoch': 0.1}
+ 10%|█         | 710/6779 [26:14<3:45:29,  2.23s/it] 10%|█         | 711/6779 [26:16<3:40:07,  2.18s/it]                                                    {'loss': 1.8003, 'learning_rate': 0.0003917970895960474, 'epoch': 0.1}
+ 10%|█         | 711/6779 [26:16<3:40:07,  2.18s/it] 11%|█         | 712/6779 [26:18<3:36:09,  2.14s/it]                                                    {'loss': 1.7624, 'learning_rate': 0.0003917704026781209, 'epoch': 0.11}
+ 11%|█         | 712/6779 [26:18<3:36:09,  2.14s/it] 11%|█         | 713/6779 [26:20<3:35:55,  2.14s/it]                                                    {'loss': 1.8087, 'learning_rate': 0.0003917436733316209, 'epoch': 0.11}
+ 11%|█         | 713/6779 [26:20<3:35:55,  2.14s/it] 11%|█         | 714/6779 [26:22<3:44:21,  2.22s/it]                                                    {'loss': 1.8672, 'learning_rate': 0.00039171690156246115, 'epoch': 0.11}
+ 11%|█         | 714/6779 [26:22<3:44:21,  2.22s/it] 11%|█         | 715/6779 [26:25<3:51:14,  2.29s/it]                                                    {'loss': 1.9848, 'learning_rate': 0.00039169008737656484, 'epoch': 0.11}
+ 11%|█         | 715/6779 [26:25<3:51:14,  2.29s/it] 11%|█         | 716/6779 [26:27<3:47:22,  2.25s/it]                                                    {'loss': 1.6232, 'learning_rate': 0.0003916632307798645, 'epoch': 0.11}
+ 11%|█         | 716/6779 [26:27<3:47:22,  2.25s/it] 11%|█         | 717/6779 [26:29<3:43:10,  2.21s/it]                                                    {'loss': 1.7847, 'learning_rate': 0.0003916363317783021, 'epoch': 0.11}
+ 11%|█         | 717/6779 [26:29<3:43:10,  2.21s/it] 11%|█         | 718/6779 [26:31<3:40:59,  2.19s/it]                                                    {'loss': 1.8966, 'learning_rate': 0.00039160939037782887, 'epoch': 0.11}
+ 11%|█         | 718/6779 [26:31<3:40:59,  2.19s/it] 11%|█         | 719/6779 [26:34<3:41:18,  2.19s/it]                                                    {'loss': 1.6743, 'learning_rate': 0.0003915824065844057, 'epoch': 0.11}
+ 11%|█         | 719/6779 [26:34<3:41:18,  2.19s/it] 11%|█         | 720/6779 [26:36<3:40:14,  2.18s/it]                                                    {'loss': 1.7383, 'learning_rate': 0.00039155538040400243, 'epoch': 0.11}
+ 11%|█         | 720/6779 [26:36<3:40:14,  2.18s/it] 11%|█         | 721/6779 [26:38<3:33:26,  2.11s/it]                                                    {'loss': 1.6931, 'learning_rate': 0.00039152831184259866, 'epoch': 0.11}
+ 11%|█         | 721/6779 [26:38<3:33:26,  2.11s/it] 11%|█         | 722/6779 [26:40<3:36:33,  2.15s/it]                                                    {'loss': 1.7318, 'learning_rate': 0.0003915012009061832, 'epoch': 0.11}
+ 11%|█         | 722/6779 [26:40<3:36:33,  2.15s/it] 11%|█         | 723/6779 [26:42<3:36:14,  2.14s/it]                                                    {'loss': 1.7002, 'learning_rate': 0.00039147404760075423, 'epoch': 0.11}
+ 11%|█         | 723/6779 [26:42<3:36:14,  2.14s/it] 11%|█         | 724/6779 [26:44<3:38:34,  2.17s/it]                                                    {'loss': 1.6221, 'learning_rate': 0.0003914468519323193, 'epoch': 0.11}
+ 11%|█         | 724/6779 [26:44<3:38:34,  2.17s/it] 11%|█         | 725/6779 [26:46<3:40:46,  2.19s/it]                                                    {'loss': 1.7545, 'learning_rate': 0.0003914196139068954, 'epoch': 0.11}
+ 11%|█         | 725/6779 [26:46<3:40:46,  2.19s/it] 11%|█         | 726/6779 [26:49<3:37:02,  2.15s/it]                                                    {'loss': 1.7399, 'learning_rate': 0.00039139233353050894, 'epoch': 0.11}
+ 11%|█         | 726/6779 [26:49<3:37:02,  2.15s/it] 11%|█         | 727/6779 [26:51<3:46:06,  2.24s/it]                                                    {'loss': 1.7467, 'learning_rate': 0.00039136501080919546, 'epoch': 0.11}
+ 11%|█         | 727/6779 [26:51<3:46:06,  2.24s/it] 11%|█         | 728/6779 [26:53<3:45:13,  2.23s/it]                                                    {'loss': 1.8179, 'learning_rate': 0.00039133764574900013, 'epoch': 0.11}
+ 11%|█         | 728/6779 [26:53<3:45:13,  2.23s/it] 11%|█         | 729/6779 [26:55<3:42:43,  2.21s/it]                                                    {'loss': 1.8389, 'learning_rate': 0.0003913102383559773, 'epoch': 0.11}
+ 11%|█         | 729/6779 [26:55<3:42:43,  2.21s/it] 11%|█         | 730/6779 [26:58<3:49:35,  2.28s/it]                                                    {'loss': 1.6857, 'learning_rate': 0.00039128278863619076, 'epoch': 0.11}
+ 11%|█         | 730/6779 [26:58<3:49:35,  2.28s/it] 11%|█         | 731/6779 [27:00<3:46:07,  2.24s/it]                                                    {'loss': 1.7412, 'learning_rate': 0.00039125529659571383, 'epoch': 0.11}
+ 11%|█         | 731/6779 [27:00<3:46:07,  2.24s/it] 11%|█         | 732/6779 [27:02<3:46:22,  2.25s/it]                                                    {'loss': 1.9313, 'learning_rate': 0.00039122776224062886, 'epoch': 0.11}
+ 11%|█         | 732/6779 [27:02<3:46:22,  2.25s/it] 11%|█         | 733/6779 [27:04<3:41:58,  2.20s/it]                                                    {'loss': 1.745, 'learning_rate': 0.0003912001855770278, 'epoch': 0.11}
+ 11%|█         | 733/6779 [27:04<3:41:58,  2.20s/it] 11%|█         | 734/6779 [27:07<3:45:39,  2.24s/it]                                                    {'loss': 1.8401, 'learning_rate': 0.00039117256661101187, 'epoch': 0.11}
+ 11%|█         | 734/6779 [27:07<3:45:39,  2.24s/it] 11%|█         | 735/6779 [27:09<3:52:20,  2.31s/it]                                                    {'loss': 1.8221, 'learning_rate': 0.00039114490534869175, 'epoch': 0.11}
+ 11%|█         | 735/6779 [27:09<3:52:20,  2.31s/it] 11%|█         | 736/6779 [27:11<3:50:49,  2.29s/it]                                                    {'loss': 1.8534, 'learning_rate': 0.00039111720179618736, 'epoch': 0.11}
+ 11%|█         | 736/6779 [27:11<3:50:49,  2.29s/it] 11%|█         | 737/6779 [27:14<3:48:28,  2.27s/it]                                                    {'loss': 1.8352, 'learning_rate': 0.000391089455959628, 'epoch': 0.11}
+ 11%|█         | 737/6779 [27:14<3:48:28,  2.27s/it] 11%|█         | 738/6779 [27:16<3:44:13,  2.23s/it]                                                    {'loss': 1.7419, 'learning_rate': 0.00039106166784515234, 'epoch': 0.11}
+ 11%|█         | 738/6779 [27:16<3:44:13,  2.23s/it] 11%|█         | 739/6779 [27:18<3:36:40,  2.15s/it]                                                    {'loss': 1.6659, 'learning_rate': 0.0003910338374589084, 'epoch': 0.11}
+ 11%|█         | 739/6779 [27:18<3:36:40,  2.15s/it] 11%|█         | 740/6779 [27:20<3:35:44,  2.14s/it]                                                    {'loss': 1.825, 'learning_rate': 0.00039100596480705363, 'epoch': 0.11}
+ 11%|█         | 740/6779 [27:20<3:35:44,  2.14s/it] 11%|█         | 741/6779 [27:22<3:34:59,  2.14s/it]                                                    {'loss': 1.6099, 'learning_rate': 0.0003909780498957547, 'epoch': 0.11}
+ 11%|█         | 741/6779 [27:22<3:34:59,  2.14s/it] 11%|█         | 742/6779 [27:24<3:33:31,  2.12s/it]                                                    {'loss': 1.8521, 'learning_rate': 0.0003909500927311878, 'epoch': 0.11}
+ 11%|█         | 742/6779 [27:24<3:33:31,  2.12s/it] 11%|█         | 743/6779 [27:27<3:47:22,  2.26s/it]                                                    {'loss': 1.6399, 'learning_rate': 0.0003909220933195382, 'epoch': 0.11}
+ 11%|█         | 743/6779 [27:27<3:47:22,  2.26s/it] 11%|█         | 744/6779 [27:29<3:55:04,  2.34s/it]                                                    {'loss': 1.856, 'learning_rate': 0.0003908940516670008, 'epoch': 0.11}
+ 11%|█         | 744/6779 [27:29<3:55:04,  2.34s/it] 11%|█         | 745/6779 [27:31<3:50:50,  2.30s/it]                                                    {'loss': 1.9385, 'learning_rate': 0.0003908659677797796, 'epoch': 0.11}
+ 11%|█         | 745/6779 [27:31<3:50:50,  2.30s/it] 11%|█         | 746/6779 [27:34<3:55:29,  2.34s/it]                                                    {'loss': 1.7846, 'learning_rate': 0.0003908378416640882, 'epoch': 0.11}
+ 11%|█         | 746/6779 [27:34<3:55:29,  2.34s/it] 11%|█         | 747/6779 [27:36<3:47:44,  2.27s/it]                                                    {'loss': 1.9374, 'learning_rate': 0.00039080967332614933, 'epoch': 0.11}
+ 11%|█         | 747/6779 [27:36<3:47:44,  2.27s/it] 11%|█         | 748/6779 [27:38<3:40:24,  2.19s/it]                                                    {'loss': 1.7176, 'learning_rate': 0.0003907814627721952, 'epoch': 0.11}
+ 11%|█         | 748/6779 [27:38<3:40:24,  2.19s/it] 11%|█         | 749/6779 [27:40<3:35:35,  2.15s/it]                                                    {'loss': 1.7, 'learning_rate': 0.00039075321000846724, 'epoch': 0.11}
+ 11%|█         | 749/6779 [27:40<3:35:35,  2.15s/it] 11%|█         | 750/6779 [27:42<3:39:20,  2.18s/it]                                                    {'loss': 1.8466, 'learning_rate': 0.00039072491504121636, 'epoch': 0.11}
+ 11%|█         | 750/6779 [27:42<3:39:20,  2.18s/it] 11%|█         | 751/6779 [27:44<3:34:01,  2.13s/it]                                                    {'loss': 1.692, 'learning_rate': 0.00039069657787670265, 'epoch': 0.11}
+ 11%|█         | 751/6779 [27:44<3:34:01,  2.13s/it] 11%|█         | 752/6779 [27:46<3:38:40,  2.18s/it]                                                    {'loss': 1.6392, 'learning_rate': 0.0003906681985211956, 'epoch': 0.11}
+ 11%|█         | 752/6779 [27:46<3:38:40,  2.18s/it] 11%|█         | 753/6779 [27:48<3:34:39,  2.14s/it]                                                    {'loss': 1.8022, 'learning_rate': 0.00039063977698097427, 'epoch': 0.11}
+ 11%|█         | 753/6779 [27:48<3:34:39,  2.14s/it] 11%|█         | 754/6779 [27:51<3:39:13,  2.18s/it]                                                    {'loss': 1.7165, 'learning_rate': 0.00039061131326232647, 'epoch': 0.11}
+ 11%|█         | 754/6779 [27:51<3:39:13,  2.18s/it] 11%|█         | 755/6779 [27:53<3:41:43,  2.21s/it]                                                    {'loss': 1.8111, 'learning_rate': 0.00039058280737155004, 'epoch': 0.11}
+ 11%|█         | 755/6779 [27:53<3:41:43,  2.21s/it] 11%|█         | 756/6779 [27:55<3:44:40,  2.24s/it]                                                    {'loss': 1.8639, 'learning_rate': 0.0003905542593149516, 'epoch': 0.11}
+ 11%|█         | 756/6779 [27:55<3:44:40,  2.24s/it] 11%|█         | 757/6779 [27:57<3:34:26,  2.14s/it]                                                    {'loss': 1.656, 'learning_rate': 0.0003905256690988473, 'epoch': 0.11}
+ 11%|█         | 757/6779 [27:57<3:34:26,  2.14s/it] 11%|█         | 758/6779 [28:00<3:39:16,  2.19s/it]                                                    {'loss': 1.7854, 'learning_rate': 0.0003904970367295628, 'epoch': 0.11}
+ 11%|█         | 758/6779 [28:00<3:39:16,  2.19s/it] 11%|█         | 759/6779 [28:02<3:39:27,  2.19s/it]                                                    {'loss': 1.9154, 'learning_rate': 0.00039046836221343285, 'epoch': 0.11}
+ 11%|█         | 759/6779 [28:02<3:39:27,  2.19s/it] 11%|█         | 760/6779 [28:04<3:40:45,  2.20s/it]                                                    {'loss': 1.8538, 'learning_rate': 0.0003904396455568016, 'epoch': 0.11}
+ 11%|█         | 760/6779 [28:04<3:40:45,  2.20s/it] 11%|█         | 761/6779 [28:06<3:40:58,  2.20s/it]                                                    {'loss': 1.9094, 'learning_rate': 0.0003904108867660225, 'epoch': 0.11}
+ 11%|█         | 761/6779 [28:06<3:40:58,  2.20s/it] 11%|█         | 762/6779 [28:08<3:40:19,  2.20s/it]                                                    {'loss': 1.8702, 'learning_rate': 0.00039038208584745826, 'epoch': 0.11}
+ 11%|█         | 762/6779 [28:08<3:40:19,  2.20s/it] 11%|█▏        | 763/6779 [28:10<3:36:35,  2.16s/it]                                                    {'loss': 1.7503, 'learning_rate': 0.00039035324280748107, 'epoch': 0.11}
+ 11%|█▏        | 763/6779 [28:10<3:36:35,  2.16s/it] 11%|█▏        | 764/6779 [28:13<3:36:15,  2.16s/it]                                                    {'loss': 1.7448, 'learning_rate': 0.0003903243576524724, 'epoch': 0.11}
+ 11%|█▏        | 764/6779 [28:13<3:36:15,  2.16s/it] 11%|█▏        | 765/6779 [28:15<3:48:56,  2.28s/it]                                                    {'loss': 1.703, 'learning_rate': 0.00039029543038882286, 'epoch': 0.11}
+ 11%|█▏        | 765/6779 [28:15<3:48:56,  2.28s/it] 11%|█▏        | 766/6779 [28:17<3:45:30,  2.25s/it]                                                    {'loss': 1.8952, 'learning_rate': 0.0003902664610229327, 'epoch': 0.11}
+ 11%|█▏        | 766/6779 [28:17<3:45:30,  2.25s/it] 11%|█▏        | 767/6779 [28:20<3:43:28,  2.23s/it]                                                    {'loss': 1.7677, 'learning_rate': 0.00039023744956121105, 'epoch': 0.11}
+ 11%|█▏        | 767/6779 [28:20<3:43:28,  2.23s/it] 11%|█▏        | 768/6779 [28:22<3:58:50,  2.38s/it]                                                    {'loss': 1.6851, 'learning_rate': 0.00039020839601007685, 'epoch': 0.11}
+ 11%|█▏        | 768/6779 [28:22<3:58:50,  2.38s/it] 11%|█▏        | 769/6779 [28:24<3:53:04,  2.33s/it]                                                    {'loss': 1.8955, 'learning_rate': 0.000390179300375958, 'epoch': 0.11}
+ 11%|█▏        | 769/6779 [28:24<3:53:04,  2.33s/it] 11%|█▏        | 770/6779 [28:27<3:45:02,  2.25s/it]                                                    {'loss': 1.9412, 'learning_rate': 0.0003901501626652918, 'epoch': 0.11}
+ 11%|█▏        | 770/6779 [28:27<3:45:02,  2.25s/it] 11%|█▏        | 771/6779 [28:29<3:45:52,  2.26s/it]                                                    {'loss': 1.6386, 'learning_rate': 0.00039012098288452484, 'epoch': 0.11}
+ 11%|█▏        | 771/6779 [28:29<3:45:52,  2.26s/it] 11%|█▏        | 772/6779 [28:31<3:42:21,  2.22s/it]                                                    {'loss': 1.818, 'learning_rate': 0.00039009176104011316, 'epoch': 0.11}
+ 11%|█▏        | 772/6779 [28:31<3:42:21,  2.22s/it] 11%|█▏        | 773/6779 [28:33<3:40:07,  2.20s/it]                                                    {'loss': 1.7755, 'learning_rate': 0.00039006249713852186, 'epoch': 0.11}
+ 11%|█▏        | 773/6779 [28:33<3:40:07,  2.20s/it] 11%|█▏        | 774/6779 [28:35<3:36:12,  2.16s/it]                                                    {'loss': 1.6705, 'learning_rate': 0.0003900331911862257, 'epoch': 0.11}
+ 11%|█▏        | 774/6779 [28:35<3:36:12,  2.16s/it] 11%|█▏        | 775/6779 [28:37<3:36:38,  2.16s/it]                                                    {'loss': 1.5945, 'learning_rate': 0.0003900038431897082, 'epoch': 0.11}
+ 11%|█▏        | 775/6779 [28:37<3:36:38,  2.16s/it] 11%|█▏        | 776/6779 [28:40<3:42:03,  2.22s/it]                                                    {'loss': 1.7899, 'learning_rate': 0.0003899744531554627, 'epoch': 0.11}
+ 11%|█▏        | 776/6779 [28:40<3:42:03,  2.22s/it] 11%|█▏        | 777/6779 [28:42<3:37:29,  2.17s/it]                                                    {'loss': 1.847, 'learning_rate': 0.0003899450210899918, 'epoch': 0.11}
+ 11%|█▏        | 777/6779 [28:42<3:37:29,  2.17s/it] 11%|█▏        | 778/6779 [28:44<3:36:22,  2.16s/it]                                                    {'loss': 1.7291, 'learning_rate': 0.00038991554699980695, 'epoch': 0.11}
+ 11%|█▏        | 778/6779 [28:44<3:36:22,  2.16s/it] 11%|█▏        | 779/6779 [28:46<3:37:03,  2.17s/it]                                                    {'loss': 1.7155, 'learning_rate': 0.0003898860308914293, 'epoch': 0.11}
+ 11%|█▏        | 779/6779 [28:46<3:37:03,  2.17s/it] 12%|█▏        | 780/6779 [28:48<3:43:52,  2.24s/it]                                                    {'loss': 1.7665, 'learning_rate': 0.00038985647277138937, 'epoch': 0.12}
+ 12%|█▏        | 780/6779 [28:48<3:43:52,  2.24s/it] 12%|█▏        | 781/6779 [28:51<3:44:51,  2.25s/it]                                                    {'loss': 1.7511, 'learning_rate': 0.00038982687264622656, 'epoch': 0.12}
+ 12%|█▏        | 781/6779 [28:51<3:44:51,  2.25s/it] 12%|█▏        | 782/6779 [28:53<3:49:37,  2.30s/it]                                                    {'loss': 1.8079, 'learning_rate': 0.0003897972305224899, 'epoch': 0.12}
+ 12%|█▏        | 782/6779 [28:53<3:49:37,  2.30s/it] 12%|█▏        | 783/6779 [28:55<3:47:28,  2.28s/it]                                                    {'loss': 1.8026, 'learning_rate': 0.00038976754640673763, 'epoch': 0.12}
+ 12%|█▏        | 783/6779 [28:55<3:47:28,  2.28s/it] 12%|█▏        | 784/6779 [28:58<3:51:32,  2.32s/it]                                                    {'loss': 1.698, 'learning_rate': 0.00038973782030553723, 'epoch': 0.12}
+ 12%|█▏        | 784/6779 [28:58<3:51:32,  2.32s/it] 12%|█▏        | 785/6779 [29:00<3:51:55,  2.32s/it]                                                    {'loss': 1.7626, 'learning_rate': 0.0003897080522254655, 'epoch': 0.12}
+ 12%|█▏        | 785/6779 [29:00<3:51:55,  2.32s/it] 12%|█▏        | 786/6779 [29:02<3:46:17,  2.27s/it]                                                    {'loss': 1.6517, 'learning_rate': 0.0003896782421731085, 'epoch': 0.12}
+ 12%|█▏        | 786/6779 [29:02<3:46:17,  2.27s/it] 12%|█▏        | 787/6779 [29:05<3:48:53,  2.29s/it]                                                    {'loss': 1.6861, 'learning_rate': 0.0003896483901550617, 'epoch': 0.12}
+ 12%|█▏        | 787/6779 [29:05<3:48:53,  2.29s/it] 12%|█▏        | 788/6779 [29:07<3:44:46,  2.25s/it]                                                    {'loss': 1.7257, 'learning_rate': 0.00038961849617792974, 'epoch': 0.12}
+ 12%|█▏        | 788/6779 [29:07<3:44:46,  2.25s/it] 12%|█▏        | 789/6779 [29:09<3:38:46,  2.19s/it]                                                    {'loss': 1.7159, 'learning_rate': 0.0003895885602483265, 'epoch': 0.12}
+ 12%|█▏        | 789/6779 [29:09<3:38:46,  2.19s/it] 12%|█▏        | 790/6779 [29:11<3:36:59,  2.17s/it]                                                    {'loss': 1.756, 'learning_rate': 0.00038955858237287516, 'epoch': 0.12}
+ 12%|█▏        | 790/6779 [29:11<3:36:59,  2.17s/it] 12%|█▏        | 791/6779 [29:13<3:36:36,  2.17s/it]                                                    {'loss': 1.7573, 'learning_rate': 0.00038952856255820845, 'epoch': 0.12}
+ 12%|█▏        | 791/6779 [29:13<3:36:36,  2.17s/it] 12%|█▏        | 792/6779 [29:16<3:50:01,  2.31s/it]                                                    {'loss': 1.8765, 'learning_rate': 0.0003894985008109679, 'epoch': 0.12}
+ 12%|█▏        | 792/6779 [29:16<3:50:01,  2.31s/it] 12%|█▏        | 793/6779 [29:18<3:47:10,  2.28s/it]                                                    {'loss': 1.6799, 'learning_rate': 0.0003894683971378047, 'epoch': 0.12}
+ 12%|█▏        | 793/6779 [29:18<3:47:10,  2.28s/it] 12%|█▏        | 794/6779 [29:20<3:42:23,  2.23s/it]                                                    {'loss': 1.9008, 'learning_rate': 0.00038943825154537923, 'epoch': 0.12}
+ 12%|█▏        | 794/6779 [29:20<3:42:23,  2.23s/it] 12%|█▏        | 795/6779 [29:22<3:45:28,  2.26s/it]                                                    {'loss': 1.5727, 'learning_rate': 0.000389408064040361, 'epoch': 0.12}
+ 12%|█▏        | 795/6779 [29:22<3:45:28,  2.26s/it] 12%|█▏        | 796/6779 [29:25<3:45:20,  2.26s/it]                                                    {'loss': 1.753, 'learning_rate': 0.000389377834629429, 'epoch': 0.12}
+ 12%|█▏        | 796/6779 [29:25<3:45:20,  2.26s/it] 12%|█▏        | 797/6779 [29:27<3:45:02,  2.26s/it]                                                    {'loss': 1.6813, 'learning_rate': 0.0003893475633192713, 'epoch': 0.12}
+ 12%|█▏        | 797/6779 [29:27<3:45:02,  2.26s/it] 12%|█▏        | 798/6779 [29:29<3:44:37,  2.25s/it]                                                    {'loss': 1.7802, 'learning_rate': 0.00038931725011658535, 'epoch': 0.12}
+ 12%|█▏        | 798/6779 [29:29<3:44:37,  2.25s/it] 12%|█▏        | 799/6779 [29:31<3:41:56,  2.23s/it]                                                    {'loss': 1.7199, 'learning_rate': 0.0003892868950280779, 'epoch': 0.12}
+ 12%|█▏        | 799/6779 [29:31<3:41:56,  2.23s/it] 12%|█▏        | 800/6779 [29:33<3:39:22,  2.20s/it]                                                    {'loss': 1.8527, 'learning_rate': 0.00038925649806046477, 'epoch': 0.12}
+ 12%|█▏        | 800/6779 [29:33<3:39:22,  2.20s/it] 12%|█▏        | 801/6779 [29:36<3:46:40,  2.28s/it]                                                    {'loss': 1.7394, 'learning_rate': 0.0003892260592204713, 'epoch': 0.12}
+ 12%|█▏        | 801/6779 [29:36<3:46:40,  2.28s/it] 12%|█▏        | 802/6779 [29:38<3:45:11,  2.26s/it]                                                    {'loss': 1.6138, 'learning_rate': 0.0003891955785148321, 'epoch': 0.12}
+ 12%|█▏        | 802/6779 [29:38<3:45:11,  2.26s/it] 12%|█▏        | 803/6779 [29:40<3:41:17,  2.22s/it]                                                    {'loss': 1.7716, 'learning_rate': 0.0003891650559502907, 'epoch': 0.12}
+ 12%|█▏        | 803/6779 [29:40<3:41:17,  2.22s/it] 12%|█▏        | 804/6779 [29:42<3:36:32,  2.17s/it]                                                    {'loss': 1.7895, 'learning_rate': 0.0003891344915336003, 'epoch': 0.12}
+ 12%|█▏        | 804/6779 [29:42<3:36:32,  2.17s/it] 12%|█▏        | 805/6779 [29:44<3:32:46,  2.14s/it]                                                    {'loss': 1.6196, 'learning_rate': 0.000389103885271523, 'epoch': 0.12}
+ 12%|█▏        | 805/6779 [29:44<3:32:46,  2.14s/it] 12%|█▏        | 806/6779 [29:47<3:37:48,  2.19s/it]                                                    {'loss': 1.7733, 'learning_rate': 0.0003890732371708305, 'epoch': 0.12}
+ 12%|█▏        | 806/6779 [29:47<3:37:48,  2.19s/it] 12%|█▏        | 807/6779 [29:49<3:37:52,  2.19s/it]                                                    {'loss': 1.8074, 'learning_rate': 0.0003890425472383035, 'epoch': 0.12}
+ 12%|█▏        | 807/6779 [29:49<3:37:52,  2.19s/it] 12%|█▏        | 808/6779 [29:51<3:38:01,  2.19s/it]                                                    {'loss': 1.8454, 'learning_rate': 0.000389011815480732, 'epoch': 0.12}
+ 12%|█▏        | 808/6779 [29:51<3:38:01,  2.19s/it] 12%|█▏        | 809/6779 [29:53<3:41:23,  2.23s/it]                                                    {'loss': 1.6665, 'learning_rate': 0.0003889810419049155, 'epoch': 0.12}
+ 12%|█▏        | 809/6779 [29:53<3:41:23,  2.23s/it] 12%|█▏        | 810/6779 [29:56<3:39:59,  2.21s/it]                                                    {'loss': 1.6521, 'learning_rate': 0.0003889502265176623, 'epoch': 0.12}
+ 12%|█▏        | 810/6779 [29:56<3:39:59,  2.21s/it] 12%|█▏        | 811/6779 [29:58<3:41:04,  2.22s/it]                                                    {'loss': 1.7852, 'learning_rate': 0.00038891936932579043, 'epoch': 0.12}
+ 12%|█▏        | 811/6779 [29:58<3:41:04,  2.22s/it] 12%|█▏        | 812/6779 [30:00<3:43:28,  2.25s/it]                                                    {'loss': 1.8782, 'learning_rate': 0.0003888884703361268, 'epoch': 0.12}
+ 12%|█▏        | 812/6779 [30:00<3:43:28,  2.25s/it] 12%|█▏        | 813/6779 [30:03<3:49:46,  2.31s/it]                                                    {'loss': 1.8013, 'learning_rate': 0.0003888575295555078, 'epoch': 0.12}
+ 12%|█▏        | 813/6779 [30:03<3:49:46,  2.31s/it] 12%|█▏        | 814/6779 [30:05<3:44:58,  2.26s/it]                                                    {'loss': 1.6808, 'learning_rate': 0.0003888265469907788, 'epoch': 0.12}
+ 12%|█▏        | 814/6779 [30:05<3:44:58,  2.26s/it] 12%|█▏        | 815/6779 [30:07<3:41:46,  2.23s/it]                                                    {'loss': 1.8552, 'learning_rate': 0.00038879552264879484, 'epoch': 0.12}
+ 12%|█▏        | 815/6779 [30:07<3:41:46,  2.23s/it] 12%|█▏        | 816/6779 [30:09<3:41:06,  2.22s/it]                                                    {'loss': 1.8003, 'learning_rate': 0.0003887644565364197, 'epoch': 0.12}
+ 12%|█▏        | 816/6779 [30:09<3:41:06,  2.22s/it] 12%|█▏        | 817/6779 [30:11<3:40:53,  2.22s/it]                                                    {'loss': 1.6479, 'learning_rate': 0.00038873334866052693, 'epoch': 0.12}
+ 12%|█▏        | 817/6779 [30:11<3:40:53,  2.22s/it] 12%|█▏        | 818/6779 [30:14<3:43:28,  2.25s/it]                                                    {'loss': 1.8324, 'learning_rate': 0.00038870219902799883, 'epoch': 0.12}
+ 12%|█▏        | 818/6779 [30:14<3:43:28,  2.25s/it] 12%|█▏        | 819/6779 [30:16<3:37:29,  2.19s/it]                                                    {'loss': 1.5919, 'learning_rate': 0.00038867100764572725, 'epoch': 0.12}
+ 12%|█▏        | 819/6779 [30:16<3:37:29,  2.19s/it] 12%|█▏        | 820/6779 [30:18<3:40:45,  2.22s/it]                                                    {'loss': 1.6592, 'learning_rate': 0.00038863977452061315, 'epoch': 0.12}
+ 12%|█▏        | 820/6779 [30:18<3:40:45,  2.22s/it] 12%|█▏        | 821/6779 [30:21<3:59:32,  2.41s/it]                                                    {'loss': 1.7454, 'learning_rate': 0.00038860849965956674, 'epoch': 0.12}
+ 12%|█▏        | 821/6779 [30:21<3:59:32,  2.41s/it] 12%|█▏        | 822/6779 [30:23<3:53:46,  2.35s/it]                                                    {'loss': 1.6781, 'learning_rate': 0.0003885771830695075, 'epoch': 0.12}
+ 12%|█▏        | 822/6779 [30:23<3:53:46,  2.35s/it] 12%|█▏        | 823/6779 [30:25<3:51:17,  2.33s/it]                                                    {'loss': 1.8052, 'learning_rate': 0.00038854582475736414, 'epoch': 0.12}
+ 12%|█▏        | 823/6779 [30:25<3:51:17,  2.33s/it] 12%|█▏        | 824/6779 [30:28<4:02:11,  2.44s/it]                                                    {'loss': 1.8096, 'learning_rate': 0.00038851442473007464, 'epoch': 0.12}
+ 12%|█▏        | 824/6779 [30:28<4:02:11,  2.44s/it] 12%|█▏        | 825/6779 [30:30<3:52:57,  2.35s/it]                                                    {'loss': 1.7157, 'learning_rate': 0.000388482982994586, 'epoch': 0.12}
+ 12%|█▏        | 825/6779 [30:30<3:52:57,  2.35s/it] 12%|█▏        | 826/6779 [30:33<3:54:52,  2.37s/it]                                                    {'loss': 1.796, 'learning_rate': 0.0003884514995578547, 'epoch': 0.12}
+ 12%|█▏        | 826/6779 [30:33<3:54:52,  2.37s/it] 12%|█▏        | 827/6779 [30:35<3:49:14,  2.31s/it]                                                    {'loss': 1.8746, 'learning_rate': 0.0003884199744268464, 'epoch': 0.12}
+ 12%|█▏        | 827/6779 [30:35<3:49:14,  2.31s/it] 12%|█▏        | 828/6779 [30:37<3:47:49,  2.30s/it]                                                    {'loss': 1.8132, 'learning_rate': 0.0003883884076085358, 'epoch': 0.12}
+ 12%|█▏        | 828/6779 [30:37<3:47:49,  2.30s/it] 12%|█▏        | 829/6779 [30:39<3:48:47,  2.31s/it]                                                    {'loss': 1.8604, 'learning_rate': 0.000388356799109907, 'epoch': 0.12}
+ 12%|█▏        | 829/6779 [30:39<3:48:47,  2.31s/it] 12%|█▏        | 830/6779 [30:41<3:43:58,  2.26s/it]                                                    {'loss': 1.7425, 'learning_rate': 0.00038832514893795335, 'epoch': 0.12}
+ 12%|█▏        | 830/6779 [30:41<3:43:58,  2.26s/it] 12%|█▏        | 831/6779 [30:44<3:44:49,  2.27s/it]                                                    {'loss': 1.9109, 'learning_rate': 0.00038829345709967723, 'epoch': 0.12}
+ 12%|█▏        | 831/6779 [30:44<3:44:49,  2.27s/it] 12%|█▏        | 832/6779 [30:46<3:43:11,  2.25s/it]                                                    {'loss': 1.6806, 'learning_rate': 0.0003882617236020905, 'epoch': 0.12}
+ 12%|█▏        | 832/6779 [30:46<3:43:11,  2.25s/it] 12%|█▏        | 833/6779 [30:48<3:39:31,  2.22s/it]                                                    {'loss': 1.7439, 'learning_rate': 0.000388229948452214, 'epoch': 0.12}
+ 12%|█▏        | 833/6779 [30:48<3:39:31,  2.22s/it] 12%|█▏        | 834/6779 [30:50<3:36:49,  2.19s/it]                                                    {'loss': 1.7855, 'learning_rate': 0.00038819813165707784, 'epoch': 0.12}
+ 12%|█▏        | 834/6779 [30:50<3:36:49,  2.19s/it] 12%|█▏        | 835/6779 [30:53<3:41:49,  2.24s/it]                                                    {'loss': 1.8821, 'learning_rate': 0.00038816627322372144, 'epoch': 0.12}
+ 12%|█▏        | 835/6779 [30:53<3:41:49,  2.24s/it] 12%|█▏        | 836/6779 [30:55<3:43:42,  2.26s/it]                                                    {'loss': 1.7434, 'learning_rate': 0.0003881343731591934, 'epoch': 0.12}
+ 12%|█▏        | 836/6779 [30:55<3:43:42,  2.26s/it] 12%|█▏        | 837/6779 [30:57<3:43:03,  2.25s/it]                                                    {'loss': 1.7148, 'learning_rate': 0.00038810243147055143, 'epoch': 0.12}
+ 12%|█▏        | 837/6779 [30:57<3:43:03,  2.25s/it] 12%|█▏        | 838/6779 [31:00<3:54:07,  2.36s/it]                                                    {'loss': 1.6571, 'learning_rate': 0.0003880704481648626, 'epoch': 0.12}
+ 12%|█▏        | 838/6779 [31:00<3:54:07,  2.36s/it] 12%|█▏        | 839/6779 [31:02<3:55:47,  2.38s/it]                                                    {'loss': 1.8829, 'learning_rate': 0.00038803842324920305, 'epoch': 0.12}
+ 12%|█▏        | 839/6779 [31:02<3:55:47,  2.38s/it] 12%|█▏        | 840/6779 [31:04<3:46:27,  2.29s/it]                                                    {'loss': 1.7589, 'learning_rate': 0.00038800635673065824, 'epoch': 0.12}
+ 12%|█▏        | 840/6779 [31:04<3:46:27,  2.29s/it] 12%|█▏        | 841/6779 [31:06<3:45:12,  2.28s/it]                                                    {'loss': 1.7688, 'learning_rate': 0.00038797424861632276, 'epoch': 0.12}
+ 12%|█▏        | 841/6779 [31:06<3:45:12,  2.28s/it] 12%|█▏        | 842/6779 [31:09<3:40:04,  2.22s/it]                                                    {'loss': 1.7214, 'learning_rate': 0.00038794209891330035, 'epoch': 0.12}
+ 12%|█▏        | 842/6779 [31:09<3:40:04,  2.22s/it] 12%|█▏        | 843/6779 [31:11<3:42:19,  2.25s/it]                                                    {'loss': 1.8685, 'learning_rate': 0.00038790990762870416, 'epoch': 0.12}
+ 12%|█▏        | 843/6779 [31:11<3:42:19,  2.25s/it] 12%|█▏        | 844/6779 [31:13<3:36:57,  2.19s/it]                                                    {'loss': 1.8972, 'learning_rate': 0.0003878776747696564, 'epoch': 0.12}
+ 12%|█▏        | 844/6779 [31:13<3:36:57,  2.19s/it] 12%|█▏        | 845/6779 [31:15<3:35:06,  2.17s/it]                                                    {'loss': 1.7691, 'learning_rate': 0.0003878454003432883, 'epoch': 0.12}
+ 12%|█▏        | 845/6779 [31:15<3:35:06,  2.17s/it] 12%|█▏        | 846/6779 [31:17<3:31:26,  2.14s/it]                                                    {'loss': 1.7816, 'learning_rate': 0.0003878130843567407, 'epoch': 0.12}
+ 12%|█▏        | 846/6779 [31:17<3:31:26,  2.14s/it] 12%|█▏        | 847/6779 [31:19<3:26:31,  2.09s/it]                                                    {'loss': 1.8169, 'learning_rate': 0.00038778072681716326, 'epoch': 0.12}
+ 12%|█▏        | 847/6779 [31:19<3:26:31,  2.09s/it] 13%|█▎        | 848/6779 [31:22<3:37:37,  2.20s/it]                                                    {'loss': 1.9048, 'learning_rate': 0.00038774832773171507, 'epoch': 0.13}
+ 13%|█▎        | 848/6779 [31:22<3:37:37,  2.20s/it] 13%|█▎        | 849/6779 [31:24<3:47:59,  2.31s/it]                                                    {'loss': 1.6137, 'learning_rate': 0.00038771588710756423, 'epoch': 0.13}
+ 13%|█▎        | 849/6779 [31:24<3:47:59,  2.31s/it] 13%|█▎        | 850/6779 [31:26<3:37:32,  2.20s/it]                                                    {'loss': 1.7536, 'learning_rate': 0.00038768340495188815, 'epoch': 0.13}
+ 13%|█▎        | 850/6779 [31:26<3:37:32,  2.20s/it] 13%|█▎        | 851/6779 [31:28<3:34:07,  2.17s/it]                                                    {'loss': 1.7821, 'learning_rate': 0.0003876508812718735, 'epoch': 0.13}
+ 13%|█▎        | 851/6779 [31:28<3:34:07,  2.17s/it] 13%|█▎        | 852/6779 [31:31<3:42:56,  2.26s/it]                                                    {'loss': 1.7234, 'learning_rate': 0.0003876183160747159, 'epoch': 0.13}
+ 13%|█▎        | 852/6779 [31:31<3:42:56,  2.26s/it] 13%|█▎        | 853/6779 [31:33<3:38:17,  2.21s/it]                                                    {'loss': 1.7202, 'learning_rate': 0.00038758570936762033, 'epoch': 0.13}
+ 13%|█▎        | 853/6779 [31:33<3:38:17,  2.21s/it] 13%|█▎        | 854/6779 [31:35<3:39:15,  2.22s/it]                                                    {'loss': 1.8354, 'learning_rate': 0.00038755306115780094, 'epoch': 0.13}
+ 13%|█▎        | 854/6779 [31:35<3:39:15,  2.22s/it] 13%|█▎        | 855/6779 [31:37<3:40:15,  2.23s/it]                                                    {'loss': 1.8125, 'learning_rate': 0.0003875203714524811, 'epoch': 0.13}
+ 13%|█▎        | 855/6779 [31:37<3:40:15,  2.23s/it] 13%|█▎        | 856/6779 [31:39<3:36:57,  2.20s/it]                                                    {'loss': 1.8201, 'learning_rate': 0.00038748764025889316, 'epoch': 0.13}
+ 13%|█▎        | 856/6779 [31:39<3:36:57,  2.20s/it] 13%|█▎        | 857/6779 [31:42<3:41:59,  2.25s/it]                                                    {'loss': 1.855, 'learning_rate': 0.0003874548675842789, 'epoch': 0.13}
+ 13%|█▎        | 857/6779 [31:42<3:41:59,  2.25s/it] 13%|█▎        | 858/6779 [31:44<3:41:25,  2.24s/it]                                                    {'loss': 1.634, 'learning_rate': 0.0003874220534358892, 'epoch': 0.13}
+ 13%|█▎        | 858/6779 [31:44<3:41:25,  2.24s/it] 13%|█▎        | 859/6779 [31:46<3:33:06,  2.16s/it]                                                    {'loss': 1.7083, 'learning_rate': 0.0003873891978209839, 'epoch': 0.13}
+ 13%|█▎        | 859/6779 [31:46<3:33:06,  2.16s/it] 13%|█▎        | 860/6779 [31:48<3:30:53,  2.14s/it]                                                    {'loss': 1.7279, 'learning_rate': 0.0003873563007468324, 'epoch': 0.13}
+ 13%|█▎        | 860/6779 [31:48<3:30:53,  2.14s/it] 13%|█▎        | 861/6779 [31:50<3:29:47,  2.13s/it]                                                    {'loss': 1.9583, 'learning_rate': 0.00038732336222071297, 'epoch': 0.13}
+ 13%|█▎        | 861/6779 [31:50<3:29:47,  2.13s/it] 13%|█▎        | 862/6779 [31:52<3:32:10,  2.15s/it]                                                    {'loss': 1.8569, 'learning_rate': 0.00038729038224991313, 'epoch': 0.13}
+ 13%|█▎        | 862/6779 [31:52<3:32:10,  2.15s/it] 13%|█▎        | 863/6779 [31:55<3:33:46,  2.17s/it]                                                    {'loss': 1.7852, 'learning_rate': 0.0003872573608417296, 'epoch': 0.13}
+ 13%|█▎        | 863/6779 [31:55<3:33:46,  2.17s/it] 13%|█▎        | 864/6779 [31:57<3:37:58,  2.21s/it]                                                    {'loss': 1.8875, 'learning_rate': 0.00038722429800346834, 'epoch': 0.13}
+ 13%|█▎        | 864/6779 [31:57<3:37:58,  2.21s/it] 13%|█▎        | 865/6779 [31:59<3:40:37,  2.24s/it]                                                    {'loss': 1.8448, 'learning_rate': 0.0003871911937424443, 'epoch': 0.13}
+ 13%|█▎        | 865/6779 [31:59<3:40:37,  2.24s/it] 13%|█▎        | 866/6779 [32:01<3:43:39,  2.27s/it]                                                    {'loss': 1.7259, 'learning_rate': 0.00038715804806598177, 'epoch': 0.13}
+ 13%|█▎        | 866/6779 [32:02<3:43:39,  2.27s/it] 13%|█▎        | 867/6779 [32:04<3:39:50,  2.23s/it]                                                    {'loss': 1.7899, 'learning_rate': 0.000387124860981414, 'epoch': 0.13}
+ 13%|█▎        | 867/6779 [32:04<3:39:50,  2.23s/it] 13%|█▎        | 868/6779 [32:07<3:58:45,  2.42s/it]                                                    {'loss': 1.8388, 'learning_rate': 0.00038709163249608366, 'epoch': 0.13}
+ 13%|█▎        | 868/6779 [32:07<3:58:45,  2.42s/it] 13%|█▎        | 869/6779 [32:09<3:54:17,  2.38s/it]                                                    {'loss': 1.5319, 'learning_rate': 0.0003870583626173424, 'epoch': 0.13}
+ 13%|█▎        | 869/6779 [32:09<3:54:17,  2.38s/it] 13%|█▎        | 870/6779 [32:11<3:51:01,  2.35s/it]                                                    {'loss': 1.813, 'learning_rate': 0.00038702505135255105, 'epoch': 0.13}
+ 13%|█▎        | 870/6779 [32:11<3:51:01,  2.35s/it] 13%|█▎        | 871/6779 [32:13<3:45:00,  2.29s/it]                                                    {'loss': 1.9106, 'learning_rate': 0.00038699169870907963, 'epoch': 0.13}
+ 13%|█▎        | 871/6779 [32:13<3:45:00,  2.29s/it] 13%|█▎        | 872/6779 [32:15<3:42:41,  2.26s/it]                                                    {'loss': 1.7036, 'learning_rate': 0.0003869583046943073, 'epoch': 0.13}
+ 13%|█▎        | 872/6779 [32:15<3:42:41,  2.26s/it] 13%|█▎        | 873/6779 [32:18<3:39:11,  2.23s/it]                                                    {'loss': 1.7033, 'learning_rate': 0.00038692486931562233, 'epoch': 0.13}
+ 13%|█▎        | 873/6779 [32:18<3:39:11,  2.23s/it] 13%|█▎        | 874/6779 [32:20<3:46:48,  2.30s/it]                                                    {'loss': 1.8424, 'learning_rate': 0.00038689139258042226, 'epoch': 0.13}
+ 13%|█▎        | 874/6779 [32:20<3:46:48,  2.30s/it] 13%|█▎        | 875/6779 [32:22<3:45:33,  2.29s/it]                                                    {'loss': 1.8719, 'learning_rate': 0.0003868578744961137, 'epoch': 0.13}
+ 13%|█▎        | 875/6779 [32:22<3:45:33,  2.29s/it] 13%|█▎        | 876/6779 [32:24<3:40:34,  2.24s/it]                                                    {'loss': 1.6421, 'learning_rate': 0.00038682431507011244, 'epoch': 0.13}
+ 13%|█▎        | 876/6779 [32:24<3:40:34,  2.24s/it] 13%|█▎        | 877/6779 [32:27<3:41:15,  2.25s/it]                                                    {'loss': 1.8485, 'learning_rate': 0.00038679071430984324, 'epoch': 0.13}
+ 13%|█▎        | 877/6779 [32:27<3:41:15,  2.25s/it] 13%|█▎        | 878/6779 [32:29<3:37:54,  2.22s/it]                                                    {'loss': 1.8626, 'learning_rate': 0.0003867570722227404, 'epoch': 0.13}
+ 13%|█▎        | 878/6779 [32:29<3:37:54,  2.22s/it] 13%|█▎        | 879/6779 [32:31<3:35:24,  2.19s/it]                                                    {'loss': 1.8194, 'learning_rate': 0.0003867233888162469, 'epoch': 0.13}
+ 13%|█▎        | 879/6779 [32:31<3:35:24,  2.19s/it] 13%|█▎        | 880/6779 [32:33<3:35:41,  2.19s/it]                                                    {'loss': 1.7825, 'learning_rate': 0.0003866896640978152, 'epoch': 0.13}
+ 13%|█▎        | 880/6779 [32:33<3:35:41,  2.19s/it] 13%|█▎        | 881/6779 [32:35<3:30:28,  2.14s/it]                                                    {'loss': 1.8508, 'learning_rate': 0.0003866558980749067, 'epoch': 0.13}
+ 13%|█▎        | 881/6779 [32:35<3:30:28,  2.14s/it] 13%|█▎        | 882/6779 [32:38<3:36:56,  2.21s/it]                                                    {'loss': 1.8659, 'learning_rate': 0.00038662209075499216, 'epoch': 0.13}
+ 13%|█▎        | 882/6779 [32:38<3:36:56,  2.21s/it] 13%|█▎        | 883/6779 [32:40<3:38:37,  2.22s/it]                                                    {'loss': 1.6852, 'learning_rate': 0.00038658824214555127, 'epoch': 0.13}
+ 13%|█▎        | 883/6779 [32:40<3:38:37,  2.22s/it] 13%|█▎        | 884/6779 [32:42<3:40:39,  2.25s/it]                                                    {'loss': 1.6847, 'learning_rate': 0.00038655435225407286, 'epoch': 0.13}
+ 13%|█▎        | 884/6779 [32:42<3:40:39,  2.25s/it] 13%|█▎        | 885/6779 [32:44<3:34:12,  2.18s/it]                                                    {'loss': 1.7392, 'learning_rate': 0.0003865204210880551, 'epoch': 0.13}
+ 13%|█▎        | 885/6779 [32:44<3:34:12,  2.18s/it] 13%|█▎        | 886/6779 [32:46<3:28:48,  2.13s/it]                                                    {'loss': 1.6964, 'learning_rate': 0.000386486448655005, 'epoch': 0.13}
+ 13%|█▎        | 886/6779 [32:46<3:28:48,  2.13s/it] 13%|█▎        | 887/6779 [32:48<3:32:00,  2.16s/it]                                                    {'loss': 1.73, 'learning_rate': 0.00038645243496243886, 'epoch': 0.13}
+ 13%|█▎        | 887/6779 [32:48<3:32:00,  2.16s/it] 13%|█▎        | 888/6779 [32:51<3:38:22,  2.22s/it]                                                    {'loss': 1.7274, 'learning_rate': 0.00038641838001788215, 'epoch': 0.13}
+ 13%|█▎        | 888/6779 [32:51<3:38:22,  2.22s/it] 13%|█▎        | 889/6779 [32:53<3:34:06,  2.18s/it]                                                    {'loss': 1.7399, 'learning_rate': 0.0003863842838288695, 'epoch': 0.13}
+ 13%|█▎        | 889/6779 [32:53<3:34:06,  2.18s/it] 13%|█▎        | 890/6779 [32:55<3:31:20,  2.15s/it]                                                    {'loss': 2.0097, 'learning_rate': 0.0003863501464029445, 'epoch': 0.13}
+ 13%|█▎        | 890/6779 [32:55<3:31:20,  2.15s/it] 13%|█▎        | 891/6779 [32:57<3:33:45,  2.18s/it]                                                    {'loss': 1.8165, 'learning_rate': 0.0003863159677476598, 'epoch': 0.13}
+ 13%|█▎        | 891/6779 [32:57<3:33:45,  2.18s/it] 13%|█▎        | 892/6779 [32:59<3:29:26,  2.13s/it]                                                    {'loss': 1.994, 'learning_rate': 0.00038628174787057757, 'epoch': 0.13}
+ 13%|█▎        | 892/6779 [32:59<3:29:26,  2.13s/it] 13%|█▎        | 893/6779 [33:01<3:29:52,  2.14s/it]                                                    {'loss': 1.8058, 'learning_rate': 0.0003862474867792687, 'epoch': 0.13}
+ 13%|█▎        | 893/6779 [33:01<3:29:52,  2.14s/it] 13%|█▎        | 894/6779 [33:04<3:38:50,  2.23s/it]                                                    {'loss': 1.7428, 'learning_rate': 0.00038621318448131336, 'epoch': 0.13}
+ 13%|█▎        | 894/6779 [33:04<3:38:50,  2.23s/it] 13%|█▎        | 895/6779 [33:06<3:33:38,  2.18s/it]                                                    {'loss': 1.8434, 'learning_rate': 0.00038617884098430085, 'epoch': 0.13}
+ 13%|█▎        | 895/6779 [33:06<3:33:38,  2.18s/it] 13%|█▎        | 896/6779 [33:08<3:32:50,  2.17s/it]                                                    {'loss': 1.7079, 'learning_rate': 0.0003861444562958295, 'epoch': 0.13}
+ 13%|█▎        | 896/6779 [33:08<3:32:50,  2.17s/it] 13%|█▎        | 897/6779 [33:10<3:32:20,  2.17s/it]                                                    {'loss': 1.6923, 'learning_rate': 0.00038611003042350687, 'epoch': 0.13}
+ 13%|█▎        | 897/6779 [33:10<3:32:20,  2.17s/it] 13%|█▎        | 898/6779 [33:12<3:31:11,  2.15s/it]                                                    {'loss': 1.5725, 'learning_rate': 0.0003860755633749496, 'epoch': 0.13}
+ 13%|█▎        | 898/6779 [33:12<3:31:11,  2.15s/it] 13%|█▎        | 899/6779 [33:15<3:34:31,  2.19s/it]                                                    {'loss': 1.7647, 'learning_rate': 0.0003860410551577833, 'epoch': 0.13}
+ 13%|█▎        | 899/6779 [33:15<3:34:31,  2.19s/it] 13%|█▎        | 900/6779 [33:17<3:37:38,  2.22s/it]                                                    {'loss': 1.8055, 'learning_rate': 0.0003860065057796429, 'epoch': 0.13}
+ 13%|█▎        | 900/6779 [33:17<3:37:38,  2.22s/it] 13%|█▎        | 901/6779 [33:19<3:40:42,  2.25s/it]                                                    {'loss': 1.747, 'learning_rate': 0.00038597191524817226, 'epoch': 0.13}
+ 13%|█▎        | 901/6779 [33:19<3:40:42,  2.25s/it] 13%|█▎        | 902/6779 [33:21<3:38:22,  2.23s/it]                                                    {'loss': 1.7241, 'learning_rate': 0.00038593728357102445, 'epoch': 0.13}
+ 13%|█▎        | 902/6779 [33:21<3:38:22,  2.23s/it] 13%|█▎        | 903/6779 [33:24<3:38:48,  2.23s/it]                                                    {'loss': 1.7833, 'learning_rate': 0.00038590261075586166, 'epoch': 0.13}
+ 13%|█▎        | 903/6779 [33:24<3:38:48,  2.23s/it] 13%|█▎        | 904/6779 [33:26<3:39:01,  2.24s/it]                                                    {'loss': 1.7289, 'learning_rate': 0.0003858678968103551, 'epoch': 0.13}
+ 13%|█▎        | 904/6779 [33:26<3:39:01,  2.24s/it] 13%|█▎        | 905/6779 [33:28<3:43:47,  2.29s/it]                                                    {'loss': 1.6386, 'learning_rate': 0.0003858331417421852, 'epoch': 0.13}
+ 13%|█▎        | 905/6779 [33:28<3:43:47,  2.29s/it] 13%|█▎        | 906/6779 [33:30<3:36:06,  2.21s/it]                                                    {'loss': 1.6999, 'learning_rate': 0.00038579834555904115, 'epoch': 0.13}
+ 13%|█▎        | 906/6779 [33:30<3:36:06,  2.21s/it] 13%|█▎        | 907/6779 [33:32<3:37:11,  2.22s/it]                                                    {'loss': 1.7406, 'learning_rate': 0.00038576350826862176, 'epoch': 0.13}
+ 13%|█▎        | 907/6779 [33:33<3:37:11,  2.22s/it] 13%|█▎        | 908/6779 [33:35<3:36:29,  2.21s/it]                                                    {'loss': 1.9308, 'learning_rate': 0.0003857286298786346, 'epoch': 0.13}
+ 13%|█▎        | 908/6779 [33:35<3:36:29,  2.21s/it] 13%|█▎        | 909/6779 [33:37<3:36:44,  2.22s/it]                                                    {'loss': 1.8683, 'learning_rate': 0.00038569371039679634, 'epoch': 0.13}
+ 13%|█▎        | 909/6779 [33:37<3:36:44,  2.22s/it] 13%|█▎        | 910/6779 [33:39<3:32:59,  2.18s/it]                                                    {'loss': 1.7382, 'learning_rate': 0.00038565874983083283, 'epoch': 0.13}
+ 13%|█▎        | 910/6779 [33:39<3:32:59,  2.18s/it] 13%|█▎        | 911/6779 [33:41<3:40:09,  2.25s/it]                                                    {'loss': 1.667, 'learning_rate': 0.00038562374818847903, 'epoch': 0.13}
+ 13%|█▎        | 911/6779 [33:41<3:40:09,  2.25s/it] 13%|█▎        | 912/6779 [33:44<3:40:50,  2.26s/it]                                                    {'loss': 1.8801, 'learning_rate': 0.00038558870547747887, 'epoch': 0.13}
+ 13%|█▎        | 912/6779 [33:44<3:40:50,  2.26s/it] 13%|█▎        | 913/6779 [33:46<3:41:28,  2.27s/it]                                                    {'loss': 1.8397, 'learning_rate': 0.0003855536217055854, 'epoch': 0.13}
+ 13%|█▎        | 913/6779 [33:46<3:41:28,  2.27s/it] 13%|█▎        | 914/6779 [33:48<3:40:07,  2.25s/it]                                                    {'loss': 1.8916, 'learning_rate': 0.0003855184968805609, 'epoch': 0.13}
+ 13%|█▎        | 914/6779 [33:48<3:40:07,  2.25s/it] 13%|█▎        | 915/6779 [33:51<3:42:38,  2.28s/it]                                                    {'loss': 1.6719, 'learning_rate': 0.0003854833310101765, 'epoch': 0.13}
+ 13%|█▎        | 915/6779 [33:51<3:42:38,  2.28s/it] 14%|█▎        | 916/6779 [33:53<3:37:34,  2.23s/it]                                                    {'loss': 1.7511, 'learning_rate': 0.00038544812410221265, 'epoch': 0.14}
+ 14%|█▎        | 916/6779 [33:53<3:37:34,  2.23s/it] 14%|█▎        | 917/6779 [33:55<3:37:19,  2.22s/it]                                                    {'loss': 1.8214, 'learning_rate': 0.00038541287616445876, 'epoch': 0.14}
+ 14%|█▎        | 917/6779 [33:55<3:37:19,  2.22s/it] 14%|█▎        | 918/6779 [33:57<3:35:30,  2.21s/it]                                                    {'loss': 1.9392, 'learning_rate': 0.00038537758720471325, 'epoch': 0.14}
+ 14%|█▎        | 918/6779 [33:57<3:35:30,  2.21s/it] 14%|█▎        | 919/6779 [33:59<3:33:15,  2.18s/it]                                                    {'loss': 1.8301, 'learning_rate': 0.0003853422572307837, 'epoch': 0.14}
+ 14%|█▎        | 919/6779 [33:59<3:33:15,  2.18s/it] 14%|█▎        | 920/6779 [34:01<3:30:54,  2.16s/it]                                                    {'loss': 1.7295, 'learning_rate': 0.0003853068862504868, 'epoch': 0.14}
+ 14%|█▎        | 920/6779 [34:01<3:30:54,  2.16s/it] 14%|█▎        | 921/6779 [34:03<3:28:29,  2.14s/it]                                                    {'loss': 1.6899, 'learning_rate': 0.0003852714742716482, 'epoch': 0.14}
+ 14%|█▎        | 921/6779 [34:03<3:28:29,  2.14s/it] 14%|█▎        | 922/6779 [34:06<3:29:50,  2.15s/it]                                                    {'loss': 1.7883, 'learning_rate': 0.00038523602130210267, 'epoch': 0.14}
+ 14%|█▎        | 922/6779 [34:06<3:29:50,  2.15s/it] 14%|█▎        | 923/6779 [34:08<3:29:00,  2.14s/it]                                                    {'loss': 1.7702, 'learning_rate': 0.00038520052734969417, 'epoch': 0.14}
+ 14%|█▎        | 923/6779 [34:08<3:29:00,  2.14s/it] 14%|█▎        | 924/6779 [34:10<3:32:29,  2.18s/it]                                                    {'loss': 1.6518, 'learning_rate': 0.00038516499242227556, 'epoch': 0.14}
+ 14%|█▎        | 924/6779 [34:10<3:32:29,  2.18s/it] 14%|█▎        | 925/6779 [34:12<3:26:42,  2.12s/it]                                                    {'loss': 1.8554, 'learning_rate': 0.00038512941652770876, 'epoch': 0.14}
+ 14%|█▎        | 925/6779 [34:12<3:26:42,  2.12s/it] 14%|█▎        | 926/6779 [34:14<3:32:20,  2.18s/it]                                                    {'loss': 1.6414, 'learning_rate': 0.0003850937996738649, 'epoch': 0.14}
+ 14%|█▎        | 926/6779 [34:14<3:32:20,  2.18s/it] 14%|█▎        | 927/6779 [34:17<3:42:42,  2.28s/it]                                                    {'loss': 1.6701, 'learning_rate': 0.00038505814186862413, 'epoch': 0.14}
+ 14%|█▎        | 927/6779 [34:17<3:42:42,  2.28s/it] 14%|█▎        | 928/6779 [34:19<3:40:36,  2.26s/it]                                                    {'loss': 1.8782, 'learning_rate': 0.00038502244311987554, 'epoch': 0.14}
+ 14%|█▎        | 928/6779 [34:19<3:40:36,  2.26s/it] 14%|█▎        | 929/6779 [34:21<3:36:36,  2.22s/it]                                                    {'loss': 1.5833, 'learning_rate': 0.0003849867034355174, 'epoch': 0.14}
+ 14%|█▎        | 929/6779 [34:21<3:36:36,  2.22s/it] 14%|█▎        | 930/6779 [34:24<3:45:10,  2.31s/it]                                                    {'loss': 1.9115, 'learning_rate': 0.0003849509228234569, 'epoch': 0.14}
+ 14%|█▎        | 930/6779 [34:24<3:45:10,  2.31s/it] 14%|█▎        | 931/6779 [34:26<3:44:24,  2.30s/it]                                                    {'loss': 1.8103, 'learning_rate': 0.00038491510129161057, 'epoch': 0.14}
+ 14%|█▎        | 931/6779 [34:26<3:44:24,  2.30s/it] 14%|█▎        | 932/6779 [34:28<3:44:05,  2.30s/it]                                                    {'loss': 1.5932, 'learning_rate': 0.0003848792388479037, 'epoch': 0.14}
+ 14%|█▎        | 932/6779 [34:28<3:44:05,  2.30s/it] 14%|█▍        | 933/6779 [34:31<3:45:53,  2.32s/it]                                                    {'loss': 1.7482, 'learning_rate': 0.00038484333550027074, 'epoch': 0.14}
+ 14%|█▍        | 933/6779 [34:31<3:45:53,  2.32s/it] 14%|█▍        | 934/6779 [34:33<3:46:23,  2.32s/it]                                                    {'loss': 1.7492, 'learning_rate': 0.00038480739125665514, 'epoch': 0.14}
+ 14%|█▍        | 934/6779 [34:33<3:46:23,  2.32s/it] 14%|█▍        | 935/6779 [34:35<3:40:35,  2.26s/it]                                                    {'loss': 1.854, 'learning_rate': 0.00038477140612500955, 'epoch': 0.14}
+ 14%|█▍        | 935/6779 [34:35<3:40:35,  2.26s/it] 14%|█▍        | 936/6779 [34:37<3:35:48,  2.22s/it]                                                    {'loss': 1.8805, 'learning_rate': 0.0003847353801132955, 'epoch': 0.14}
+ 14%|█▍        | 936/6779 [34:37<3:35:48,  2.22s/it] 14%|█▍        | 937/6779 [34:39<3:35:51,  2.22s/it]                                                    {'loss': 1.6904, 'learning_rate': 0.00038469931322948365, 'epoch': 0.14}
+ 14%|█▍        | 937/6779 [34:39<3:35:51,  2.22s/it] 14%|█▍        | 938/6779 [34:41<3:31:57,  2.18s/it]                                                    {'loss': 1.7712, 'learning_rate': 0.0003846632054815537, 'epoch': 0.14}
+ 14%|█▍        | 938/6779 [34:41<3:31:57,  2.18s/it] 14%|█▍        | 939/6779 [34:44<3:31:30,  2.17s/it]                                                    {'loss': 1.7026, 'learning_rate': 0.00038462705687749427, 'epoch': 0.14}
+ 14%|█▍        | 939/6779 [34:44<3:31:30,  2.17s/it] 14%|█▍        | 940/6779 [34:46<3:32:36,  2.18s/it]                                                    {'loss': 1.8307, 'learning_rate': 0.00038459086742530316, 'epoch': 0.14}
+ 14%|█▍        | 940/6779 [34:46<3:32:36,  2.18s/it] 14%|█▍        | 941/6779 [34:48<3:40:57,  2.27s/it]                                                    {'loss': 1.7355, 'learning_rate': 0.0003845546371329873, 'epoch': 0.14}
+ 14%|█▍        | 941/6779 [34:48<3:40:57,  2.27s/it] 14%|█▍        | 942/6779 [34:50<3:38:59,  2.25s/it]                                                    {'loss': 1.7913, 'learning_rate': 0.0003845183660085624, 'epoch': 0.14}
+ 14%|█▍        | 942/6779 [34:50<3:38:59,  2.25s/it] 14%|█▍        | 943/6779 [34:53<3:37:43,  2.24s/it]                                                    {'loss': 1.7272, 'learning_rate': 0.0003844820540600533, 'epoch': 0.14}
+ 14%|█▍        | 943/6779 [34:53<3:37:43,  2.24s/it] 14%|█▍        | 944/6779 [34:55<3:35:45,  2.22s/it]                                                    {'loss': 1.8121, 'learning_rate': 0.00038444570129549403, 'epoch': 0.14}
+ 14%|█▍        | 944/6779 [34:55<3:35:45,  2.22s/it] 14%|█▍        | 945/6779 [34:57<3:41:35,  2.28s/it]                                                    {'loss': 1.7415, 'learning_rate': 0.0003844093077229274, 'epoch': 0.14}
+ 14%|█▍        | 945/6779 [34:57<3:41:35,  2.28s/it] 14%|█▍        | 946/6779 [35:00<3:40:39,  2.27s/it]                                                    {'loss': 1.6635, 'learning_rate': 0.00038437287335040535, 'epoch': 0.14}
+ 14%|█▍        | 946/6779 [35:00<3:40:39,  2.27s/it] 14%|█▍        | 947/6779 [35:02<3:44:44,  2.31s/it]                                                    {'loss': 1.7637, 'learning_rate': 0.00038433639818598894, 'epoch': 0.14}
+ 14%|█▍        | 947/6779 [35:02<3:44:44,  2.31s/it] 14%|█▍        | 948/6779 [35:04<3:46:09,  2.33s/it]                                                    {'loss': 1.8602, 'learning_rate': 0.00038429988223774824, 'epoch': 0.14}
+ 14%|█▍        | 948/6779 [35:04<3:46:09,  2.33s/it] 14%|█▍        | 949/6779 [35:06<3:42:52,  2.29s/it]                                                    {'loss': 1.735, 'learning_rate': 0.0003842633255137622, 'epoch': 0.14}
+ 14%|█▍        | 949/6779 [35:07<3:42:52,  2.29s/it] 14%|█▍        | 950/6779 [35:09<3:39:10,  2.26s/it]                                                    {'loss': 1.8177, 'learning_rate': 0.0003842267280221188, 'epoch': 0.14}
+ 14%|█▍        | 950/6779 [35:09<3:39:10,  2.26s/it] 14%|█▍        | 951/6779 [35:11<3:33:45,  2.20s/it]                                                    {'loss': 1.8425, 'learning_rate': 0.0003841900897709152, 'epoch': 0.14}
+ 14%|█▍        | 951/6779 [35:11<3:33:45,  2.20s/it] 14%|█▍        | 952/6779 [35:13<3:30:42,  2.17s/it]                                                    {'loss': 1.713, 'learning_rate': 0.0003841534107682576, 'epoch': 0.14}
+ 14%|█▍        | 952/6779 [35:13<3:30:42,  2.17s/it] 14%|█▍        | 953/6779 [35:15<3:44:30,  2.31s/it]                                                    {'loss': 1.9462, 'learning_rate': 0.00038411669102226094, 'epoch': 0.14}
+ 14%|█▍        | 953/6779 [35:15<3:44:30,  2.31s/it] 14%|█▍        | 954/6779 [35:18<3:42:49,  2.30s/it]                                                    {'loss': 1.7878, 'learning_rate': 0.0003840799305410494, 'epoch': 0.14}
+ 14%|█▍        | 954/6779 [35:18<3:42:49,  2.30s/it] 14%|█▍        | 955/6779 [35:20<3:41:01,  2.28s/it]                                                    {'loss': 1.6714, 'learning_rate': 0.00038404312933275613, 'epoch': 0.14}
+ 14%|█▍        | 955/6779 [35:20<3:41:01,  2.28s/it] 14%|█▍        | 956/6779 [35:23<4:00:03,  2.47s/it]                                                    {'loss': 1.5507, 'learning_rate': 0.00038400628740552326, 'epoch': 0.14}
+ 14%|█▍        | 956/6779 [35:23<4:00:03,  2.47s/it] 14%|█▍        | 957/6779 [35:25<3:48:38,  2.36s/it]                                                    {'loss': 1.8576, 'learning_rate': 0.0003839694047675019, 'epoch': 0.14}
+ 14%|█▍        | 957/6779 [35:25<3:48:38,  2.36s/it] 14%|█▍        | 958/6779 [35:27<3:47:59,  2.35s/it]                                                    {'loss': 1.8755, 'learning_rate': 0.00038393248142685235, 'epoch': 0.14}
+ 14%|█▍        | 958/6779 [35:27<3:47:59,  2.35s/it] 14%|█▍        | 959/6779 [35:30<3:44:54,  2.32s/it]                                                    {'loss': 1.8027, 'learning_rate': 0.00038389551739174363, 'epoch': 0.14}
+ 14%|█▍        | 959/6779 [35:30<3:44:54,  2.32s/it] 14%|█▍        | 960/6779 [35:32<3:39:37,  2.26s/it]                                                    {'loss': 1.8282, 'learning_rate': 0.00038385851267035403, 'epoch': 0.14}
+ 14%|█▍        | 960/6779 [35:32<3:39:37,  2.26s/it] 14%|█▍        | 961/6779 [35:34<3:39:51,  2.27s/it]                                                    {'loss': 1.9122, 'learning_rate': 0.00038382146727087066, 'epoch': 0.14}
+ 14%|█▍        | 961/6779 [35:34<3:39:51,  2.27s/it] 14%|█▍        | 962/6779 [35:36<3:35:01,  2.22s/it]                                                    {'loss': 1.5237, 'learning_rate': 0.00038378438120148967, 'epoch': 0.14}
+ 14%|█▍        | 962/6779 [35:36<3:35:01,  2.22s/it] 14%|█▍        | 963/6779 [35:38<3:30:53,  2.18s/it]                                                    {'loss': 1.7402, 'learning_rate': 0.0003837472544704163, 'epoch': 0.14}
+ 14%|█▍        | 963/6779 [35:38<3:30:53,  2.18s/it] 14%|█▍        | 964/6779 [35:40<3:27:42,  2.14s/it]                                                    {'loss': 1.8276, 'learning_rate': 0.0003837100870858647, 'epoch': 0.14}
+ 14%|█▍        | 964/6779 [35:40<3:27:42,  2.14s/it] 14%|█▍        | 965/6779 [35:42<3:27:32,  2.14s/it]                                                    {'loss': 1.7938, 'learning_rate': 0.000383672879056058, 'epoch': 0.14}
+ 14%|█▍        | 965/6779 [35:42<3:27:32,  2.14s/it] 14%|█▍        | 966/6779 [35:45<3:32:59,  2.20s/it]                                                    {'loss': 1.6635, 'learning_rate': 0.0003836356303892283, 'epoch': 0.14}
+ 14%|█▍        | 966/6779 [35:45<3:32:59,  2.20s/it] 14%|█▍        | 967/6779 [35:47<3:38:50,  2.26s/it]                                                    {'loss': 1.9171, 'learning_rate': 0.00038359834109361686, 'epoch': 0.14}
+ 14%|█▍        | 967/6779 [35:47<3:38:50,  2.26s/it] 14%|█▍        | 968/6779 [35:49<3:40:04,  2.27s/it]                                                    {'loss': 1.7714, 'learning_rate': 0.0003835610111774738, 'epoch': 0.14}
+ 14%|█▍        | 968/6779 [35:49<3:40:04,  2.27s/it] 14%|█▍        | 969/6779 [35:52<3:41:07,  2.28s/it]                                                    {'loss': 1.6811, 'learning_rate': 0.0003835236406490582, 'epoch': 0.14}
+ 14%|█▍        | 969/6779 [35:52<3:41:07,  2.28s/it] 14%|█▍        | 970/6779 [35:54<3:44:42,  2.32s/it]                                                    {'loss': 1.9404, 'learning_rate': 0.00038348622951663817, 'epoch': 0.14}
+ 14%|█▍        | 970/6779 [35:54<3:44:42,  2.32s/it] 14%|█▍        | 971/6779 [35:56<3:35:38,  2.23s/it]                                                    {'loss': 1.7123, 'learning_rate': 0.0003834487777884908, 'epoch': 0.14}
+ 14%|█▍        | 971/6779 [35:56<3:35:38,  2.23s/it] 14%|█▍        | 972/6779 [35:58<3:32:40,  2.20s/it]                                                    {'loss': 1.6184, 'learning_rate': 0.0003834112854729021, 'epoch': 0.14}
+ 14%|█▍        | 972/6779 [35:58<3:32:40,  2.20s/it] 14%|█▍        | 973/6779 [36:01<3:34:22,  2.22s/it]                                                    {'loss': 1.7496, 'learning_rate': 0.00038337375257816727, 'epoch': 0.14}
+ 14%|█▍        | 973/6779 [36:01<3:34:22,  2.22s/it] 14%|█▍        | 974/6779 [36:03<3:30:17,  2.17s/it]                                                    {'loss': 1.8543, 'learning_rate': 0.0003833361791125903, 'epoch': 0.14}
+ 14%|█▍        | 974/6779 [36:03<3:30:17,  2.17s/it] 14%|█▍        | 975/6779 [36:05<3:33:25,  2.21s/it]                                                    {'loss': 1.7844, 'learning_rate': 0.00038329856508448405, 'epoch': 0.14}
+ 14%|█▍        | 975/6779 [36:05<3:33:25,  2.21s/it] 14%|█▍        | 976/6779 [36:07<3:41:17,  2.29s/it]                                                    {'loss': 1.8961, 'learning_rate': 0.0003832609105021707, 'epoch': 0.14}
+ 14%|█▍        | 976/6779 [36:07<3:41:17,  2.29s/it] 14%|█▍        | 977/6779 [36:10<3:45:25,  2.33s/it]                                                    {'loss': 1.7971, 'learning_rate': 0.00038322321537398105, 'epoch': 0.14}
+ 14%|█▍        | 977/6779 [36:10<3:45:25,  2.33s/it] 14%|█▍        | 978/6779 [36:12<3:43:16,  2.31s/it]                                                    {'loss': 1.995, 'learning_rate': 0.00038318547970825513, 'epoch': 0.14}
+ 14%|█▍        | 978/6779 [36:12<3:43:16,  2.31s/it] 14%|█▍        | 979/6779 [36:14<3:37:09,  2.25s/it]                                                    {'loss': 1.7378, 'learning_rate': 0.0003831477035133418, 'epoch': 0.14}
+ 14%|█▍        | 979/6779 [36:14<3:37:09,  2.25s/it] 14%|█▍        | 980/6779 [36:16<3:36:20,  2.24s/it]                                                    {'loss': 1.8699, 'learning_rate': 0.00038310988679759886, 'epoch': 0.14}
+ 14%|█▍        | 980/6779 [36:16<3:36:20,  2.24s/it] 14%|█▍        | 981/6779 [36:19<3:34:52,  2.22s/it]                                                    {'loss': 1.6779, 'learning_rate': 0.0003830720295693932, 'epoch': 0.14}
+ 14%|█▍        | 981/6779 [36:19<3:34:52,  2.22s/it] 14%|█▍        | 982/6779 [36:21<3:29:51,  2.17s/it]                                                    {'loss': 1.8467, 'learning_rate': 0.0003830341318371006, 'epoch': 0.14}
+ 14%|█▍        | 982/6779 [36:21<3:29:51,  2.17s/it] 15%|█▍        | 983/6779 [36:23<3:31:34,  2.19s/it]                                                    {'loss': 1.6427, 'learning_rate': 0.00038299619360910583, 'epoch': 0.15}
+ 15%|█▍        | 983/6779 [36:23<3:31:34,  2.19s/it] 15%|█▍        | 984/6779 [36:25<3:34:42,  2.22s/it]                                                    {'loss': 1.6787, 'learning_rate': 0.0003829582148938025, 'epoch': 0.15}
+ 15%|█▍        | 984/6779 [36:25<3:34:42,  2.22s/it] 15%|█▍        | 985/6779 [36:27<3:33:17,  2.21s/it]                                                    {'loss': 1.8548, 'learning_rate': 0.0003829201956995934, 'epoch': 0.15}
+ 15%|█▍        | 985/6779 [36:27<3:33:17,  2.21s/it] 15%|█▍        | 986/6779 [36:29<3:29:40,  2.17s/it]                                                    {'loss': 1.8118, 'learning_rate': 0.00038288213603489003, 'epoch': 0.15}
+ 15%|█▍        | 986/6779 [36:29<3:29:40,  2.17s/it] 15%|█▍        | 987/6779 [36:31<3:25:08,  2.13s/it]                                                    {'loss': 1.66, 'learning_rate': 0.0003828440359081131, 'epoch': 0.15}
+ 15%|█▍        | 987/6779 [36:31<3:25:08,  2.13s/it] 15%|█▍        | 988/6779 [36:34<3:28:46,  2.16s/it]                                                    {'loss': 1.8314, 'learning_rate': 0.00038280589532769204, 'epoch': 0.15}
+ 15%|█▍        | 988/6779 [36:34<3:28:46,  2.16s/it] 15%|█▍        | 989/6779 [36:36<3:31:50,  2.20s/it]                                                    {'loss': 1.7294, 'learning_rate': 0.0003827677143020653, 'epoch': 0.15}
+ 15%|█▍        | 989/6779 [36:36<3:31:50,  2.20s/it] 15%|█▍        | 990/6779 [36:38<3:28:11,  2.16s/it]                                                    {'loss': 1.8218, 'learning_rate': 0.0003827294928396804, 'epoch': 0.15}
+ 15%|█▍        | 990/6779 [36:38<3:28:11,  2.16s/it] 15%|█▍        | 991/6779 [36:40<3:25:59,  2.14s/it]                                                    {'loss': 1.9946, 'learning_rate': 0.0003826912309489937, 'epoch': 0.15}
+ 15%|█▍        | 991/6779 [36:40<3:25:59,  2.14s/it] 15%|█▍        | 992/6779 [36:42<3:33:03,  2.21s/it]                                                    {'loss': 1.7639, 'learning_rate': 0.0003826529286384705, 'epoch': 0.15}
+ 15%|█▍        | 992/6779 [36:42<3:33:03,  2.21s/it] 15%|█▍        | 993/6779 [36:45<3:43:04,  2.31s/it]                                                    {'loss': 1.85, 'learning_rate': 0.0003826145859165851, 'epoch': 0.15}
+ 15%|█▍        | 993/6779 [36:45<3:43:04,  2.31s/it] 15%|█▍        | 994/6779 [36:47<3:38:56,  2.27s/it]                                                    {'loss': 1.8637, 'learning_rate': 0.00038257620279182064, 'epoch': 0.15}
+ 15%|█▍        | 994/6779 [36:47<3:38:56,  2.27s/it] 15%|█▍        | 995/6779 [36:49<3:34:26,  2.22s/it]                                                    {'loss': 1.9304, 'learning_rate': 0.0003825377792726692, 'epoch': 0.15}
+ 15%|█▍        | 995/6779 [36:49<3:34:26,  2.22s/it] 15%|█▍        | 996/6779 [36:51<3:26:43,  2.14s/it]                                                    {'loss': 1.9155, 'learning_rate': 0.00038249931536763203, 'epoch': 0.15}
+ 15%|█▍        | 996/6779 [36:51<3:26:43,  2.14s/it] 15%|█▍        | 997/6779 [36:53<3:26:22,  2.14s/it]                                                    {'loss': 1.7579, 'learning_rate': 0.000382460811085219, 'epoch': 0.15}
+ 15%|█▍        | 997/6779 [36:53<3:26:22,  2.14s/it] 15%|█▍        | 998/6779 [36:55<3:21:22,  2.09s/it]                                                    {'loss': 1.8207, 'learning_rate': 0.0003824222664339491, 'epoch': 0.15}
+ 15%|█▍        | 998/6779 [36:55<3:21:22,  2.09s/it] 15%|█▍        | 999/6779 [36:58<3:23:08,  2.11s/it]                                                    {'loss': 1.8678, 'learning_rate': 0.0003823836814223503, 'epoch': 0.15}
+ 15%|█▍        | 999/6779 [36:58<3:23:08,  2.11s/it] 15%|█▍        | 1000/6779 [37:00<3:21:15,  2.09s/it]                                                     {'loss': 1.8197, 'learning_rate': 0.00038234505605895926, 'epoch': 0.15}
+ 15%|█▍        | 1000/6779 [37:00<3:21:15,  2.09s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+ 15%|█▍        | 1001/6779 [37:02<3:44:47,  2.33s/it]                                                     {'loss': 1.7391, 'learning_rate': 0.00038230639035232176, 'epoch': 0.15}
+ 15%|█▍        | 1001/6779 [37:02<3:44:47,  2.33s/it] 15%|█▍        | 1002/6779 [37:05<3:44:53,  2.34s/it]                                                     {'loss': 1.6486, 'learning_rate': 0.0003822676843109925, 'epoch': 0.15}
+ 15%|█▍        | 1002/6779 [37:05<3:44:53,  2.34s/it] 15%|█▍        | 1003/6779 [37:07<3:35:45,  2.24s/it]                                                     {'loss': 1.8772, 'learning_rate': 0.00038222893794353504, 'epoch': 0.15}
+ 15%|█▍        | 1003/6779 [37:07<3:35:45,  2.24s/it] 15%|█▍        | 1004/6779 [37:09<3:41:40,  2.30s/it]                                                     {'loss': 2.0014, 'learning_rate': 0.0003821901512585219, 'epoch': 0.15}
+ 15%|█▍        | 1004/6779 [37:09<3:41:40,  2.30s/it] 15%|█▍        | 1005/6779 [37:12<3:44:31,  2.33s/it]                                                     {'loss': 1.8011, 'learning_rate': 0.0003821513242645345, 'epoch': 0.15}
+ 15%|█▍        | 1005/6779 [37:12<3:44:31,  2.33s/it] 15%|█▍        | 1006/6779 [37:14<3:37:37,  2.26s/it]                                                     {'loss': 1.7971, 'learning_rate': 0.00038211245697016314, 'epoch': 0.15}
+ 15%|█▍        | 1006/6779 [37:14<3:37:37,  2.26s/it] 15%|█▍        | 1007/6779 [37:16<3:35:04,  2.24s/it]                                                     {'loss': 1.7672, 'learning_rate': 0.00038207354938400717, 'epoch': 0.15}
+ 15%|█▍        | 1007/6779 [37:16<3:35:04,  2.24s/it] 15%|█▍        | 1008/6779 [37:18<3:35:01,  2.24s/it]                                                     {'loss': 1.7807, 'learning_rate': 0.0003820346015146747, 'epoch': 0.15}
+ 15%|█▍        | 1008/6779 [37:18<3:35:01,  2.24s/it] 15%|█▍        | 1009/6779 [37:20<3:35:26,  2.24s/it]                                                     {'loss': 1.7486, 'learning_rate': 0.00038199561337078287, 'epoch': 0.15}
+ 15%|█▍        | 1009/6779 [37:20<3:35:26,  2.24s/it] 15%|█▍        | 1010/6779 [37:23<3:32:14,  2.21s/it]                                                     {'loss': 1.8099, 'learning_rate': 0.00038195658496095763, 'epoch': 0.15}
+ 15%|█▍        | 1010/6779 [37:23<3:32:14,  2.21s/it] 15%|█▍        | 1011/6779 [37:25<3:26:51,  2.15s/it]                                                     {'loss': 1.7971, 'learning_rate': 0.0003819175162938339, 'epoch': 0.15}
+ 15%|█▍        | 1011/6779 [37:25<3:26:51,  2.15s/it] 15%|█▍        | 1012/6779 [37:27<3:27:56,  2.16s/it]                                                     {'loss': 1.6976, 'learning_rate': 0.0003818784073780555, 'epoch': 0.15}
+ 15%|█▍        | 1012/6779 [37:27<3:27:56,  2.16s/it] 15%|█▍        | 1013/6779 [37:29<3:31:31,  2.20s/it]                                                     {'loss': 1.9194, 'learning_rate': 0.00038183925822227513, 'epoch': 0.15}
+ 15%|█▍        | 1013/6779 [37:29<3:31:31,  2.20s/it] 15%|█▍        | 1014/6779 [37:31<3:33:54,  2.23s/it]                                                     {'loss': 1.6152, 'learning_rate': 0.00038180006883515444, 'epoch': 0.15}
+ 15%|█▍        | 1014/6779 [37:31<3:33:54,  2.23s/it] 15%|█▍        | 1015/6779 [37:34<3:41:20,  2.30s/it]                                                     {'loss': 1.8644, 'learning_rate': 0.000381760839225364, 'epoch': 0.15}
+ 15%|█▍        | 1015/6779 [37:34<3:41:20,  2.30s/it] 15%|█▍        | 1016/6779 [37:36<3:30:41,  2.19s/it]                                                     {'loss': 1.7561, 'learning_rate': 0.00038172156940158313, 'epoch': 0.15}
+ 15%|█▍        | 1016/6779 [37:36<3:30:41,  2.19s/it] 15%|█▌        | 1017/6779 [37:38<3:26:00,  2.15s/it]                                                     {'loss': 1.6371, 'learning_rate': 0.0003816822593725002, 'epoch': 0.15}
+ 15%|█▌        | 1017/6779 [37:38<3:26:00,  2.15s/it] 15%|█▌        | 1018/6779 [37:40<3:23:28,  2.12s/it]                                                     {'loss': 1.7635, 'learning_rate': 0.00038164290914681243, 'epoch': 0.15}
+ 15%|█▌        | 1018/6779 [37:40<3:23:28,  2.12s/it] 15%|█▌        | 1019/6779 [37:42<3:24:59,  2.14s/it]                                                     {'loss': 1.6866, 'learning_rate': 0.00038160351873322597, 'epoch': 0.15}
+ 15%|█▌        | 1019/6779 [37:42<3:24:59,  2.14s/it] 15%|█▌        | 1020/6779 [37:44<3:31:43,  2.21s/it]                                                     {'loss': 1.8289, 'learning_rate': 0.0003815640881404557, 'epoch': 0.15}
+ 15%|█▌        | 1020/6779 [37:44<3:31:43,  2.21s/it] 15%|█▌        | 1021/6779 [37:47<3:29:50,  2.19s/it]                                                     {'loss': 1.6568, 'learning_rate': 0.00038152461737722557, 'epoch': 0.15}
+ 15%|█▌        | 1021/6779 [37:47<3:29:50,  2.19s/it] 15%|█▌        | 1022/6779 [37:49<3:27:26,  2.16s/it]                                                     {'loss': 1.7354, 'learning_rate': 0.0003814851064522684, 'epoch': 0.15}
+ 15%|█▌        | 1022/6779 [37:49<3:27:26,  2.16s/it] 15%|█▌        | 1023/6779 [37:51<3:28:06,  2.17s/it]                                                     {'loss': 1.8734, 'learning_rate': 0.00038144555537432585, 'epoch': 0.15}
+ 15%|█▌        | 1023/6779 [37:51<3:28:06,  2.17s/it] 15%|█▌        | 1024/6779 [37:53<3:27:26,  2.16s/it]                                                     {'loss': 1.7821, 'learning_rate': 0.00038140596415214844, 'epoch': 0.15}
+ 15%|█▌        | 1024/6779 [37:53<3:27:26,  2.16s/it] 15%|█▌        | 1025/6779 [37:56<3:38:20,  2.28s/it]                                                     {'loss': 1.7927, 'learning_rate': 0.00038136633279449553, 'epoch': 0.15}
+ 15%|█▌        | 1025/6779 [37:56<3:38:20,  2.28s/it] 15%|█▌        | 1026/6779 [37:58<3:31:48,  2.21s/it]                                                     {'loss': 1.7026, 'learning_rate': 0.0003813266613101356, 'epoch': 0.15}
+ 15%|█▌        | 1026/6779 [37:58<3:31:48,  2.21s/it] 15%|█▌        | 1027/6779 [38:00<3:32:44,  2.22s/it]                                                     {'loss': 1.7643, 'learning_rate': 0.0003812869497078456, 'epoch': 0.15}
+ 15%|█▌        | 1027/6779 [38:00<3:32:44,  2.22s/it] 15%|█▌        | 1028/6779 [38:02<3:31:02,  2.20s/it]                                                     {'loss': 1.8583, 'learning_rate': 0.00038124719799641183, 'epoch': 0.15}
+ 15%|█▌        | 1028/6779 [38:02<3:31:02,  2.20s/it] 15%|█▌        | 1029/6779 [38:04<3:30:38,  2.20s/it]                                                     {'loss': 1.9038, 'learning_rate': 0.0003812074061846291, 'epoch': 0.15}
+ 15%|█▌        | 1029/6779 [38:04<3:30:38,  2.20s/it] 15%|█▌        | 1030/6779 [38:06<3:28:30,  2.18s/it]                                                     {'loss': 1.76, 'learning_rate': 0.00038116757428130113, 'epoch': 0.15}
+ 15%|█▌        | 1030/6779 [38:06<3:28:30,  2.18s/it] 15%|█▌        | 1031/6779 [38:09<3:42:45,  2.33s/it]                                                     {'loss': 1.8124, 'learning_rate': 0.0003811277022952409, 'epoch': 0.15}
+ 15%|█▌        | 1031/6779 [38:09<3:42:45,  2.33s/it] 15%|█▌        | 1032/6779 [38:13<4:23:48,  2.75s/it]                                                     {'loss': 1.9363, 'learning_rate': 0.0003810877902352696, 'epoch': 0.15}
+ 15%|█▌        | 1032/6779 [38:13<4:23:48,  2.75s/it] 15%|█▌        | 1033/6779 [38:15<4:12:27,  2.64s/it]                                                     {'loss': 1.8008, 'learning_rate': 0.0003810478381102178, 'epoch': 0.15}
+ 15%|█▌        | 1033/6779 [38:15<4:12:27,  2.64s/it] 15%|█▌        | 1034/6779 [38:18<4:09:17,  2.60s/it]                                                     {'loss': 1.7251, 'learning_rate': 0.0003810078459289249, 'epoch': 0.15}
+ 15%|█▌        | 1034/6779 [38:18<4:09:17,  2.60s/it] 15%|█▌        | 1035/6779 [38:20<3:56:27,  2.47s/it]                                                     {'loss': 1.9593, 'learning_rate': 0.0003809678137002388, 'epoch': 0.15}
+ 15%|█▌        | 1035/6779 [38:20<3:56:27,  2.47s/it] 15%|█▌        | 1036/6779 [38:22<3:49:33,  2.40s/it]                                                     {'loss': 1.687, 'learning_rate': 0.0003809277414330167, 'epoch': 0.15}
+ 15%|█▌        | 1036/6779 [38:22<3:49:33,  2.40s/it] 15%|█▌        | 1037/6779 [38:24<3:49:30,  2.40s/it]                                                     {'loss': 1.8318, 'learning_rate': 0.00038088762913612433, 'epoch': 0.15}
+ 15%|█▌        | 1037/6779 [38:24<3:49:30,  2.40s/it] 15%|█▌        | 1038/6779 [38:27<3:42:08,  2.32s/it]                                                     {'loss': 1.8841, 'learning_rate': 0.0003808474768184365, 'epoch': 0.15}
+ 15%|█▌        | 1038/6779 [38:27<3:42:08,  2.32s/it] 15%|█▌        | 1039/6779 [38:29<3:33:05,  2.23s/it]                                                     {'loss': 1.6765, 'learning_rate': 0.00038080728448883666, 'epoch': 0.15}
+ 15%|█▌        | 1039/6779 [38:29<3:33:05,  2.23s/it] 15%|█▌        | 1040/6779 [38:31<3:34:35,  2.24s/it]                                                     {'loss': 1.6513, 'learning_rate': 0.0003807670521562174, 'epoch': 0.15}
+ 15%|█▌        | 1040/6779 [38:31<3:34:35,  2.24s/it] 15%|█▌        | 1041/6779 [38:33<3:29:57,  2.20s/it]                                                     {'loss': 1.8738, 'learning_rate': 0.0003807267798294798, 'epoch': 0.15}
+ 15%|█▌        | 1041/6779 [38:33<3:29:57,  2.20s/it] 15%|█▌        | 1042/6779 [38:35<3:31:39,  2.21s/it]                                                     {'loss': 1.8443, 'learning_rate': 0.0003806864675175341, 'epoch': 0.15}
+ 15%|█▌        | 1042/6779 [38:35<3:31:39,  2.21s/it] 15%|█▌        | 1043/6779 [38:37<3:28:30,  2.18s/it]                                                     {'loss': 1.7169, 'learning_rate': 0.00038064611522929925, 'epoch': 0.15}
+ 15%|█▌        | 1043/6779 [38:37<3:28:30,  2.18s/it] 15%|█▌        | 1044/6779 [38:39<3:25:42,  2.15s/it]                                                     {'loss': 1.7395, 'learning_rate': 0.00038060572297370305, 'epoch': 0.15}
+ 15%|█▌        | 1044/6779 [38:39<3:25:42,  2.15s/it] 15%|█▌        | 1045/6779 [38:42<3:27:14,  2.17s/it]                                                     {'loss': 1.7651, 'learning_rate': 0.00038056529075968215, 'epoch': 0.15}
+ 15%|█▌        | 1045/6779 [38:42<3:27:14,  2.17s/it] 15%|█▌        | 1046/6779 [38:44<3:31:26,  2.21s/it]                                                     {'loss': 1.7923, 'learning_rate': 0.0003805248185961821, 'epoch': 0.15}
+ 15%|█▌        | 1046/6779 [38:44<3:31:26,  2.21s/it] 15%|█▌        | 1047/6779 [38:46<3:31:07,  2.21s/it]                                                     {'loss': 1.9696, 'learning_rate': 0.0003804843064921571, 'epoch': 0.15}
+ 15%|█▌        | 1047/6779 [38:46<3:31:07,  2.21s/it] 15%|█▌        | 1048/6779 [38:48<3:31:32,  2.21s/it]                                                     {'loss': 1.8612, 'learning_rate': 0.00038044375445657046, 'epoch': 0.15}
+ 15%|█▌        | 1048/6779 [38:48<3:31:32,  2.21s/it] 15%|█▌        | 1049/6779 [38:51<3:33:34,  2.24s/it]                                                     {'loss': 1.8656, 'learning_rate': 0.00038040316249839416, 'epoch': 0.15}
+ 15%|█▌        | 1049/6779 [38:51<3:33:34,  2.24s/it] 15%|█▌        | 1050/6779 [38:53<3:31:54,  2.22s/it]                                                     {'loss': 1.6985, 'learning_rate': 0.0003803625306266089, 'epoch': 0.15}
+ 15%|█▌        | 1050/6779 [38:53<3:31:54,  2.22s/it] 16%|█▌        | 1051/6779 [38:55<3:33:18,  2.23s/it]                                                     {'loss': 1.7921, 'learning_rate': 0.0003803218588502046, 'epoch': 0.16}
+ 16%|█▌        | 1051/6779 [38:55<3:33:18,  2.23s/it] 16%|█▌        | 1052/6779 [38:57<3:38:17,  2.29s/it]                                                     {'loss': 1.7083, 'learning_rate': 0.00038028114717817953, 'epoch': 0.16}
+ 16%|█▌        | 1052/6779 [38:57<3:38:17,  2.29s/it] 16%|█▌        | 1053/6779 [39:00<3:31:10,  2.21s/it]                                                     {'loss': 1.6507, 'learning_rate': 0.0003802403956195411, 'epoch': 0.16}
+ 16%|█▌        | 1053/6779 [39:00<3:31:10,  2.21s/it] 16%|█▌        | 1054/6779 [39:02<3:32:56,  2.23s/it]                                                     {'loss': 1.7636, 'learning_rate': 0.00038019960418330545, 'epoch': 0.16}
+ 16%|█▌        | 1054/6779 [39:02<3:32:56,  2.23s/it] 16%|█▌        | 1055/6779 [39:04<3:30:46,  2.21s/it]                                                     {'loss': 1.9297, 'learning_rate': 0.00038015877287849754, 'epoch': 0.16}
+ 16%|█▌        | 1055/6779 [39:04<3:30:46,  2.21s/it] 16%|█▌        | 1056/6779 [39:06<3:34:58,  2.25s/it]                                                     {'loss': 1.6816, 'learning_rate': 0.00038011790171415123, 'epoch': 0.16}
+ 16%|█▌        | 1056/6779 [39:06<3:34:58,  2.25s/it] 16%|█▌        | 1057/6779 [39:09<3:38:36,  2.29s/it]                                                     {'loss': 1.7119, 'learning_rate': 0.000380076990699309, 'epoch': 0.16}
+ 16%|█▌        | 1057/6779 [39:09<3:38:36,  2.29s/it] 16%|█▌        | 1058/6779 [39:11<3:36:13,  2.27s/it]                                                     {'loss': 1.7012, 'learning_rate': 0.0003800360398430225, 'epoch': 0.16}
+ 16%|█▌        | 1058/6779 [39:11<3:36:13,  2.27s/it] 16%|█▌        | 1059/6779 [39:13<3:42:22,  2.33s/it]                                                     {'loss': 1.7869, 'learning_rate': 0.0003799950491543517, 'epoch': 0.16}
+ 16%|█▌        | 1059/6779 [39:13<3:42:22,  2.33s/it] 16%|█▌        | 1060/6779 [39:16<3:41:21,  2.32s/it]                                                     {'loss': 1.783, 'learning_rate': 0.00037995401864236586, 'epoch': 0.16}
+ 16%|█▌        | 1060/6779 [39:16<3:41:21,  2.32s/it] 16%|█▌        | 1061/6779 [39:18<3:36:05,  2.27s/it]                                                     {'loss': 1.8421, 'learning_rate': 0.00037991294831614283, 'epoch': 0.16}
+ 16%|█▌        | 1061/6779 [39:18<3:36:05,  2.27s/it] 16%|█▌        | 1062/6779 [39:20<3:34:27,  2.25s/it]                                                     {'loss': 1.7394, 'learning_rate': 0.00037987183818476915, 'epoch': 0.16}
+ 16%|█▌        | 1062/6779 [39:20<3:34:27,  2.25s/it] 16%|█▌        | 1063/6779 [39:22<3:30:42,  2.21s/it]                                                     {'loss': 1.5947, 'learning_rate': 0.00037983068825734033, 'epoch': 0.16}
+ 16%|█▌        | 1063/6779 [39:22<3:30:42,  2.21s/it] 16%|█▌        | 1064/6779 [39:24<3:32:23,  2.23s/it]                                                     {'loss': 1.6738, 'learning_rate': 0.00037978949854296077, 'epoch': 0.16}
+ 16%|█▌        | 1064/6779 [39:24<3:32:23,  2.23s/it] 16%|█▌        | 1065/6779 [39:27<3:32:21,  2.23s/it]                                                     {'loss': 1.8265, 'learning_rate': 0.00037974826905074355, 'epoch': 0.16}
+ 16%|█▌        | 1065/6779 [39:27<3:32:21,  2.23s/it] 16%|█▌        | 1066/6779 [39:29<3:31:53,  2.23s/it]                                                     {'loss': 1.6617, 'learning_rate': 0.00037970699978981046, 'epoch': 0.16}
+ 16%|█▌        | 1066/6779 [39:29<3:31:53,  2.23s/it] 16%|█▌        | 1067/6779 [39:31<3:27:49,  2.18s/it]                                                     {'loss': 1.9785, 'learning_rate': 0.00037966569076929225, 'epoch': 0.16}
+ 16%|█▌        | 1067/6779 [39:31<3:27:49,  2.18s/it] 16%|█▌        | 1068/6779 [39:33<3:24:53,  2.15s/it]                                                     {'loss': 1.7325, 'learning_rate': 0.0003796243419983283, 'epoch': 0.16}
+ 16%|█▌        | 1068/6779 [39:33<3:24:53,  2.15s/it] 16%|█▌        | 1069/6779 [39:35<3:20:15,  2.10s/it]                                                     {'loss': 1.6539, 'learning_rate': 0.0003795829534860671, 'epoch': 0.16}
+ 16%|█▌        | 1069/6779 [39:35<3:20:15,  2.10s/it] 16%|█▌        | 1070/6779 [39:37<3:19:21,  2.10s/it]                                                     {'loss': 1.9021, 'learning_rate': 0.0003795415252416656, 'epoch': 0.16}
+ 16%|█▌        | 1070/6779 [39:37<3:19:21,  2.10s/it] 16%|█▌        | 1071/6779 [39:39<3:21:12,  2.12s/it]                                                     {'loss': 1.7447, 'learning_rate': 0.0003795000572742896, 'epoch': 0.16}
+ 16%|█▌        | 1071/6779 [39:39<3:21:12,  2.12s/it] 16%|█▌        | 1072/6779 [39:41<3:22:23,  2.13s/it]                                                     {'loss': 1.8943, 'learning_rate': 0.00037945854959311386, 'epoch': 0.16}
+ 16%|█▌        | 1072/6779 [39:41<3:22:23,  2.13s/it] 16%|█▌        | 1073/6779 [39:43<3:19:16,  2.10s/it]                                                     {'loss': 1.8136, 'learning_rate': 0.0003794170022073218, 'epoch': 0.16}
+ 16%|█▌        | 1073/6779 [39:43<3:19:16,  2.10s/it] 16%|█▌        | 1074/6779 [39:46<3:19:28,  2.10s/it]                                                     {'loss': 1.75, 'learning_rate': 0.00037937541512610563, 'epoch': 0.16}
+ 16%|█▌        | 1074/6779 [39:46<3:19:28,  2.10s/it] 16%|█▌        | 1075/6779 [39:48<3:17:21,  2.08s/it]                                                     {'loss': 1.7596, 'learning_rate': 0.0003793337883586663, 'epoch': 0.16}
+ 16%|█▌        | 1075/6779 [39:48<3:17:21,  2.08s/it] 16%|█▌        | 1076/6779 [39:50<3:17:02,  2.07s/it]                                                     {'loss': 1.7274, 'learning_rate': 0.00037929212191421363, 'epoch': 0.16}
+ 16%|█▌        | 1076/6779 [39:50<3:17:02,  2.07s/it] 16%|█▌        | 1077/6779 [39:52<3:18:44,  2.09s/it]                                                     {'loss': 1.7417, 'learning_rate': 0.00037925041580196624, 'epoch': 0.16}
+ 16%|█▌        | 1077/6779 [39:52<3:18:44,  2.09s/it] 16%|█▌        | 1078/6779 [39:54<3:26:16,  2.17s/it]                                                     {'loss': 1.6112, 'learning_rate': 0.0003792086700311514, 'epoch': 0.16}
+ 16%|█▌        | 1078/6779 [39:54<3:26:16,  2.17s/it] 16%|█▌        | 1079/6779 [39:56<3:28:35,  2.20s/it]                                                     {'loss': 1.9272, 'learning_rate': 0.0003791668846110053, 'epoch': 0.16}
+ 16%|█▌        | 1079/6779 [39:56<3:28:35,  2.20s/it] 16%|█▌        | 1080/6779 [39:59<3:29:44,  2.21s/it]                                                     {'loss': 1.733, 'learning_rate': 0.00037912505955077275, 'epoch': 0.16}
+ 16%|█▌        | 1080/6779 [39:59<3:29:44,  2.21s/it] 16%|█▌        | 1081/6779 [40:01<3:33:50,  2.25s/it]                                                     {'loss': 1.8467, 'learning_rate': 0.0003790831948597075, 'epoch': 0.16}
+ 16%|█▌        | 1081/6779 [40:01<3:33:50,  2.25s/it] 16%|█▌        | 1082/6779 [40:03<3:29:39,  2.21s/it]                                                     {'loss': 1.9008, 'learning_rate': 0.0003790412905470718, 'epoch': 0.16}
+ 16%|█▌        | 1082/6779 [40:03<3:29:39,  2.21s/it] 16%|█▌        | 1083/6779 [40:05<3:30:34,  2.22s/it]                                                     {'loss': 1.7685, 'learning_rate': 0.000378999346622137, 'epoch': 0.16}
+ 16%|█▌        | 1083/6779 [40:05<3:30:34,  2.22s/it] 16%|█▌        | 1084/6779 [40:07<3:29:42,  2.21s/it]                                                     {'loss': 1.6602, 'learning_rate': 0.00037895736309418305, 'epoch': 0.16}
+ 16%|█▌        | 1084/6779 [40:08<3:29:42,  2.21s/it] 16%|█▌        | 1085/6779 [40:10<3:31:25,  2.23s/it]                                                     {'loss': 1.8033, 'learning_rate': 0.00037891533997249857, 'epoch': 0.16}
+ 16%|█▌        | 1085/6779 [40:10<3:31:25,  2.23s/it] 16%|█▌        | 1086/6779 [40:12<3:32:46,  2.24s/it]                                                     {'loss': 1.7919, 'learning_rate': 0.0003788732772663812, 'epoch': 0.16}
+ 16%|█▌        | 1086/6779 [40:12<3:32:46,  2.24s/it] 16%|█▌        | 1087/6779 [40:14<3:36:30,  2.28s/it]                                                     {'loss': 1.9135, 'learning_rate': 0.000378831174985137, 'epoch': 0.16}
+ 16%|█▌        | 1087/6779 [40:14<3:36:30,  2.28s/it] 16%|█▌        | 1088/6779 [40:17<3:42:30,  2.35s/it]                                                     {'loss': 1.7735, 'learning_rate': 0.000378789033138081, 'epoch': 0.16}
+ 16%|█▌        | 1088/6779 [40:17<3:42:30,  2.35s/it] 16%|█▌        | 1089/6779 [40:19<3:35:43,  2.27s/it]                                                     {'loss': 1.7759, 'learning_rate': 0.0003787468517345371, 'epoch': 0.16}
+ 16%|█▌        | 1089/6779 [40:19<3:35:43,  2.27s/it] 16%|█▌        | 1090/6779 [40:21<3:34:10,  2.26s/it]                                                     {'loss': 1.7214, 'learning_rate': 0.00037870463078383754, 'epoch': 0.16}
+ 16%|█▌        | 1090/6779 [40:21<3:34:10,  2.26s/it] 16%|█▌        | 1091/6779 [40:23<3:32:43,  2.24s/it]                                                     {'loss': 1.8756, 'learning_rate': 0.0003786623702953238, 'epoch': 0.16}
+ 16%|█▌        | 1091/6779 [40:23<3:32:43,  2.24s/it] 16%|█▌        | 1092/6779 [40:26<3:35:22,  2.27s/it]                                                     {'loss': 1.8928, 'learning_rate': 0.00037862007027834573, 'epoch': 0.16}
+ 16%|█▌        | 1092/6779 [40:26<3:35:22,  2.27s/it] 16%|█▌        | 1093/6779 [40:28<3:30:04,  2.22s/it]                                                     {'loss': 1.8846, 'learning_rate': 0.0003785777307422622, 'epoch': 0.16}
+ 16%|█▌        | 1093/6779 [40:28<3:30:04,  2.22s/it] 16%|█▌        | 1094/6779 [40:30<3:25:39,  2.17s/it]                                                     {'loss': 1.7715, 'learning_rate': 0.0003785353516964405, 'epoch': 0.16}
+ 16%|█▌        | 1094/6779 [40:30<3:25:39,  2.17s/it] 16%|█▌        | 1095/6779 [40:32<3:25:18,  2.17s/it]                                                     {'loss': 1.6682, 'learning_rate': 0.0003784929331502571, 'epoch': 0.16}
+ 16%|█▌        | 1095/6779 [40:32<3:25:18,  2.17s/it] 16%|█▌        | 1096/6779 [40:34<3:31:07,  2.23s/it]                                                     {'loss': 1.8008, 'learning_rate': 0.00037845047511309677, 'epoch': 0.16}
+ 16%|█▌        | 1096/6779 [40:34<3:31:07,  2.23s/it] 16%|█▌        | 1097/6779 [40:37<3:34:05,  2.26s/it]                                                     {'loss': 1.8355, 'learning_rate': 0.00037840797759435327, 'epoch': 0.16}
+ 16%|█▌        | 1097/6779 [40:37<3:34:05,  2.26s/it] 16%|█▌        | 1098/6779 [40:39<3:33:37,  2.26s/it]                                                     {'loss': 1.8787, 'learning_rate': 0.00037836544060342904, 'epoch': 0.16}
+ 16%|█▌        | 1098/6779 [40:39<3:33:37,  2.26s/it] 16%|█▌        | 1099/6779 [40:42<3:42:49,  2.35s/it]                                                     {'loss': 1.7593, 'learning_rate': 0.0003783228641497353, 'epoch': 0.16}
+ 16%|█▌        | 1099/6779 [40:42<3:42:49,  2.35s/it] 16%|█▌        | 1100/6779 [40:44<3:36:42,  2.29s/it]                                                     {'loss': 1.7051, 'learning_rate': 0.00037828024824269185, 'epoch': 0.16}
+ 16%|█▌        | 1100/6779 [40:44<3:36:42,  2.29s/it] 16%|█▌        | 1101/6779 [40:46<3:38:00,  2.30s/it]                                                     {'loss': 1.7306, 'learning_rate': 0.0003782375928917274, 'epoch': 0.16}
+ 16%|█▌        | 1101/6779 [40:46<3:38:00,  2.30s/it] 16%|█▋        | 1102/6779 [40:48<3:31:31,  2.24s/it]                                                     {'loss': 1.7865, 'learning_rate': 0.0003781948981062793, 'epoch': 0.16}
+ 16%|█▋        | 1102/6779 [40:48<3:31:31,  2.24s/it] 16%|█▋        | 1103/6779 [40:50<3:27:05,  2.19s/it]                                                     {'loss': 1.6461, 'learning_rate': 0.00037815216389579356, 'epoch': 0.16}
+ 16%|█▋        | 1103/6779 [40:50<3:27:05,  2.19s/it] 16%|█▋        | 1104/6779 [40:52<3:23:52,  2.16s/it]                                                     {'loss': 1.8314, 'learning_rate': 0.0003781093902697251, 'epoch': 0.16}
+ 16%|█▋        | 1104/6779 [40:52<3:23:52,  2.16s/it] 16%|█▋        | 1105/6779 [40:54<3:18:09,  2.10s/it]                                                     {'loss': 1.921, 'learning_rate': 0.0003780665772375374, 'epoch': 0.16}
+ 16%|█▋        | 1105/6779 [40:54<3:18:09,  2.10s/it] 16%|█▋        | 1106/6779 [40:57<3:21:42,  2.13s/it]                                                     {'loss': 1.7857, 'learning_rate': 0.00037802372480870254, 'epoch': 0.16}
+ 16%|█▋        | 1106/6779 [40:57<3:21:42,  2.13s/it] 16%|█▋        | 1107/6779 [40:59<3:27:04,  2.19s/it]                                                     {'loss': 1.8049, 'learning_rate': 0.00037798083299270176, 'epoch': 0.16}
+ 16%|█▋        | 1107/6779 [40:59<3:27:04,  2.19s/it] 16%|█▋        | 1108/6779 [41:02<3:40:21,  2.33s/it]                                                     {'loss': 1.9378, 'learning_rate': 0.00037793790179902457, 'epoch': 0.16}
+ 16%|█▋        | 1108/6779 [41:02<3:40:21,  2.33s/it] 16%|█▋        | 1109/6779 [41:04<3:30:55,  2.23s/it]                                                     {'loss': 1.8001, 'learning_rate': 0.0003778949312371693, 'epoch': 0.16}
+ 16%|█▋        | 1109/6779 [41:04<3:30:55,  2.23s/it] 16%|█▋        | 1110/6779 [41:06<3:27:14,  2.19s/it]                                                     {'loss': 1.5682, 'learning_rate': 0.00037785192131664327, 'epoch': 0.16}
+ 16%|█▋        | 1110/6779 [41:06<3:27:14,  2.19s/it] 16%|█▋        | 1111/6779 [41:08<3:29:53,  2.22s/it]                                                     {'loss': 1.7092, 'learning_rate': 0.000377808872046962, 'epoch': 0.16}
+ 16%|█▋        | 1111/6779 [41:08<3:29:53,  2.22s/it] 16%|█▋        | 1112/6779 [41:10<3:26:39,  2.19s/it]                                                     {'loss': 1.8647, 'learning_rate': 0.0003777657834376502, 'epoch': 0.16}
+ 16%|█▋        | 1112/6779 [41:10<3:26:39,  2.19s/it] 16%|█▋        | 1113/6779 [41:12<3:34:44,  2.27s/it]                                                     {'loss': 1.7274, 'learning_rate': 0.00037772265549824107, 'epoch': 0.16}
+ 16%|█▋        | 1113/6779 [41:12<3:34:44,  2.27s/it] 16%|█▋        | 1114/6779 [41:15<3:38:20,  2.31s/it]                                                     {'loss': 1.8633, 'learning_rate': 0.0003776794882382765, 'epoch': 0.16}
+ 16%|█▋        | 1114/6779 [41:15<3:38:20,  2.31s/it] 16%|█▋        | 1115/6779 [41:17<3:33:23,  2.26s/it]                                                     {'loss': 1.8224, 'learning_rate': 0.000377636281667307, 'epoch': 0.16}
+ 16%|█▋        | 1115/6779 [41:17<3:33:23,  2.26s/it] 16%|█▋        | 1116/6779 [41:19<3:28:29,  2.21s/it]                                                     {'loss': 1.7713, 'learning_rate': 0.000377593035794892, 'epoch': 0.16}
+ 16%|█▋        | 1116/6779 [41:19<3:28:29,  2.21s/it] 16%|█▋        | 1117/6779 [41:21<3:30:00,  2.23s/it]                                                     {'loss': 1.8009, 'learning_rate': 0.0003775497506305995, 'epoch': 0.16}
+ 16%|█▋        | 1117/6779 [41:21<3:30:00,  2.23s/it] 16%|█▋        | 1118/6779 [41:23<3:26:11,  2.19s/it]                                                     {'loss': 1.8135, 'learning_rate': 0.0003775064261840061, 'epoch': 0.16}
+ 16%|█▋        | 1118/6779 [41:23<3:26:11,  2.19s/it] 17%|█▋        | 1119/6779 [41:26<3:23:59,  2.16s/it]                                                     {'loss': 1.7458, 'learning_rate': 0.00037746306246469734, 'epoch': 0.17}
+ 17%|█▋        | 1119/6779 [41:26<3:23:59,  2.16s/it] 17%|█▋        | 1120/6779 [41:28<3:25:07,  2.17s/it]                                                     {'loss': 1.9545, 'learning_rate': 0.0003774196594822673, 'epoch': 0.17}
+ 17%|█▋        | 1120/6779 [41:28<3:25:07,  2.17s/it] 17%|█▋        | 1121/6779 [41:30<3:20:32,  2.13s/it]                                                     {'loss': 1.5973, 'learning_rate': 0.00037737621724631855, 'epoch': 0.17}
+ 17%|█▋        | 1121/6779 [41:30<3:20:32,  2.13s/it] 17%|█▋        | 1122/6779 [41:32<3:22:57,  2.15s/it]                                                     {'loss': 1.9428, 'learning_rate': 0.00037733273576646276, 'epoch': 0.17}
+ 17%|█▋        | 1122/6779 [41:32<3:22:57,  2.15s/it] 17%|█▋        | 1123/6779 [41:34<3:22:01,  2.14s/it]                                                     {'loss': 1.8241, 'learning_rate': 0.0003772892150523199, 'epoch': 0.17}
+ 17%|█▋        | 1123/6779 [41:34<3:22:01,  2.14s/it] 17%|█▋        | 1124/6779 [41:36<3:24:46,  2.17s/it]                                                     {'loss': 1.9533, 'learning_rate': 0.00037724565511351894, 'epoch': 0.17}
+ 17%|█▋        | 1124/6779 [41:36<3:24:46,  2.17s/it] 17%|█▋        | 1125/6779 [41:38<3:22:55,  2.15s/it]                                                     {'loss': 1.7265, 'learning_rate': 0.0003772020559596973, 'epoch': 0.17}
+ 17%|█▋        | 1125/6779 [41:38<3:22:55,  2.15s/it] 17%|█▋        | 1126/6779 [41:41<3:25:19,  2.18s/it]                                                     {'loss': 1.7013, 'learning_rate': 0.00037715841760050105, 'epoch': 0.17}
+ 17%|█▋        | 1126/6779 [41:41<3:25:19,  2.18s/it] 17%|█▋        | 1127/6779 [41:43<3:28:59,  2.22s/it]                                                     {'loss': 1.776, 'learning_rate': 0.0003771147400455852, 'epoch': 0.17}
+ 17%|█▋        | 1127/6779 [41:43<3:28:59,  2.22s/it] 17%|█▋        | 1128/6779 [41:45<3:30:45,  2.24s/it]                                                     {'loss': 1.7581, 'learning_rate': 0.0003770710233046132, 'epoch': 0.17}
+ 17%|█▋        | 1128/6779 [41:45<3:30:45,  2.24s/it] 17%|█▋        | 1129/6779 [41:48<3:32:47,  2.26s/it]                                                     {'loss': 1.7754, 'learning_rate': 0.0003770272673872572, 'epoch': 0.17}
+ 17%|█▋        | 1129/6779 [41:48<3:32:47,  2.26s/it] 17%|█▋        | 1130/6779 [41:50<3:32:32,  2.26s/it]                                                     {'loss': 1.8594, 'learning_rate': 0.00037698347230319813, 'epoch': 0.17}
+ 17%|█▋        | 1130/6779 [41:50<3:32:32,  2.26s/it] 17%|█▋        | 1131/6779 [41:52<3:34:47,  2.28s/it]                                                     {'loss': 1.6504, 'learning_rate': 0.0003769396380621254, 'epoch': 0.17}
+ 17%|█▋        | 1131/6779 [41:52<3:34:47,  2.28s/it] 17%|█▋        | 1132/6779 [41:54<3:31:57,  2.25s/it]                                                     {'loss': 1.7332, 'learning_rate': 0.0003768957646737373, 'epoch': 0.17}
+ 17%|█▋        | 1132/6779 [41:54<3:31:57,  2.25s/it] 17%|█▋        | 1133/6779 [41:57<3:36:55,  2.31s/it]                                                     {'loss': 1.8879, 'learning_rate': 0.0003768518521477406, 'epoch': 0.17}
+ 17%|█▋        | 1133/6779 [41:57<3:36:55,  2.31s/it] 17%|█▋        | 1134/6779 [41:59<3:36:32,  2.30s/it]                                                     {'loss': 1.8966, 'learning_rate': 0.00037680790049385087, 'epoch': 0.17}
+ 17%|█▋        | 1134/6779 [41:59<3:36:32,  2.30s/it] 17%|█▋        | 1135/6779 [42:02<3:58:12,  2.53s/it]                                                     {'loss': 1.8303, 'learning_rate': 0.0003767639097217922, 'epoch': 0.17}
+ 17%|█▋        | 1135/6779 [42:02<3:58:12,  2.53s/it] 17%|█▋        | 1136/6779 [42:04<3:46:05,  2.40s/it]                                                     {'loss': 1.8066, 'learning_rate': 0.00037671987984129744, 'epoch': 0.17}
+ 17%|█▋        | 1136/6779 [42:04<3:46:05,  2.40s/it] 17%|█▋        | 1137/6779 [42:07<3:49:28,  2.44s/it]                                                     {'loss': 1.8422, 'learning_rate': 0.00037667581086210807, 'epoch': 0.17}
+ 17%|█▋        | 1137/6779 [42:07<3:49:28,  2.44s/it] 17%|█▋        | 1138/6779 [42:09<3:41:11,  2.35s/it]                                                     {'loss': 1.7565, 'learning_rate': 0.0003766317027939741, 'epoch': 0.17}
+ 17%|█▋        | 1138/6779 [42:09<3:41:11,  2.35s/it] 17%|█▋        | 1139/6779 [42:11<3:36:44,  2.31s/it]                                                     {'loss': 1.7913, 'learning_rate': 0.0003765875556466545, 'epoch': 0.17}
+ 17%|█▋        | 1139/6779 [42:11<3:36:44,  2.31s/it] 17%|█▋        | 1140/6779 [42:14<3:40:52,  2.35s/it]                                                     {'loss': 1.6796, 'learning_rate': 0.0003765433694299166, 'epoch': 0.17}
+ 17%|█▋        | 1140/6779 [42:14<3:40:52,  2.35s/it] 17%|█▋        | 1141/6779 [42:16<3:36:16,  2.30s/it]                                                     {'loss': 1.8136, 'learning_rate': 0.00037649914415353636, 'epoch': 0.17}
+ 17%|█▋        | 1141/6779 [42:16<3:36:16,  2.30s/it] 17%|█▋        | 1142/6779 [42:18<3:38:17,  2.32s/it]                                                     {'loss': 1.7348, 'learning_rate': 0.0003764548798272985, 'epoch': 0.17}
+ 17%|█▋        | 1142/6779 [42:18<3:38:17,  2.32s/it] 17%|█▋        | 1143/6779 [42:21<3:41:19,  2.36s/it]                                                     {'loss': 1.8239, 'learning_rate': 0.00037641057646099643, 'epoch': 0.17}
+ 17%|█▋        | 1143/6779 [42:21<3:41:19,  2.36s/it] 17%|█▋        | 1144/6779 [42:23<3:35:17,  2.29s/it]                                                     {'loss': 1.869, 'learning_rate': 0.0003763662340644321, 'epoch': 0.17}
+ 17%|█▋        | 1144/6779 [42:23<3:35:17,  2.29s/it] 17%|█▋        | 1145/6779 [42:25<3:31:42,  2.25s/it]                                                     {'loss': 1.7662, 'learning_rate': 0.00037632185264741604, 'epoch': 0.17}
+ 17%|█▋        | 1145/6779 [42:25<3:31:42,  2.25s/it] 17%|█▋        | 1146/6779 [42:27<3:25:14,  2.19s/it]                                                     {'loss': 1.7137, 'learning_rate': 0.0003762774322197677, 'epoch': 0.17}
+ 17%|█▋        | 1146/6779 [42:27<3:25:14,  2.19s/it] 17%|█▋        | 1147/6779 [42:29<3:25:55,  2.19s/it]                                                     {'loss': 1.7574, 'learning_rate': 0.00037623297279131473, 'epoch': 0.17}
+ 17%|█▋        | 1147/6779 [42:29<3:25:55,  2.19s/it] 17%|█▋        | 1148/6779 [42:31<3:23:41,  2.17s/it]                                                     {'loss': 1.6832, 'learning_rate': 0.0003761884743718938, 'epoch': 0.17}
+ 17%|█▋        | 1148/6779 [42:31<3:23:41,  2.17s/it] 17%|█▋        | 1149/6779 [42:33<3:23:45,  2.17s/it]                                                     {'loss': 1.9578, 'learning_rate': 0.00037614393697134985, 'epoch': 0.17}
+ 17%|█▋        | 1149/6779 [42:33<3:23:45,  2.17s/it] 17%|█▋        | 1150/6779 [42:36<3:25:19,  2.19s/it]                                                     {'loss': 1.8958, 'learning_rate': 0.0003760993605995368, 'epoch': 0.17}
+ 17%|█▋        | 1150/6779 [42:36<3:25:19,  2.19s/it] 17%|█▋        | 1151/6779 [42:38<3:37:09,  2.32s/it]                                                     {'loss': 1.8257, 'learning_rate': 0.000376054745266317, 'epoch': 0.17}
+ 17%|█▋        | 1151/6779 [42:38<3:37:09,  2.32s/it] 17%|█▋        | 1152/6779 [42:40<3:31:45,  2.26s/it]                                                     {'loss': 1.5621, 'learning_rate': 0.0003760100909815614, 'epoch': 0.17}
+ 17%|█▋        | 1152/6779 [42:40<3:31:45,  2.26s/it] 17%|█▋        | 1153/6779 [42:43<3:30:21,  2.24s/it]                                                     {'loss': 1.9455, 'learning_rate': 0.0003759653977551496, 'epoch': 0.17}
+ 17%|█▋        | 1153/6779 [42:43<3:30:21,  2.24s/it] 17%|█▋        | 1154/6779 [42:45<3:26:52,  2.21s/it]                                                     {'loss': 1.6892, 'learning_rate': 0.0003759206655969699, 'epoch': 0.17}
+ 17%|█▋        | 1154/6779 [42:45<3:26:52,  2.21s/it] 17%|█▋        | 1155/6779 [42:47<3:31:32,  2.26s/it]                                                     {'loss': 1.7942, 'learning_rate': 0.00037587589451691905, 'epoch': 0.17}
+ 17%|█▋        | 1155/6779 [42:47<3:31:32,  2.26s/it] 17%|█▋        | 1156/6779 [42:49<3:25:39,  2.19s/it]                                                     {'loss': 1.7829, 'learning_rate': 0.0003758310845249026, 'epoch': 0.17}
+ 17%|█▋        | 1156/6779 [42:49<3:25:39,  2.19s/it] 17%|█▋        | 1157/6779 [42:52<3:42:48,  2.38s/it]                                                     {'loss': 1.6113, 'learning_rate': 0.0003757862356308346, 'epoch': 0.17}
+ 17%|█▋        | 1157/6779 [42:52<3:42:48,  2.38s/it] 17%|█▋        | 1158/6779 [42:54<3:34:19,  2.29s/it]                                                     {'loss': 1.7483, 'learning_rate': 0.0003757413478446377, 'epoch': 0.17}
+ 17%|█▋        | 1158/6779 [42:54<3:34:19,  2.29s/it] 17%|█▋        | 1159/6779 [42:56<3:29:58,  2.24s/it]                                                     {'loss': 1.7222, 'learning_rate': 0.00037569642117624315, 'epoch': 0.17}
+ 17%|█▋        | 1159/6779 [42:56<3:29:58,  2.24s/it] 17%|█▋        | 1160/6779 [42:58<3:29:57,  2.24s/it]                                                     {'loss': 1.7295, 'learning_rate': 0.00037565145563559085, 'epoch': 0.17}
+ 17%|█▋        | 1160/6779 [42:58<3:29:57,  2.24s/it] 17%|█▋        | 1161/6779 [43:01<3:29:25,  2.24s/it]                                                     {'loss': 1.759, 'learning_rate': 0.0003756064512326293, 'epoch': 0.17}
+ 17%|█▋        | 1161/6779 [43:01<3:29:25,  2.24s/it] 17%|█▋        | 1162/6779 [43:03<3:29:24,  2.24s/it]                                                     {'loss': 1.6149, 'learning_rate': 0.0003755614079773155, 'epoch': 0.17}
+ 17%|█▋        | 1162/6779 [43:03<3:29:24,  2.24s/it] 17%|█▋        | 1163/6779 [43:05<3:32:43,  2.27s/it]                                                     {'loss': 1.6974, 'learning_rate': 0.00037551632587961523, 'epoch': 0.17}
+ 17%|█▋        | 1163/6779 [43:05<3:32:43,  2.27s/it] 17%|█▋        | 1164/6779 [43:07<3:26:19,  2.20s/it]                                                     {'loss': 1.5949, 'learning_rate': 0.0003754712049495027, 'epoch': 0.17}
+ 17%|█▋        | 1164/6779 [43:07<3:26:19,  2.20s/it] 17%|█▋        | 1165/6779 [43:09<3:21:10,  2.15s/it]                                                     {'loss': 1.7994, 'learning_rate': 0.0003754260451969607, 'epoch': 0.17}
+ 17%|█▋        | 1165/6779 [43:09<3:21:10,  2.15s/it] 17%|█▋        | 1166/6779 [43:11<3:17:08,  2.11s/it]                                                     {'loss': 1.7736, 'learning_rate': 0.00037538084663198086, 'epoch': 0.17}
+ 17%|█▋        | 1166/6779 [43:11<3:17:08,  2.11s/it] 17%|█▋        | 1167/6779 [43:13<3:16:12,  2.10s/it]                                                     {'loss': 1.8719, 'learning_rate': 0.00037533560926456303, 'epoch': 0.17}
+ 17%|█▋        | 1167/6779 [43:13<3:16:12,  2.10s/it] 17%|█▋        | 1168/6779 [43:16<3:19:07,  2.13s/it]                                                     {'loss': 1.7398, 'learning_rate': 0.000375290333104716, 'epoch': 0.17}
+ 17%|█▋        | 1168/6779 [43:16<3:19:07,  2.13s/it] 17%|█▋        | 1169/6779 [43:18<3:15:14,  2.09s/it]                                                     {'loss': 1.7861, 'learning_rate': 0.00037524501816245674, 'epoch': 0.17}
+ 17%|█▋        | 1169/6779 [43:18<3:15:14,  2.09s/it] 17%|█▋        | 1170/6779 [43:20<3:23:43,  2.18s/it]                                                     {'loss': 1.8517, 'learning_rate': 0.0003751996644478113, 'epoch': 0.17}
+ 17%|█▋        | 1170/6779 [43:20<3:23:43,  2.18s/it] 17%|█▋        | 1171/6779 [43:22<3:30:31,  2.25s/it]                                                     {'loss': 1.8592, 'learning_rate': 0.0003751542719708138, 'epoch': 0.17}
+ 17%|█▋        | 1171/6779 [43:22<3:30:31,  2.25s/it] 17%|█▋        | 1172/6779 [43:25<3:34:20,  2.29s/it]                                                     {'loss': 1.8915, 'learning_rate': 0.0003751088407415073, 'epoch': 0.17}
+ 17%|█▋        | 1172/6779 [43:25<3:34:20,  2.29s/it] 17%|█▋        | 1173/6779 [43:27<3:25:49,  2.20s/it]                                                     {'loss': 1.7445, 'learning_rate': 0.00037506337076994336, 'epoch': 0.17}
+ 17%|█▋        | 1173/6779 [43:27<3:25:49,  2.20s/it] 17%|█▋        | 1174/6779 [43:29<3:23:13,  2.18s/it]                                                     {'loss': 1.7321, 'learning_rate': 0.00037501786206618195, 'epoch': 0.17}
+ 17%|█▋        | 1174/6779 [43:29<3:23:13,  2.18s/it] 17%|█▋        | 1175/6779 [43:31<3:19:20,  2.13s/it]                                                     {'loss': 1.6707, 'learning_rate': 0.0003749723146402918, 'epoch': 0.17}
+ 17%|█▋        | 1175/6779 [43:31<3:19:20,  2.13s/it] 17%|█▋        | 1176/6779 [43:33<3:13:54,  2.08s/it]                                                     {'loss': 1.7017, 'learning_rate': 0.00037492672850235006, 'epoch': 0.17}
+ 17%|█▋        | 1176/6779 [43:33<3:13:54,  2.08s/it] 17%|█▋        | 1177/6779 [43:35<3:18:17,  2.12s/it]                                                     {'loss': 1.7587, 'learning_rate': 0.0003748811036624426, 'epoch': 0.17}
+ 17%|█▋        | 1177/6779 [43:35<3:18:17,  2.12s/it] 17%|█▋        | 1178/6779 [43:37<3:24:10,  2.19s/it]                                                     {'loss': 1.8805, 'learning_rate': 0.0003748354401306637, 'epoch': 0.17}
+ 17%|█▋        | 1178/6779 [43:37<3:24:10,  2.19s/it] 17%|█▋        | 1179/6779 [43:40<3:23:11,  2.18s/it]                                                     {'loss': 1.7406, 'learning_rate': 0.0003747897379171163, 'epoch': 0.17}
+ 17%|█▋        | 1179/6779 [43:40<3:23:11,  2.18s/it] 17%|█▋        | 1180/6779 [43:42<3:20:18,  2.15s/it]                                                     {'loss': 1.6862, 'learning_rate': 0.0003747439970319118, 'epoch': 0.17}
+ 17%|█▋        | 1180/6779 [43:42<3:20:18,  2.15s/it] 17%|█▋        | 1181/6779 [43:44<3:21:02,  2.15s/it]                                                     {'loss': 1.7503, 'learning_rate': 0.0003746982174851703, 'epoch': 0.17}
+ 17%|█▋        | 1181/6779 [43:44<3:21:02,  2.15s/it] 17%|█▋        | 1182/6779 [43:46<3:29:30,  2.25s/it]                                                     {'loss': 1.8802, 'learning_rate': 0.0003746523992870204, 'epoch': 0.17}
+ 17%|█▋        | 1182/6779 [43:46<3:29:30,  2.25s/it] 17%|█▋        | 1183/6779 [43:48<3:25:09,  2.20s/it]                                                     {'loss': 1.8094, 'learning_rate': 0.00037460654244759914, 'epoch': 0.17}
+ 17%|█▋        | 1183/6779 [43:48<3:25:09,  2.20s/it] 17%|█▋        | 1184/6779 [43:51<3:27:26,  2.22s/it]                                                     {'loss': 1.5392, 'learning_rate': 0.0003745606469770522, 'epoch': 0.17}
+ 17%|█▋        | 1184/6779 [43:51<3:27:26,  2.22s/it] 17%|█▋        | 1185/6779 [43:53<3:29:00,  2.24s/it]                                                     {'loss': 1.6957, 'learning_rate': 0.00037451471288553386, 'epoch': 0.17}
+ 17%|█▋        | 1185/6779 [43:53<3:29:00,  2.24s/it] 17%|█▋        | 1186/6779 [43:55<3:26:43,  2.22s/it]                                                     {'loss': 1.8146, 'learning_rate': 0.0003744687401832068, 'epoch': 0.17}
+ 17%|█▋        | 1186/6779 [43:55<3:26:43,  2.22s/it] 18%|█▊        | 1187/6779 [43:57<3:21:23,  2.16s/it]                                                     {'loss': 1.8521, 'learning_rate': 0.00037442272888024247, 'epoch': 0.18}
+ 18%|█▊        | 1187/6779 [43:57<3:21:23,  2.16s/it] 18%|█▊        | 1188/6779 [43:59<3:23:08,  2.18s/it]                                                     {'loss': 1.6767, 'learning_rate': 0.00037437667898682065, 'epoch': 0.18}
+ 18%|█▊        | 1188/6779 [43:59<3:23:08,  2.18s/it] 18%|█▊        | 1189/6779 [44:02<3:27:27,  2.23s/it]                                                     {'loss': 1.6173, 'learning_rate': 0.0003743305905131297, 'epoch': 0.18}
+ 18%|█▊        | 1189/6779 [44:02<3:27:27,  2.23s/it] 18%|█▊        | 1190/6779 [44:04<3:27:52,  2.23s/it]                                                     {'loss': 1.595, 'learning_rate': 0.00037428446346936646, 'epoch': 0.18}
+ 18%|█▊        | 1190/6779 [44:04<3:27:52,  2.23s/it] 18%|█▊        | 1191/6779 [44:06<3:29:06,  2.25s/it]                                                     {'loss': 1.878, 'learning_rate': 0.0003742382978657366, 'epoch': 0.18}
+ 18%|█▊        | 1191/6779 [44:06<3:29:06,  2.25s/it] 18%|█▊        | 1192/6779 [44:08<3:26:16,  2.22s/it]                                                     {'loss': 1.8501, 'learning_rate': 0.00037419209371245395, 'epoch': 0.18}
+ 18%|█▊        | 1192/6779 [44:08<3:26:16,  2.22s/it] 18%|█▊        | 1193/6779 [44:11<3:28:52,  2.24s/it]                                                     {'loss': 1.7072, 'learning_rate': 0.0003741458510197411, 'epoch': 0.18}
+ 18%|█▊        | 1193/6779 [44:11<3:28:52,  2.24s/it] 18%|█▊        | 1194/6779 [44:13<3:23:31,  2.19s/it]                                                     {'loss': 1.6475, 'learning_rate': 0.000374099569797829, 'epoch': 0.18}
+ 18%|█▊        | 1194/6779 [44:13<3:23:31,  2.19s/it] 18%|█▊        | 1195/6779 [44:15<3:22:31,  2.18s/it]                                                     {'loss': 1.5823, 'learning_rate': 0.0003740532500569574, 'epoch': 0.18}
+ 18%|█▊        | 1195/6779 [44:15<3:22:31,  2.18s/it] 18%|█▊        | 1196/6779 [44:17<3:20:35,  2.16s/it]                                                     {'loss': 1.7405, 'learning_rate': 0.00037400689180737423, 'epoch': 0.18}
+ 18%|█▊        | 1196/6779 [44:17<3:20:35,  2.16s/it] 18%|█▊        | 1197/6779 [44:19<3:24:26,  2.20s/it]                                                     {'loss': 1.9413, 'learning_rate': 0.00037396049505933614, 'epoch': 0.18}
+ 18%|█▊        | 1197/6779 [44:19<3:24:26,  2.20s/it] 18%|█▊        | 1198/6779 [44:22<3:26:59,  2.23s/it]                                                     {'loss': 1.8405, 'learning_rate': 0.00037391405982310826, 'epoch': 0.18}
+ 18%|█▊        | 1198/6779 [44:22<3:26:59,  2.23s/it] 18%|█▊        | 1199/6779 [44:24<3:31:05,  2.27s/it]                                                     {'loss': 1.8006, 'learning_rate': 0.00037386758610896426, 'epoch': 0.18}
+ 18%|█▊        | 1199/6779 [44:24<3:31:05,  2.27s/it] 18%|█▊        | 1200/6779 [44:26<3:34:39,  2.31s/it]                                                     {'loss': 1.8576, 'learning_rate': 0.00037382107392718624, 'epoch': 0.18}
+ 18%|█▊        | 1200/6779 [44:26<3:34:39,  2.31s/it] 18%|���▊        | 1201/6779 [44:29<3:37:24,  2.34s/it]                                                     {'loss': 1.8148, 'learning_rate': 0.00037377452328806496, 'epoch': 0.18}
+ 18%|█▊        | 1201/6779 [44:29<3:37:24,  2.34s/it] 18%|█▊        | 1202/6779 [44:31<3:31:32,  2.28s/it]                                                     {'loss': 1.9463, 'learning_rate': 0.00037372793420189956, 'epoch': 0.18}
+ 18%|█▊        | 1202/6779 [44:31<3:31:32,  2.28s/it] 18%|█▊        | 1203/6779 [44:33<3:39:33,  2.36s/it]                                                     {'loss': 1.6354, 'learning_rate': 0.00037368130667899763, 'epoch': 0.18}
+ 18%|█▊        | 1203/6779 [44:33<3:39:33,  2.36s/it] 18%|█▊        | 1204/6779 [44:36<3:33:22,  2.30s/it]                                                     {'loss': 1.9025, 'learning_rate': 0.0003736346407296755, 'epoch': 0.18}
+ 18%|█▊        | 1204/6779 [44:36<3:33:22,  2.30s/it] 18%|█▊        | 1205/6779 [44:38<3:29:00,  2.25s/it]                                                     {'loss': 1.8128, 'learning_rate': 0.0003735879363642577, 'epoch': 0.18}
+ 18%|█▊        | 1205/6779 [44:38<3:29:00,  2.25s/it] 18%|█▊        | 1206/6779 [44:43<4:39:24,  3.01s/it]                                                     {'loss': 1.6238, 'learning_rate': 0.0003735411935930776, 'epoch': 0.18}
+ 18%|█▊        | 1206/6779 [44:43<4:39:24,  3.01s/it] 18%|█▊        | 1207/6779 [44:45<4:16:26,  2.76s/it]                                                     {'loss': 1.8424, 'learning_rate': 0.0003734944124264768, 'epoch': 0.18}
+ 18%|█▊        | 1207/6779 [44:45<4:16:26,  2.76s/it] 18%|█▊        | 1208/6779 [44:47<4:03:12,  2.62s/it]                                                     {'loss': 1.7494, 'learning_rate': 0.00037344759287480546, 'epoch': 0.18}
+ 18%|█▊        | 1208/6779 [44:47<4:03:12,  2.62s/it] 18%|█▊        | 1209/6779 [44:49<3:53:46,  2.52s/it]                                                     {'loss': 1.8493, 'learning_rate': 0.00037340073494842224, 'epoch': 0.18}
+ 18%|█▊        | 1209/6779 [44:49<3:53:46,  2.52s/it] 18%|█▊        | 1210/6779 [44:52<3:49:26,  2.47s/it]                                                     {'loss': 1.753, 'learning_rate': 0.0003733538386576943, 'epoch': 0.18}
+ 18%|█▊        | 1210/6779 [44:52<3:49:26,  2.47s/it] 18%|█▊        | 1211/6779 [44:54<3:43:13,  2.41s/it]                                                     {'loss': 1.7025, 'learning_rate': 0.0003733069040129974, 'epoch': 0.18}
+ 18%|█▊        | 1211/6779 [44:54<3:43:13,  2.41s/it] 18%|█▊        | 1212/6779 [44:56<3:34:29,  2.31s/it]                                                     {'loss': 1.7748, 'learning_rate': 0.00037325993102471546, 'epoch': 0.18}
+ 18%|█▊        | 1212/6779 [44:56<3:34:29,  2.31s/it] 18%|█▊        | 1213/6779 [44:58<3:29:13,  2.26s/it]                                                     {'loss': 1.7567, 'learning_rate': 0.00037321291970324134, 'epoch': 0.18}
+ 18%|█▊        | 1213/6779 [44:58<3:29:13,  2.26s/it] 18%|█▊        | 1214/6779 [45:00<3:29:20,  2.26s/it]                                                     {'loss': 1.8683, 'learning_rate': 0.00037316587005897605, 'epoch': 0.18}
+ 18%|█▊        | 1214/6779 [45:00<3:29:20,  2.26s/it] 18%|█▊        | 1215/6779 [45:03<3:31:36,  2.28s/it]                                                     {'loss': 1.8389, 'learning_rate': 0.00037311878210232916, 'epoch': 0.18}
+ 18%|█▊        | 1215/6779 [45:03<3:31:36,  2.28s/it] 18%|█▊        | 1216/6779 [45:05<3:30:52,  2.27s/it]                                                     {'loss': 1.9286, 'learning_rate': 0.0003730716558437187, 'epoch': 0.18}
+ 18%|█▊        | 1216/6779 [45:05<3:30:52,  2.27s/it] 18%|█▊        | 1217/6779 [45:07<3:25:29,  2.22s/it]                                                     {'loss': 1.6945, 'learning_rate': 0.0003730244912935712, 'epoch': 0.18}
+ 18%|█▊        | 1217/6779 [45:07<3:25:29,  2.22s/it] 18%|█▊        | 1218/6779 [45:09<3:20:14,  2.16s/it]                                                     {'loss': 1.781, 'learning_rate': 0.0003729772884623217, 'epoch': 0.18}
+ 18%|█▊        | 1218/6779 [45:09<3:20:14,  2.16s/it] 18%|█▊        | 1219/6779 [45:11<3:16:50,  2.12s/it]                                                     {'loss': 1.8065, 'learning_rate': 0.00037293004736041365, 'epoch': 0.18}
+ 18%|█▊        | 1219/6779 [45:11<3:16:50,  2.12s/it] 18%|█▊        | 1220/6779 [45:13<3:18:48,  2.15s/it]                                                     {'loss': 1.6522, 'learning_rate': 0.000372882767998299, 'epoch': 0.18}
+ 18%|█▊        | 1220/6779 [45:13<3:18:48,  2.15s/it] 18%|█▊        | 1221/6779 [45:16<3:21:51,  2.18s/it]                                                     {'loss': 1.7327, 'learning_rate': 0.0003728354503864382, 'epoch': 0.18}
+ 18%|█▊        | 1221/6779 [45:16<3:21:51,  2.18s/it] 18%|█▊        | 1222/6779 [45:18<3:29:03,  2.26s/it]                                                     {'loss': 1.6261, 'learning_rate': 0.00037278809453530003, 'epoch': 0.18}
+ 18%|█▊        | 1222/6779 [45:18<3:29:03,  2.26s/it] 18%|█▊        | 1223/6779 [45:21<3:38:57,  2.36s/it]                                                     {'loss': 1.7236, 'learning_rate': 0.00037274070045536183, 'epoch': 0.18}
+ 18%|█▊        | 1223/6779 [45:21<3:38:57,  2.36s/it] 18%|█▊        | 1224/6779 [45:23<3:50:08,  2.49s/it]                                                     {'loss': 1.8231, 'learning_rate': 0.0003726932681571095, 'epoch': 0.18}
+ 18%|█▊        | 1224/6779 [45:23<3:50:08,  2.49s/it] 18%|█▊        | 1225/6779 [45:25<3:38:36,  2.36s/it]                                                     {'loss': 1.8308, 'learning_rate': 0.000372645797651037, 'epoch': 0.18}
+ 18%|█▊        | 1225/6779 [45:25<3:38:36,  2.36s/it] 18%|█▊        | 1226/6779 [45:28<3:29:23,  2.26s/it]                                                     {'loss': 1.8109, 'learning_rate': 0.0003725982889476474, 'epoch': 0.18}
+ 18%|█▊        | 1226/6779 [45:28<3:29:23,  2.26s/it] 18%|█▊        | 1227/6779 [45:30<3:25:38,  2.22s/it]                                                     {'loss': 1.8557, 'learning_rate': 0.0003725507420574516, 'epoch': 0.18}
+ 18%|█▊        | 1227/6779 [45:30<3:25:38,  2.22s/it] 18%|█▊        | 1228/6779 [45:32<3:29:31,  2.26s/it]                                                     {'loss': 1.6892, 'learning_rate': 0.00037250315699096926, 'epoch': 0.18}
+ 18%|█▊        | 1228/6779 [45:32<3:29:31,  2.26s/it] 18%|█▊        | 1229/6779 [45:34<3:31:37,  2.29s/it]                                                     {'loss': 1.7482, 'learning_rate': 0.00037245553375872835, 'epoch': 0.18}
+ 18%|█▊        | 1229/6779 [45:34<3:31:37,  2.29s/it] 18%|█▊        | 1230/6779 [45:36<3:23:47,  2.20s/it]                                                     {'loss': 1.6938, 'learning_rate': 0.0003724078723712655, 'epoch': 0.18}
+ 18%|█▊        | 1230/6779 [45:36<3:23:47,  2.20s/it] 18%|█▊        | 1231/6779 [45:39<3:23:33,  2.20s/it]                                                     {'loss': 1.7827, 'learning_rate': 0.0003723601728391255, 'epoch': 0.18}
+ 18%|█▊        | 1231/6779 [45:39<3:23:33,  2.20s/it] 18%|█▊        | 1232/6779 [45:41<3:31:42,  2.29s/it]                                                     {'loss': 1.8789, 'learning_rate': 0.00037231243517286174, 'epoch': 0.18}
+ 18%|█▊        | 1232/6779 [45:41<3:31:42,  2.29s/it] 18%|█▊        | 1233/6779 [45:43<3:30:13,  2.27s/it]                                                     {'loss': 1.8025, 'learning_rate': 0.0003722646593830361, 'epoch': 0.18}
+ 18%|█▊        | 1233/6779 [45:43<3:30:13,  2.27s/it] 18%|█▊        | 1234/6779 [45:46<3:42:39,  2.41s/it]                                                     {'loss': 1.7255, 'learning_rate': 0.0003722168454802188, 'epoch': 0.18}
+ 18%|█▊        | 1234/6779 [45:46<3:42:39,  2.41s/it] 18%|█▊        | 1235/6779 [45:48<3:35:35,  2.33s/it]                                                     {'loss': 1.7843, 'learning_rate': 0.00037216899347498845, 'epoch': 0.18}
+ 18%|█▊        | 1235/6779 [45:48<3:35:35,  2.33s/it] 18%|█▊        | 1236/6779 [45:50<3:31:00,  2.28s/it]                                                     {'loss': 1.7831, 'learning_rate': 0.00037212110337793213, 'epoch': 0.18}
+ 18%|█▊        | 1236/6779 [45:50<3:31:00,  2.28s/it] 18%|█▊        | 1237/6779 [45:53<3:28:07,  2.25s/it]                                                     {'loss': 1.9191, 'learning_rate': 0.00037207317519964543, 'epoch': 0.18}
+ 18%|█▊        | 1237/6779 [45:53<3:28:07,  2.25s/it] 18%|█▊        | 1238/6779 [45:55<3:21:11,  2.18s/it]                                                     {'loss': 1.6694, 'learning_rate': 0.0003720252089507323, 'epoch': 0.18}
+ 18%|█▊        | 1238/6779 [45:55<3:21:11,  2.18s/it] 18%|█▊        | 1239/6779 [45:57<3:19:30,  2.16s/it]                                                     {'loss': 1.7753, 'learning_rate': 0.0003719772046418052, 'epoch': 0.18}
+ 18%|█▊        | 1239/6779 [45:57<3:19:30,  2.16s/it] 18%|█▊        | 1240/6779 [45:59<3:21:55,  2.19s/it]                                                     {'loss': 1.615, 'learning_rate': 0.00037192916228348473, 'epoch': 0.18}
+ 18%|█▊        | 1240/6779 [45:59<3:21:55,  2.19s/it] 18%|█▊        | 1241/6779 [46:01<3:19:55,  2.17s/it]                                                     {'loss': 1.7757, 'learning_rate': 0.0003718810818864001, 'epoch': 0.18}
+ 18%|█▊        | 1241/6779 [46:01<3:19:55,  2.17s/it] 18%|█▊        | 1242/6779 [46:03<3:28:24,  2.26s/it]                                                     {'loss': 1.8509, 'learning_rate': 0.0003718329634611892, 'epoch': 0.18}
+ 18%|█▊        | 1242/6779 [46:03<3:28:24,  2.26s/it] 18%|█▊        | 1243/6779 [46:06<3:37:18,  2.36s/it]                                                     {'loss': 1.7939, 'learning_rate': 0.0003717848070184979, 'epoch': 0.18}
+ 18%|█▊        | 1243/6779 [46:06<3:37:18,  2.36s/it] 18%|█▊        | 1244/6779 [46:08<3:26:03,  2.23s/it]                                                     {'loss': 1.8382, 'learning_rate': 0.0003717366125689806, 'epoch': 0.18}
+ 18%|█▊        | 1244/6779 [46:08<3:26:03,  2.23s/it] 18%|█▊        | 1245/6779 [46:10<3:21:38,  2.19s/it]                                                     {'loss': 1.7896, 'learning_rate': 0.0003716883801233003, 'epoch': 0.18}
+ 18%|█▊        | 1245/6779 [46:10<3:21:38,  2.19s/it] 18%|█▊        | 1246/6779 [46:13<3:33:38,  2.32s/it]                                                     {'loss': 1.6561, 'learning_rate': 0.0003716401096921281, 'epoch': 0.18}
+ 18%|█▊        | 1246/6779 [46:13<3:33:38,  2.32s/it] 18%|█▊        | 1247/6779 [46:15<3:26:42,  2.24s/it]                                                     {'loss': 1.8774, 'learning_rate': 0.0003715918012861439, 'epoch': 0.18}
+ 18%|█▊        | 1247/6779 [46:15<3:26:42,  2.24s/it] 18%|█▊        | 1248/6779 [46:17<3:26:58,  2.25s/it]                                                     {'loss': 1.7219, 'learning_rate': 0.0003715434549160356, 'epoch': 0.18}
+ 18%|█▊        | 1248/6779 [46:17<3:26:58,  2.25s/it] 18%|█▊        | 1249/6779 [46:19<3:25:39,  2.23s/it]                                                     {'loss': 1.6798, 'learning_rate': 0.0003714950705924998, 'epoch': 0.18}
+ 18%|█▊        | 1249/6779 [46:19<3:25:39,  2.23s/it] 18%|█▊        | 1250/6779 [46:21<3:22:40,  2.20s/it]                                                     {'loss': 1.8329, 'learning_rate': 0.0003714466483262412, 'epoch': 0.18}
+ 18%|█▊        | 1250/6779 [46:21<3:22:40,  2.20s/it] 18%|█▊        | 1251/6779 [46:24<3:21:31,  2.19s/it]                                                     {'loss': 1.7112, 'learning_rate': 0.00037139818812797327, 'epoch': 0.18}
+ 18%|█▊        | 1251/6779 [46:24<3:21:31,  2.19s/it] 18%|█▊        | 1252/6779 [46:26<3:16:28,  2.13s/it]                                                     {'loss': 1.6721, 'learning_rate': 0.0003713496900084175, 'epoch': 0.18}
+ 18%|█▊        | 1252/6779 [46:26<3:16:28,  2.13s/it] 18%|█▊        | 1253/6779 [46:28<3:18:05,  2.15s/it]                                                     {'loss': 1.6087, 'learning_rate': 0.00037130115397830405, 'epoch': 0.18}
+ 18%|█▊        | 1253/6779 [46:28<3:18:05,  2.15s/it] 18%|█▊        | 1254/6779 [46:30<3:26:43,  2.25s/it]                                                     {'loss': 1.5999, 'learning_rate': 0.00037125258004837134, 'epoch': 0.18}
+ 18%|█▊        | 1254/6779 [46:30<3:26:43,  2.25s/it] 19%|█▊        | 1255/6779 [46:33<3:42:46,  2.42s/it]                                                     {'loss': 1.65, 'learning_rate': 0.00037120396822936617, 'epoch': 0.19}
+ 19%|█▊        | 1255/6779 [46:33<3:42:46,  2.42s/it] 19%|█▊        | 1256/6779 [46:35<3:32:01,  2.30s/it]                                                     {'loss': 1.7115, 'learning_rate': 0.0003711553185320437, 'epoch': 0.19}
+ 19%|█▊        | 1256/6779 [46:35<3:32:01,  2.30s/it] 19%|█▊        | 1257/6779 [46:37<3:30:16,  2.28s/it]                                                     {'loss': 1.76, 'learning_rate': 0.00037110663096716763, 'epoch': 0.19}
+ 19%|█▊        | 1257/6779 [46:37<3:30:16,  2.28s/it] 19%|█▊        | 1258/6779 [46:39<3:22:39,  2.20s/it]                                                     {'loss': 1.7776, 'learning_rate': 0.00037105790554550983, 'epoch': 0.19}
+ 19%|█▊        | 1258/6779 [46:39<3:22:39,  2.20s/it] 19%|█▊        | 1259/6779 [46:41<3:21:18,  2.19s/it]                                                     {'loss': 1.6147, 'learning_rate': 0.0003710091422778507, 'epoch': 0.19}
+ 19%|█▊        | 1259/6779 [46:41<3:21:18,  2.19s/it] 19%|█▊        | 1260/6779 [46:44<3:19:37,  2.17s/it]                                                     {'loss': 1.7358, 'learning_rate': 0.0003709603411749789, 'epoch': 0.19}
+ 19%|█▊        | 1260/6779 [46:44<3:19:37,  2.17s/it] 19%|█▊        | 1261/6779 [46:46<3:39:50,  2.39s/it]                                                     {'loss': 1.79, 'learning_rate': 0.00037091150224769154, 'epoch': 0.19}
+ 19%|█▊        | 1261/6779 [46:46<3:39:50,  2.39s/it] 19%|█▊        | 1262/6779 [46:49<3:37:09,  2.36s/it]                                                     {'loss': 1.6942, 'learning_rate': 0.00037086262550679405, 'epoch': 0.19}
+ 19%|█▊        | 1262/6779 [46:49<3:37:09,  2.36s/it] 19%|█▊        | 1263/6779 [46:51<3:29:22,  2.28s/it]                                                     {'loss': 1.7101, 'learning_rate': 0.0003708137109631003, 'epoch': 0.19}
+ 19%|█▊        | 1263/6779 [46:51<3:29:22,  2.28s/it] 19%|█▊        | 1264/6779 [46:53<3:32:30,  2.31s/it]                                                     {'loss': 1.6912, 'learning_rate': 0.0003707647586274324, 'epoch': 0.19}
+ 19%|█▊        | 1264/6779 [46:53<3:32:30,  2.31s/it] 19%|█▊        | 1265/6779 [46:55<3:30:35,  2.29s/it]                                                     {'loss': 1.8985, 'learning_rate': 0.00037071576851062095, 'epoch': 0.19}
+ 19%|█▊        | 1265/6779 [46:55<3:30:35,  2.29s/it] 19%|█▊        | 1266/6779 [46:58<3:25:50,  2.24s/it]                                                     {'loss': 1.8518, 'learning_rate': 0.0003706667406235049, 'epoch': 0.19}
+ 19%|█▊        | 1266/6779 [46:58<3:25:50,  2.24s/it] 19%|█▊        | 1267/6779 [47:00<3:24:50,  2.23s/it]                                                     {'loss': 1.6862, 'learning_rate': 0.00037061767497693145, 'epoch': 0.19}
+ 19%|█▊        | 1267/6779 [47:00<3:24:50,  2.23s/it] 19%|█▊        | 1268/6779 [47:02<3:22:19,  2.20s/it]                                                     {'loss': 1.8435, 'learning_rate': 0.00037056857158175615, 'epoch': 0.19}
+ 19%|█▊        | 1268/6779 [47:02<3:22:19,  2.20s/it] 19%|█▊        | 1269/6779 [47:04<3:29:23,  2.28s/it]                                                     {'loss': 1.72, 'learning_rate': 0.00037051943044884305, 'epoch': 0.19}
+ 19%|█▊        | 1269/6779 [47:04<3:29:23,  2.28s/it] 19%|█▊        | 1270/6779 [47:06<3:24:11,  2.22s/it]                                                     {'loss': 1.7566, 'learning_rate': 0.00037047025158906444, 'epoch': 0.19}
+ 19%|█▊        | 1270/6779 [47:06<3:24:11,  2.22s/it] 19%|█▊        | 1271/6779 [47:09<3:21:50,  2.20s/it]                                                     {'loss': 1.8772, 'learning_rate': 0.000370421035013301, 'epoch': 0.19}
+ 19%|█▊        | 1271/6779 [47:09<3:21:50,  2.20s/it] 19%|█▉        | 1272/6779 [47:11<3:18:47,  2.17s/it]                                                     {'loss': 1.765, 'learning_rate': 0.00037037178073244173, 'epoch': 0.19}
+ 19%|█▉        | 1272/6779 [47:11<3:18:47,  2.17s/it] 19%|█▉        | 1273/6779 [47:13<3:21:33,  2.20s/it]                                                     {'loss': 1.8666, 'learning_rate': 0.000370322488757384, 'epoch': 0.19}
+ 19%|█▉        | 1273/6779 [47:13<3:21:33,  2.20s/it] 19%|█▉        | 1274/6779 [47:15<3:21:25,  2.20s/it]                                                     {'loss': 1.6133, 'learning_rate': 0.0003702731590990334, 'epoch': 0.19}
+ 19%|█▉        | 1274/6779 [47:15<3:21:25,  2.20s/it] 19%|█▉        | 1275/6779 [47:17<3:20:12,  2.18s/it]                                                     {'loss': 1.7229, 'learning_rate': 0.000370223791768304, 'epoch': 0.19}
+ 19%|█▉        | 1275/6779 [47:17<3:20:12,  2.18s/it] 19%|█▉        | 1276/6779 [47:20<3:22:25,  2.21s/it]                                                     {'loss': 1.867, 'learning_rate': 0.00037017438677611826, 'epoch': 0.19}
+ 19%|█▉        | 1276/6779 [47:20<3:22:25,  2.21s/it] 19%|█▉        | 1277/6779 [47:22<3:27:28,  2.26s/it]                                                     {'loss': 1.8271, 'learning_rate': 0.00037012494413340676, 'epoch': 0.19}
+ 19%|█▉        | 1277/6779 [47:22<3:27:28,  2.26s/it] 19%|█▉        | 1278/6779 [47:24<3:23:09,  2.22s/it]                                                     {'loss': 1.7593, 'learning_rate': 0.00037007546385110855, 'epoch': 0.19}
+ 19%|█▉        | 1278/6779 [47:24<3:23:09,  2.22s/it] 19%|█▉        | 1279/6779 [47:26<3:19:03,  2.17s/it]                                                     {'loss': 1.5268, 'learning_rate': 0.000370025945940171, 'epoch': 0.19}
+ 19%|█▉        | 1279/6779 [47:26<3:19:03,  2.17s/it] 19%|█▉        | 1280/6779 [47:28<3:13:59,  2.12s/it]                                                     {'loss': 1.7109, 'learning_rate': 0.0003699763904115497, 'epoch': 0.19}
+ 19%|█▉        | 1280/6779 [47:28<3:13:59,  2.12s/it] 19%|█▉        | 1281/6779 [47:30<3:19:17,  2.17s/it]                                                     {'loss': 1.8589, 'learning_rate': 0.0003699267972762089, 'epoch': 0.19}
+ 19%|█▉        | 1281/6779 [47:30<3:19:17,  2.17s/it] 19%|█▉        | 1282/6779 [47:33<3:19:28,  2.18s/it]                                                     {'loss': 1.8169, 'learning_rate': 0.0003698771665451206, 'epoch': 0.19}
+ 19%|█▉        | 1282/6779 [47:33<3:19:28,  2.18s/it] 19%|█▉        | 1283/6779 [47:35<3:24:44,  2.24s/it]                                                     {'loss': 1.612, 'learning_rate': 0.0003698274982292656, 'epoch': 0.19}
+ 19%|█▉        | 1283/6779 [47:35<3:24:44,  2.24s/it] 19%|█▉        | 1284/6779 [47:37<3:19:57,  2.18s/it]                                                     {'loss': 1.7612, 'learning_rate': 0.0003697777923396329, 'epoch': 0.19}
+ 19%|█▉        | 1284/6779 [47:37<3:19:57,  2.18s/it] 19%|█▉        | 1285/6779 [47:39<3:20:52,  2.19s/it]                                                     {'loss': 1.6939, 'learning_rate': 0.00036972804888721957, 'epoch': 0.19}
+ 19%|█▉        | 1285/6779 [47:39<3:20:52,  2.19s/it] 19%|█▉        | 1286/6779 [47:42<3:22:49,  2.22s/it]                                                     {'loss': 1.7288, 'learning_rate': 0.0003696782678830314, 'epoch': 0.19}
+ 19%|█▉        | 1286/6779 [47:42<3:22:49,  2.22s/it] 19%|█▉        | 1287/6779 [47:44<3:22:04,  2.21s/it]                                                     {'loss': 1.6968, 'learning_rate': 0.00036962844933808214, 'epoch': 0.19}
+ 19%|█▉        | 1287/6779 [47:44<3:22:04,  2.21s/it] 19%|█▉        | 1288/6779 [47:46<3:18:44,  2.17s/it]                                                     {'loss': 1.7489, 'learning_rate': 0.0003695785932633941, 'epoch': 0.19}
+ 19%|█▉        | 1288/6779 [47:46<3:18:44,  2.17s/it] 19%|█▉        | 1289/6779 [47:48<3:19:51,  2.18s/it]                                                     {'loss': 1.9042, 'learning_rate': 0.00036952869966999766, 'epoch': 0.19}
+ 19%|█▉        | 1289/6779 [47:48<3:19:51,  2.18s/it] 19%|█▉        | 1290/6779 [47:50<3:22:48,  2.22s/it]                                                     {'loss': 1.6613, 'learning_rate': 0.00036947876856893166, 'epoch': 0.19}
+ 19%|█▉        | 1290/6779 [47:50<3:22:48,  2.22s/it] 19%|█▉        | 1291/6779 [47:53<3:22:26,  2.21s/it]                                                     {'loss': 1.9201, 'learning_rate': 0.00036942879997124315, 'epoch': 0.19}
+ 19%|█▉        | 1291/6779 [47:53<3:22:26,  2.21s/it] 19%|█▉        | 1292/6779 [47:55<3:23:36,  2.23s/it]                                                     {'loss': 1.8066, 'learning_rate': 0.0003693787938879876, 'epoch': 0.19}
+ 19%|█▉        | 1292/6779 [47:55<3:23:36,  2.23s/it] 19%|█▉        | 1293/6779 [47:57<3:15:45,  2.14s/it]                                                     {'loss': 1.7621, 'learning_rate': 0.0003693287503302286, 'epoch': 0.19}
+ 19%|█▉        | 1293/6779 [47:57<3:15:45,  2.14s/it] 19%|█▉        | 1294/6779 [47:59<3:13:52,  2.12s/it]                                                     {'loss': 1.6454, 'learning_rate': 0.00036927866930903816, 'epoch': 0.19}
+ 19%|█▉        | 1294/6779 [47:59<3:13:52,  2.12s/it] 19%|█▉        | 1295/6779 [48:01<3:20:54,  2.20s/it]                                                     {'loss': 1.6103, 'learning_rate': 0.0003692285508354966, 'epoch': 0.19}
+ 19%|█▉        | 1295/6779 [48:01<3:20:54,  2.20s/it] 19%|█▉        | 1296/6779 [48:03<3:18:24,  2.17s/it]                                                     {'loss': 1.8363, 'learning_rate': 0.0003691783949206924, 'epoch': 0.19}
+ 19%|█▉        | 1296/6779 [48:03<3:18:24,  2.17s/it] 19%|█▉        | 1297/6779 [48:05<3:18:37,  2.17s/it]                                                     {'loss': 1.6617, 'learning_rate': 0.00036912820157572246, 'epoch': 0.19}
+ 19%|█▉        | 1297/6779 [48:06<3:18:37,  2.17s/it] 19%|█▉        | 1298/6779 [48:08<3:21:43,  2.21s/it]                                                     {'loss': 1.8131, 'learning_rate': 0.00036907797081169177, 'epoch': 0.19}
+ 19%|█▉        | 1298/6779 [48:08<3:21:43,  2.21s/it] 19%|█▉        | 1299/6779 [48:10<3:19:16,  2.18s/it]                                                     {'loss': 1.7005, 'learning_rate': 0.0003690277026397138, 'epoch': 0.19}
+ 19%|█▉        | 1299/6779 [48:10<3:19:16,  2.18s/it] 19%|█▉        | 1300/6779 [48:12<3:21:41,  2.21s/it]                                                     {'loss': 1.8988, 'learning_rate': 0.0003689773970709102, 'epoch': 0.19}
+ 19%|█▉        | 1300/6779 [48:12<3:21:41,  2.21s/it] 19%|█▉        | 1301/6779 [48:14<3:23:07,  2.22s/it]                                                     {'loss': 1.9027, 'learning_rate': 0.0003689270541164111, 'epoch': 0.19}
+ 19%|█▉        | 1301/6779 [48:14<3:23:07,  2.22s/it] 19%|█▉        | 1302/6779 [48:17<3:21:37,  2.21s/it]                                                     {'loss': 1.6751, 'learning_rate': 0.00036887667378735433, 'epoch': 0.19}
+ 19%|█▉        | 1302/6779 [48:17<3:21:37,  2.21s/it] 19%|█▉        | 1303/6779 [48:19<3:21:11,  2.20s/it]                                                     {'loss': 1.4981, 'learning_rate': 0.0003688262560948867, 'epoch': 0.19}
+ 19%|█▉        | 1303/6779 [48:19<3:21:11,  2.20s/it] 19%|█▉        | 1304/6779 [48:21<3:15:53,  2.15s/it]                                                     {'loss': 1.5878, 'learning_rate': 0.0003687758010501628, 'epoch': 0.19}
+ 19%|█▉        | 1304/6779 [48:21<3:15:53,  2.15s/it] 19%|█▉        | 1305/6779 [48:23<3:16:56,  2.16s/it]                                                     {'loss': 1.7565, 'learning_rate': 0.0003687253086643457, 'epoch': 0.19}
+ 19%|█▉        | 1305/6779 [48:23<3:16:56,  2.16s/it] 19%|█▉        | 1306/6779 [48:25<3:14:39,  2.13s/it]                                                     {'loss': 1.7145, 'learning_rate': 0.00036867477894860667, 'epoch': 0.19}
+ 19%|█▉        | 1306/6779 [48:25<3:14:39,  2.13s/it] 19%|█▉        | 1307/6779 [48:27<3:16:27,  2.15s/it]                                                     {'loss': 1.7875, 'learning_rate': 0.00036862421191412515, 'epoch': 0.19}
+ 19%|█▉        | 1307/6779 [48:27<3:16:27,  2.15s/it] 19%|█▉        | 1308/6779 [48:30<3:23:04,  2.23s/it]                                                     {'loss': 1.969, 'learning_rate': 0.0003685736075720891, 'epoch': 0.19}
+ 19%|█▉        | 1308/6779 [48:30<3:23:04,  2.23s/it] 19%|█▉        | 1309/6779 [48:32<3:29:41,  2.30s/it]                                                     {'loss': 1.9007, 'learning_rate': 0.0003685229659336945, 'epoch': 0.19}
+ 19%|█▉        | 1309/6779 [48:32<3:29:41,  2.30s/it] 19%|█▉        | 1310/6779 [48:35<3:32:03,  2.33s/it]                                                     {'loss': 1.7475, 'learning_rate': 0.0003684722870101456, 'epoch': 0.19}
+ 19%|█▉        | 1310/6779 [48:35<3:32:03,  2.33s/it] 19%|█▉        | 1311/6779 [48:37<3:29:54,  2.30s/it]                                                     {'loss': 1.6487, 'learning_rate': 0.00036842157081265497, 'epoch': 0.19}
+ 19%|█▉        | 1311/6779 [48:37<3:29:54,  2.30s/it] 19%|█▉        | 1312/6779 [48:39<3:26:58,  2.27s/it]                                                     {'loss': 1.7673, 'learning_rate': 0.00036837081735244346, 'epoch': 0.19}
+ 19%|█▉        | 1312/6779 [48:39<3:26:58,  2.27s/it] 19%|█▉        | 1313/6779 [48:41<3:27:24,  2.28s/it]                                                     {'loss': 1.6262, 'learning_rate': 0.00036832002664073996, 'epoch': 0.19}
+ 19%|█▉        | 1313/6779 [48:41<3:27:24,  2.28s/it] 19%|█▉        | 1314/6779 [48:43<3:22:01,  2.22s/it]                                                     {'loss': 1.8813, 'learning_rate': 0.0003682691986887819, 'epoch': 0.19}
+ 19%|█▉        | 1314/6779 [48:43<3:22:01,  2.22s/it] 19%|█▉        | 1315/6779 [48:45<3:17:22,  2.17s/it]                                                     {'loss': 1.7598, 'learning_rate': 0.0003682183335078147, 'epoch': 0.19}
+ 19%|█▉        | 1315/6779 [48:45<3:17:22,  2.17s/it] 19%|█▉        | 1316/6779 [48:48<3:23:33,  2.24s/it]                                                     {'loss': 1.9757, 'learning_rate': 0.00036816743110909225, 'epoch': 0.19}
+ 19%|█▉        | 1316/6779 [48:48<3:23:33,  2.24s/it] 19%|█▉        | 1317/6779 [48:50<3:35:18,  2.37s/it]                                                     {'loss': 1.8024, 'learning_rate': 0.0003681164915038763, 'epoch': 0.19}
+ 19%|█▉        | 1317/6779 [48:50<3:35:18,  2.37s/it] 19%|█▉        | 1318/6779 [48:53<3:28:42,  2.29s/it]                                                     {'loss': 1.585, 'learning_rate': 0.0003680655147034373, 'epoch': 0.19}
+ 19%|█▉        | 1318/6779 [48:53<3:28:42,  2.29s/it] 19%|█▉        | 1319/6779 [48:55<3:22:52,  2.23s/it]                                                     {'loss': 1.7189, 'learning_rate': 0.00036801450071905357, 'epoch': 0.19}
+ 19%|█▉        | 1319/6779 [48:55<3:22:52,  2.23s/it] 19%|█▉        | 1320/6779 [48:57<3:18:47,  2.18s/it]                                                     {'loss': 1.706, 'learning_rate': 0.00036796344956201187, 'epoch': 0.19}
+ 19%|█▉        | 1320/6779 [48:57<3:18:47,  2.18s/it] 19%|█▉        | 1321/6779 [48:59<3:20:58,  2.21s/it]                                                     {'loss': 1.7614, 'learning_rate': 0.0003679123612436071, 'epoch': 0.19}
+ 19%|█▉        | 1321/6779 [48:59<3:20:58,  2.21s/it] 20%|█▉        | 1322/6779 [49:01<3:21:24,  2.21s/it]                                                     {'loss': 1.6353, 'learning_rate': 0.00036786123577514234, 'epoch': 0.2}
+ 20%|█▉        | 1322/6779 [49:01<3:21:24,  2.21s/it] 20%|█▉        | 1323/6779 [49:03<3:20:01,  2.20s/it]                                                     {'loss': 1.8242, 'learning_rate': 0.00036781007316792885, 'epoch': 0.2}
+ 20%|█▉        | 1323/6779 [49:03<3:20:01,  2.20s/it] 20%|█▉        | 1324/6779 [49:06<3:19:10,  2.19s/it]                                                     {'loss': 1.641, 'learning_rate': 0.00036775887343328635, 'epoch': 0.2}
+ 20%|█▉        | 1324/6779 [49:06<3:19:10,  2.19s/it] 20%|█▉        | 1325/6779 [49:08<3:22:12,  2.22s/it]                                                     {'loss': 1.8567, 'learning_rate': 0.00036770763658254253, 'epoch': 0.2}
+ 20%|█▉        | 1325/6779 [49:08<3:22:12,  2.22s/it] 20%|█▉        | 1326/6779 [49:10<3:21:36,  2.22s/it]                                                     {'loss': 1.7392, 'learning_rate': 0.0003676563626270334, 'epoch': 0.2}
+ 20%|█▉        | 1326/6779 [49:10<3:21:36,  2.22s/it] 20%|█▉        | 1327/6779 [49:13<3:36:37,  2.38s/it]                                                     {'loss': 1.7124, 'learning_rate': 0.0003676050515781031, 'epoch': 0.2}
+ 20%|█▉        | 1327/6779 [49:13<3:36:37,  2.38s/it] 20%|█▉        | 1328/6779 [49:15<3:29:43,  2.31s/it]                                                     {'loss': 1.8575, 'learning_rate': 0.00036755370344710407, 'epoch': 0.2}
+ 20%|█▉        | 1328/6779 [49:15<3:29:43,  2.31s/it] 20%|█▉        | 1329/6779 [49:18<3:37:13,  2.39s/it]                                                     {'loss': 1.7078, 'learning_rate': 0.00036750231824539696, 'epoch': 0.2}
+ 20%|█▉        | 1329/6779 [49:18<3:37:13,  2.39s/it] 20%|█▉        | 1330/6779 [49:20<3:28:29,  2.30s/it]                                                     {'loss': 1.7449, 'learning_rate': 0.00036745089598435053, 'epoch': 0.2}
+ 20%|█▉        | 1330/6779 [49:20<3:28:29,  2.30s/it] 20%|█▉        | 1331/6779 [49:22<3:22:54,  2.23s/it]                                                     {'loss': 1.8876, 'learning_rate': 0.00036739943667534174, 'epoch': 0.2}
+ 20%|█▉        | 1331/6779 [49:22<3:22:54,  2.23s/it] 20%|█▉        | 1332/6779 [49:24<3:21:13,  2.22s/it]                                                     {'loss': 1.8038, 'learning_rate': 0.0003673479403297559, 'epoch': 0.2}
+ 20%|█▉        | 1332/6779 [49:24<3:21:13,  2.22s/it] 20%|█▉        | 1333/6779 [49:26<3:18:08,  2.18s/it]                                                     {'loss': 1.6337, 'learning_rate': 0.0003672964069589864, 'epoch': 0.2}
+ 20%|█▉        | 1333/6779 [49:26<3:18:08,  2.18s/it] 20%|█▉        | 1334/6779 [49:28<3:19:39,  2.20s/it]                                                     {'loss': 1.7082, 'learning_rate': 0.0003672448365744347, 'epoch': 0.2}
+ 20%|█▉        | 1334/6779 [49:28<3:19:39,  2.20s/it] 20%|█▉        | 1335/6779 [49:31<3:32:05,  2.34s/it]                                                     {'loss': 1.8583, 'learning_rate': 0.0003671932291875107, 'epoch': 0.2}
+ 20%|█▉        | 1335/6779 [49:31<3:32:05,  2.34s/it] 20%|█▉        | 1336/6779 [49:33<3:27:20,  2.29s/it]                                                     {'loss': 1.8713, 'learning_rate': 0.00036714158480963233, 'epoch': 0.2}
+ 20%|█▉        | 1336/6779 [49:33<3:27:20,  2.29s/it] 20%|█▉        | 1337/6779 [49:35<3:25:12,  2.26s/it]                                                     {'loss': 1.9001, 'learning_rate': 0.0003670899034522257, 'epoch': 0.2}
+ 20%|█▉        | 1337/6779 [49:35<3:25:12,  2.26s/it] 20%|█▉        | 1338/6779 [49:37<3:22:07,  2.23s/it]                                                     {'loss': 1.8038, 'learning_rate': 0.00036703818512672523, 'epoch': 0.2}
+ 20%|█▉        | 1338/6779 [49:37<3:22:07,  2.23s/it] 20%|█▉        | 1339/6779 [49:40<3:28:30,  2.30s/it]                                                     {'loss': 1.7742, 'learning_rate': 0.0003669864298445734, 'epoch': 0.2}
+ 20%|█▉        | 1339/6779 [49:40<3:28:30,  2.30s/it] 20%|█▉        | 1340/6779 [49:42<3:25:30,  2.27s/it]                                                     {'loss': 1.7624, 'learning_rate': 0.00036693463761722076, 'epoch': 0.2}
+ 20%|█▉        | 1340/6779 [49:42<3:25:30,  2.27s/it] 20%|█▉        | 1341/6779 [49:45<3:31:51,  2.34s/it]                                                     {'loss': 1.7099, 'learning_rate': 0.0003668828084561264, 'epoch': 0.2}
+ 20%|█▉        | 1341/6779 [49:45<3:31:51,  2.34s/it] 20%|█▉        | 1342/6779 [49:47<3:30:19,  2.32s/it]                                                     {'loss': 1.6032, 'learning_rate': 0.00036683094237275715, 'epoch': 0.2}
+ 20%|█▉        | 1342/6779 [49:47<3:30:19,  2.32s/it] 20%|█▉        | 1343/6779 [49:49<3:27:30,  2.29s/it]                                                     {'loss': 1.755, 'learning_rate': 0.00036677903937858835, 'epoch': 0.2}
+ 20%|█▉        | 1343/6779 [49:49<3:27:30,  2.29s/it] 20%|█▉        | 1344/6779 [49:51<3:25:17,  2.27s/it]                                                     {'loss': 1.8969, 'learning_rate': 0.00036672709948510333, 'epoch': 0.2}
+ 20%|█▉        | 1344/6779 [49:51<3:25:17,  2.27s/it] 20%|█▉        | 1345/6779 [49:54<3:26:07,  2.28s/it]                                                     {'loss': 1.6311, 'learning_rate': 0.0003666751227037936, 'epoch': 0.2}
+ 20%|█▉        | 1345/6779 [49:54<3:26:07,  2.28s/it] 20%|█▉        | 1346/6779 [49:56<3:24:32,  2.26s/it]                                                     {'loss': 1.7446, 'learning_rate': 0.0003666231090461588, 'epoch': 0.2}
+ 20%|█▉        | 1346/6779 [49:56<3:24:32,  2.26s/it] 20%|█▉        | 1347/6779 [49:58<3:21:36,  2.23s/it]                                                     {'loss': 1.9712, 'learning_rate': 0.00036657105852370693, 'epoch': 0.2}
+ 20%|█▉        | 1347/6779 [49:58<3:21:36,  2.23s/it] 20%|█▉        | 1348/6779 [50:00<3:17:18,  2.18s/it]                                                     {'loss': 1.6304, 'learning_rate': 0.00036651897114795386, 'epoch': 0.2}
+ 20%|█▉        | 1348/6779 [50:00<3:17:18,  2.18s/it] 20%|█▉        | 1349/6779 [50:02<3:20:38,  2.22s/it]                                                     {'loss': 1.6444, 'learning_rate': 0.0003664668469304238, 'epoch': 0.2}
+ 20%|█▉        | 1349/6779 [50:02<3:20:38,  2.22s/it] 20%|█▉        | 1350/6779 [50:05<3:21:41,  2.23s/it]                                                     {'loss': 1.7692, 'learning_rate': 0.0003664146858826491, 'epoch': 0.2}
+ 20%|█▉        | 1350/6779 [50:05<3:21:41,  2.23s/it] 20%|█▉        | 1351/6779 [50:07<3:25:19,  2.27s/it]                                                     {'loss': 1.7554, 'learning_rate': 0.00036636248801617013, 'epoch': 0.2}
+ 20%|█▉        | 1351/6779 [50:07<3:25:19,  2.27s/it] 20%|█▉        | 1352/6779 [50:09<3:30:59,  2.33s/it]                                                     {'loss': 1.8322, 'learning_rate': 0.00036631025334253565, 'epoch': 0.2}
+ 20%|█▉        | 1352/6779 [50:09<3:30:59,  2.33s/it] 20%|█▉        | 1353/6779 [50:12<3:23:41,  2.25s/it]                                                     {'loss': 1.8378, 'learning_rate': 0.00036625798187330227, 'epoch': 0.2}
+ 20%|█▉        | 1353/6779 [50:12<3:23:41,  2.25s/it] 20%|█▉        | 1354/6779 [50:14<3:21:20,  2.23s/it]                                                     {'loss': 1.7166, 'learning_rate': 0.00036620567362003484, 'epoch': 0.2}
+ 20%|█▉        | 1354/6779 [50:14<3:21:20,  2.23s/it] 20%|█▉        | 1355/6779 [50:16<3:17:40,  2.19s/it]                                                     {'loss': 1.7478, 'learning_rate': 0.0003661533285943065, 'epoch': 0.2}
+ 20%|█▉        | 1355/6779 [50:16<3:17:40,  2.19s/it] 20%|██        | 1356/6779 [50:18<3:18:15,  2.19s/it]                                                     {'loss': 1.5835, 'learning_rate': 0.0003661009468076985, 'epoch': 0.2}
+ 20%|██        | 1356/6779 [50:18<3:18:15,  2.19s/it] 20%|██        | 1357/6779 [50:20<3:16:45,  2.18s/it]                                                     {'loss': 1.6013, 'learning_rate': 0.00036604852827179995, 'epoch': 0.2}
+ 20%|██        | 1357/6779 [50:20<3:16:45,  2.18s/it] 20%|██        | 1358/6779 [50:22<3:21:09,  2.23s/it]                                                     {'loss': 1.757, 'learning_rate': 0.00036599607299820833, 'epoch': 0.2}
+ 20%|██        | 1358/6779 [50:22<3:21:09,  2.23s/it] 20%|██        | 1359/6779 [50:25<3:16:44,  2.18s/it]                                                     {'loss': 1.745, 'learning_rate': 0.00036594358099852926, 'epoch': 0.2}
+ 20%|██        | 1359/6779 [50:25<3:16:44,  2.18s/it] 20%|██        | 1360/6779 [50:27<3:17:51,  2.19s/it]                                                     {'loss': 1.6672, 'learning_rate': 0.00036589105228437634, 'epoch': 0.2}
+ 20%|██        | 1360/6779 [50:27<3:17:51,  2.19s/it] 20%|██        | 1361/6779 [50:29<3:23:40,  2.26s/it]                                                     {'loss': 1.7542, 'learning_rate': 0.0003658384868673715, 'epoch': 0.2}
+ 20%|██        | 1361/6779 [50:29<3:23:40,  2.26s/it] 20%|██        | 1362/6779 [50:31<3:19:03,  2.20s/it]                                                     {'loss': 1.6769, 'learning_rate': 0.0003657858847591445, 'epoch': 0.2}
+ 20%|██        | 1362/6779 [50:31<3:19:03,  2.20s/it] 20%|██        | 1363/6779 [50:33<3:19:53,  2.21s/it]                                                     {'loss': 1.6363, 'learning_rate': 0.00036573324597133356, 'epoch': 0.2}
+ 20%|██        | 1363/6779 [50:33<3:19:53,  2.21s/it] 20%|██        | 1364/6779 [50:36<3:21:35,  2.23s/it]                                                     {'loss': 1.8565, 'learning_rate': 0.00036568057051558476, 'epoch': 0.2}
+ 20%|██        | 1364/6779 [50:36<3:21:35,  2.23s/it] 20%|██        | 1365/6779 [50:38<3:21:43,  2.24s/it]                                                     {'loss': 1.6873, 'learning_rate': 0.0003656278584035523, 'epoch': 0.2}
+ 20%|██        | 1365/6779 [50:38<3:21:43,  2.24s/it] 20%|██        | 1366/6779 [50:41<3:32:29,  2.36s/it]                                                     {'loss': 1.5876, 'learning_rate': 0.00036557510964689864, 'epoch': 0.2}
+ 20%|██        | 1366/6779 [50:41<3:32:29,  2.36s/it] 20%|██        | 1367/6779 [50:43<3:31:53,  2.35s/it]                                                     {'loss': 1.6294, 'learning_rate': 0.00036552232425729426, 'epoch': 0.2}
+ 20%|██        | 1367/6779 [50:43<3:31:53,  2.35s/it] 20%|██        | 1368/6779 [50:45<3:29:19,  2.32s/it]                                                     {'loss': 1.6025, 'learning_rate': 0.00036546950224641773, 'epoch': 0.2}
+ 20%|██        | 1368/6779 [50:45<3:29:19,  2.32s/it] 20%|██        | 1369/6779 [50:47<3:22:16,  2.24s/it]                                                     {'loss': 1.669, 'learning_rate': 0.00036541664362595584, 'epoch': 0.2}
+ 20%|██        | 1369/6779 [50:47<3:22:16,  2.24s/it] 20%|██        | 1370/6779 [50:49<3:17:24,  2.19s/it]                                                     {'loss': 1.8052, 'learning_rate': 0.00036536374840760326, 'epoch': 0.2}
+ 20%|██        | 1370/6779 [50:49<3:17:24,  2.19s/it] 20%|██        | 1371/6779 [50:52<3:19:31,  2.21s/it]                                                     {'loss': 1.8722, 'learning_rate': 0.000365310816603063, 'epoch': 0.2}
+ 20%|██        | 1371/6779 [50:52<3:19:31,  2.21s/it] 20%|██        | 1372/6779 [50:54<3:15:21,  2.17s/it]                                                     {'loss': 1.69, 'learning_rate': 0.0003652578482240459, 'epoch': 0.2}
+ 20%|██        | 1372/6779 [50:54<3:15:21,  2.17s/it] 20%|██        | 1373/6779 [50:56<3:17:37,  2.19s/it]                                                     {'loss': 1.7863, 'learning_rate': 0.00036520484328227116, 'epoch': 0.2}
+ 20%|██        | 1373/6779 [50:56<3:17:37,  2.19s/it] 20%|██        | 1374/6779 [50:58<3:14:30,  2.16s/it]                                                     {'loss': 1.744, 'learning_rate': 0.00036515180178946596, 'epoch': 0.2}
+ 20%|██        | 1374/6779 [50:58<3:14:30,  2.16s/it] 20%|██        | 1375/6779 [51:00<3:19:32,  2.22s/it]                                                     {'loss': 1.7891, 'learning_rate': 0.0003650987237573655, 'epoch': 0.2}
+ 20%|██        | 1375/6779 [51:00<3:19:32,  2.22s/it] 20%|██        | 1376/6779 [51:02<3:15:49,  2.17s/it]                                                     {'loss': 1.6512, 'learning_rate': 0.0003650456091977131, 'epoch': 0.2}
+ 20%|██        | 1376/6779 [51:02<3:15:49,  2.17s/it] 20%|██        | 1377/6779 [51:05<3:18:21,  2.20s/it]                                                     {'loss': 1.8566, 'learning_rate': 0.0003649924581222602, 'epoch': 0.2}
+ 20%|██        | 1377/6779 [51:05<3:18:21,  2.20s/it] 20%|██        | 1378/6779 [51:07<3:12:57,  2.14s/it]                                                     {'loss': 1.6047, 'learning_rate': 0.00036493927054276635, 'epoch': 0.2}
+ 20%|██        | 1378/6779 [51:07<3:12:57,  2.14s/it] 20%|██        | 1379/6779 [51:09<3:15:52,  2.18s/it]                                                     {'loss': 1.8603, 'learning_rate': 0.00036488604647099906, 'epoch': 0.2}
+ 20%|██        | 1379/6779 [51:09<3:15:52,  2.18s/it] 20%|██        | 1380/6779 [51:11<3:13:12,  2.15s/it]                                                     {'loss': 1.7414, 'learning_rate': 0.0003648327859187341, 'epoch': 0.2}
+ 20%|██        | 1380/6779 [51:11<3:13:12,  2.15s/it] 20%|██        | 1381/6779 [51:13<3:18:26,  2.21s/it]                                                     {'loss': 1.8048, 'learning_rate': 0.00036477948889775504, 'epoch': 0.2}
+ 20%|██        | 1381/6779 [51:13<3:18:26,  2.21s/it] 20%|██        | 1382/6779 [51:16<3:22:06,  2.25s/it]                                                     {'loss': 1.9032, 'learning_rate': 0.0003647261554198538, 'epoch': 0.2}
+ 20%|██        | 1382/6779 [51:16<3:22:06,  2.25s/it] 20%|██        | 1383/6779 [51:18<3:19:27,  2.22s/it]                                                     {'loss': 1.7945, 'learning_rate': 0.0003646727854968301, 'epoch': 0.2}
+ 20%|██        | 1383/6779 [51:18<3:19:27,  2.22s/it] 20%|██        | 1384/6779 [51:20<3:14:47,  2.17s/it]                                                     {'loss': 1.807, 'learning_rate': 0.000364619379140492, 'epoch': 0.2}
+ 20%|██        | 1384/6779 [51:20<3:14:47,  2.17s/it] 20%|██        | 1385/6779 [51:22<3:17:28,  2.20s/it]                                                     {'loss': 1.7179, 'learning_rate': 0.0003645659363626554, 'epoch': 0.2}
+ 20%|██        | 1385/6779 [51:22<3:17:28,  2.20s/it] 20%|██        | 1386/6779 [51:25<3:20:29,  2.23s/it]                                                     {'loss': 1.6454, 'learning_rate': 0.00036451245717514436, 'epoch': 0.2}
+ 20%|██        | 1386/6779 [51:25<3:20:29,  2.23s/it] 20%|██        | 1387/6779 [51:27<3:20:25,  2.23s/it]                                                     {'loss': 1.5909, 'learning_rate': 0.000364458941589791, 'epoch': 0.2}
+ 20%|██        | 1387/6779 [51:27<3:20:25,  2.23s/it] 20%|██        | 1388/6779 [51:29<3:22:21,  2.25s/it]                                                     {'loss': 1.7343, 'learning_rate': 0.00036440538961843543, 'epoch': 0.2}
+ 20%|██        | 1388/6779 [51:29<3:22:21,  2.25s/it] 20%|██        | 1389/6779 [51:31<3:20:52,  2.24s/it]                                                     {'loss': 1.8327, 'learning_rate': 0.0003643518012729259, 'epoch': 0.2}
+ 20%|██        | 1389/6779 [51:31<3:20:52,  2.24s/it] 21%|██        | 1390/6779 [51:34<3:21:53,  2.25s/it]                                                     {'loss': 1.6858, 'learning_rate': 0.0003642981765651186, 'epoch': 0.21}
+ 21%|██        | 1390/6779 [51:34<3:21:53,  2.25s/it] 21%|██        | 1391/6779 [51:36<3:21:49,  2.25s/it]                                                     {'loss': 1.8517, 'learning_rate': 0.0003642445155068778, 'epoch': 0.21}
+ 21%|██        | 1391/6779 [51:36<3:21:49,  2.25s/it] 21%|██        | 1392/6779 [51:38<3:19:03,  2.22s/it]                                                     {'loss': 1.844, 'learning_rate': 0.00036419081811007585, 'epoch': 0.21}
+ 21%|██        | 1392/6779 [51:38<3:19:03,  2.22s/it] 21%|██        | 1393/6779 [51:40<3:16:01,  2.18s/it]                                                     {'loss': 1.8321, 'learning_rate': 0.0003641370843865932, 'epoch': 0.21}
+ 21%|██        | 1393/6779 [51:40<3:16:01,  2.18s/it] 21%|██        | 1394/6779 [51:42<3:22:36,  2.26s/it]                                                     {'loss': 1.6329, 'learning_rate': 0.00036408331434831817, 'epoch': 0.21}
+ 21%|██        | 1394/6779 [51:42<3:22:36,  2.26s/it] 21%|██        | 1395/6779 [51:45<3:19:28,  2.22s/it]                                                     {'loss': 1.7407, 'learning_rate': 0.0003640295080071473, 'epoch': 0.21}
+ 21%|██        | 1395/6779 [51:45<3:19:28,  2.22s/it] 21%|██        | 1396/6779 [51:47<3:19:14,  2.22s/it]                                                     {'loss': 1.8821, 'learning_rate': 0.0003639756653749849, 'epoch': 0.21}
+ 21%|██        | 1396/6779 [51:47<3:19:14,  2.22s/it] 21%|██        | 1397/6779 [51:49<3:19:21,  2.22s/it]                                                     {'loss': 1.844, 'learning_rate': 0.0003639217864637437, 'epoch': 0.21}
+ 21%|██        | 1397/6779 [51:49<3:19:21,  2.22s/it] 21%|██        | 1398/6779 [51:51<3:16:09,  2.19s/it]                                                     {'loss': 1.6772, 'learning_rate': 0.0003638678712853441, 'epoch': 0.21}
+ 21%|██        | 1398/6779 [51:51<3:16:09,  2.19s/it] 21%|██        | 1399/6779 [51:53<3:14:02,  2.16s/it]                                                     {'loss': 1.8225, 'learning_rate': 0.00036381391985171465, 'epoch': 0.21}
+ 21%|██        | 1399/6779 [51:53<3:14:02,  2.16s/it] 21%|██        | 1400/6779 [51:55<3:11:37,  2.14s/it]                                                     {'loss': 1.6648, 'learning_rate': 0.0003637599321747919, 'epoch': 0.21}
+ 21%|██        | 1400/6779 [51:55<3:11:37,  2.14s/it] 21%|██        | 1401/6779 [51:58<3:19:41,  2.23s/it]                                                     {'loss': 1.852, 'learning_rate': 0.0003637059082665205, 'epoch': 0.21}
+ 21%|██        | 1401/6779 [51:58<3:19:41,  2.23s/it] 21%|██        | 1402/6779 [52:00<3:22:28,  2.26s/it]                                                     {'loss': 1.8308, 'learning_rate': 0.00036365184813885314, 'epoch': 0.21}
+ 21%|██        | 1402/6779 [52:00<3:22:28,  2.26s/it] 21%|██        | 1403/6779 [52:02<3:21:51,  2.25s/it]                                                     {'loss': 1.8165, 'learning_rate': 0.00036359775180375034, 'epoch': 0.21}
+ 21%|██        | 1403/6779 [52:02<3:21:51,  2.25s/it] 21%|██        | 1404/6779 [52:05<3:23:06,  2.27s/it]                                                     {'loss': 1.7812, 'learning_rate': 0.0003635436192731808, 'epoch': 0.21}
+ 21%|██        | 1404/6779 [52:05<3:23:06,  2.27s/it] 21%|██        | 1405/6779 [52:07<3:16:56,  2.20s/it]                                                     {'loss': 1.673, 'learning_rate': 0.00036348945055912103, 'epoch': 0.21}
+ 21%|██        | 1405/6779 [52:07<3:16:56,  2.20s/it] 21%|██        | 1406/6779 [52:09<3:14:35,  2.17s/it]                                                     {'loss': 1.705, 'learning_rate': 0.0003634352456735559, 'epoch': 0.21}
+ 21%|██        | 1406/6779 [52:09<3:14:35,  2.17s/it] 21%|██        | 1407/6779 [52:11<3:17:23,  2.20s/it]                                                     {'loss': 1.74, 'learning_rate': 0.00036338100462847785, 'epoch': 0.21}
+ 21%|██        | 1407/6779 [52:11<3:17:23,  2.20s/it] 21%|██        | 1408/6779 [52:13<3:15:28,  2.18s/it]                                                     {'loss': 1.7635, 'learning_rate': 0.00036332672743588765, 'epoch': 0.21}
+ 21%|██        | 1408/6779 [52:13<3:15:28,  2.18s/it] 21%|██        | 1409/6779 [52:15<3:13:15,  2.16s/it]                                                     {'loss': 1.6494, 'learning_rate': 0.00036327241410779394, 'epoch': 0.21}
+ 21%|██        | 1409/6779 [52:15<3:13:15,  2.16s/it] 21%|██        | 1410/6779 [52:17<3:11:33,  2.14s/it]                                                     {'loss': 1.5169, 'learning_rate': 0.0003632180646562133, 'epoch': 0.21}
+ 21%|██        | 1410/6779 [52:17<3:11:33,  2.14s/it] 21%|██        | 1411/6779 [52:20<3:14:24,  2.17s/it]                                                     {'loss': 1.7057, 'learning_rate': 0.0003631636790931705, 'epoch': 0.21}
+ 21%|██        | 1411/6779 [52:20<3:14:24,  2.17s/it] 21%|██        | 1412/6779 [52:22<3:12:56,  2.16s/it]                                                     {'loss': 1.8034, 'learning_rate': 0.00036310925743069804, 'epoch': 0.21}
+ 21%|██        | 1412/6779 [52:22<3:12:56,  2.16s/it] 21%|██        | 1413/6779 [52:24<3:20:36,  2.24s/it]                                                     {'loss': 1.7168, 'learning_rate': 0.0003630547996808366, 'epoch': 0.21}
+ 21%|██        | 1413/6779 [52:24<3:20:36,  2.24s/it] 21%|██        | 1414/6779 [52:26<3:19:45,  2.23s/it]                                                     {'loss': 1.7534, 'learning_rate': 0.00036300030585563475, 'epoch': 0.21}
+ 21%|██        | 1414/6779 [52:26<3:19:45,  2.23s/it] 21%|██        | 1415/6779 [52:28<3:13:51,  2.17s/it]                                                     {'loss': 1.8023, 'learning_rate': 0.0003629457759671491, 'epoch': 0.21}
+ 21%|██        | 1415/6779 [52:28<3:13:51,  2.17s/it] 21%|██        | 1416/6779 [52:31<3:12:22,  2.15s/it]                                                     {'loss': 1.9657, 'learning_rate': 0.00036289121002744417, 'epoch': 0.21}
+ 21%|██        | 1416/6779 [52:31<3:12:22,  2.15s/it] 21%|██        | 1417/6779 [52:33<3:20:30,  2.24s/it]                                                     {'loss': 1.7284, 'learning_rate': 0.00036283660804859255, 'epoch': 0.21}
+ 21%|██        | 1417/6779 [52:33<3:20:30,  2.24s/it] 21%|██        | 1418/6779 [52:35<3:17:58,  2.22s/it]                                                     {'loss': 1.7553, 'learning_rate': 0.00036278197004267467, 'epoch': 0.21}
+ 21%|██        | 1418/6779 [52:35<3:17:58,  2.22s/it] 21%|██        | 1419/6779 [52:38<3:22:13,  2.26s/it]                                                     {'loss': 1.7785, 'learning_rate': 0.0003627272960217791, 'epoch': 0.21}
+ 21%|██        | 1419/6779 [52:38<3:22:13,  2.26s/it] 21%|██        | 1420/6779 [52:40<3:33:04,  2.39s/it]                                                     {'loss': 1.7441, 'learning_rate': 0.0003626725859980022, 'epoch': 0.21}
+ 21%|██        | 1420/6779 [52:40<3:33:04,  2.39s/it] 21%|██        | 1421/6779 [52:42<3:27:55,  2.33s/it]                                                     {'loss': 1.927, 'learning_rate': 0.00036261783998344844, 'epoch': 0.21}
+ 21%|██        | 1421/6779 [52:42<3:27:55,  2.33s/it] 21%|██        | 1422/6779 [52:45<3:27:36,  2.33s/it]                                                     {'loss': 1.6692, 'learning_rate': 0.00036256305799023023, 'epoch': 0.21}
+ 21%|██        | 1422/6779 [52:45<3:27:36,  2.33s/it] 21%|██        | 1423/6779 [52:47<3:24:26,  2.29s/it]                                                     {'loss': 1.8435, 'learning_rate': 0.0003625082400304678, 'epoch': 0.21}
+ 21%|██        | 1423/6779 [52:47<3:24:26,  2.29s/it] 21%|██        | 1424/6779 [52:49<3:23:16,  2.28s/it]                                                     {'loss': 1.8125, 'learning_rate': 0.00036245338611628954, 'epoch': 0.21}
+ 21%|██        | 1424/6779 [52:49<3:23:16,  2.28s/it] 21%|██        | 1425/6779 [52:51<3:20:23,  2.25s/it]                                                     {'loss': 1.6979, 'learning_rate': 0.00036239849625983167, 'epoch': 0.21}
+ 21%|██        | 1425/6779 [52:51<3:20:23,  2.25s/it] 21%|██        | 1426/6779 [52:53<3:16:56,  2.21s/it]                                                     {'loss': 1.8107, 'learning_rate': 0.00036234357047323836, 'epoch': 0.21}
+ 21%|██        | 1426/6779 [52:53<3:16:56,  2.21s/it] 21%|██        | 1427/6779 [52:56<3:15:44,  2.19s/it]                                                     {'loss': 1.8166, 'learning_rate': 0.00036228860876866183, 'epoch': 0.21}
+ 21%|██        | 1427/6779 [52:56<3:15:44,  2.19s/it] 21%|██        | 1428/6779 [52:58<3:22:30,  2.27s/it]                                                     {'loss': 1.7873, 'learning_rate': 0.0003622336111582621, 'epoch': 0.21}
+ 21%|██        | 1428/6779 [52:58<3:22:30,  2.27s/it] 21%|██        | 1429/6779 [53:00<3:22:15,  2.27s/it]                                                     {'loss': 1.7998, 'learning_rate': 0.00036217857765420724, 'epoch': 0.21}
+ 21%|██        | 1429/6779 [53:00<3:22:15,  2.27s/it] 21%|██        | 1430/6779 [53:03<3:25:37,  2.31s/it]                                                     {'loss': 1.8331, 'learning_rate': 0.0003621235082686733, 'epoch': 0.21}
+ 21%|██        | 1430/6779 [53:03<3:25:37,  2.31s/it] 21%|██        | 1431/6779 [53:05<3:24:14,  2.29s/it]                                                     {'loss': 1.7286, 'learning_rate': 0.00036206840301384403, 'epoch': 0.21}
+ 21%|██        | 1431/6779 [53:05<3:24:14,  2.29s/it] 21%|██        | 1432/6779 [53:07<3:27:59,  2.33s/it]                                                     {'loss': 1.836, 'learning_rate': 0.0003620132619019114, 'epoch': 0.21}
+ 21%|██        | 1432/6779 [53:07<3:27:59,  2.33s/it] 21%|██        | 1433/6779 [53:10<3:24:45,  2.30s/it]                                                     {'loss': 1.8915, 'learning_rate': 0.0003619580849450753, 'epoch': 0.21}
+ 21%|██        | 1433/6779 [53:10<3:24:45,  2.30s/it] 21%|██        | 1434/6779 [53:12<3:23:01,  2.28s/it]                                                     {'loss': 1.6758, 'learning_rate': 0.00036190287215554325, 'epoch': 0.21}
+ 21%|██        | 1434/6779 [53:12<3:23:01,  2.28s/it] 21%|██        | 1435/6779 [53:14<3:17:51,  2.22s/it]                                                     {'loss': 1.717, 'learning_rate': 0.00036184762354553107, 'epoch': 0.21}
+ 21%|██        | 1435/6779 [53:14<3:17:51,  2.22s/it] 21%|██        | 1436/6779 [53:16<3:15:04,  2.19s/it]                                                     {'loss': 1.7215, 'learning_rate': 0.0003617923391272622, 'epoch': 0.21}
+ 21%|██        | 1436/6779 [53:16<3:15:04,  2.19s/it] 21%|██        | 1437/6779 [53:18<3:14:07,  2.18s/it]                                                     {'loss': 1.6871, 'learning_rate': 0.0003617370189129682, 'epoch': 0.21}
+ 21%|██        | 1437/6779 [53:18<3:14:07,  2.18s/it] 21%|██        | 1438/6779 [53:20<3:10:21,  2.14s/it]                                                     {'loss': 1.7518, 'learning_rate': 0.00036168166291488855, 'epoch': 0.21}
+ 21%|██        | 1438/6779 [53:20<3:10:21,  2.14s/it] 21%|██        | 1439/6779 [53:23<3:13:49,  2.18s/it]                                                     {'loss': 1.8031, 'learning_rate': 0.00036162627114527044, 'epoch': 0.21}
+ 21%|██        | 1439/6779 [53:23<3:13:49,  2.18s/it] 21%|██        | 1440/6779 [53:25<3:13:48,  2.18s/it]                                                     {'loss': 1.736, 'learning_rate': 0.00036157084361636917, 'epoch': 0.21}
+ 21%|██        | 1440/6779 [53:25<3:13:48,  2.18s/it] 21%|██▏       | 1441/6779 [53:27<3:16:10,  2.20s/it]                                                     {'loss': 1.6607, 'learning_rate': 0.00036151538034044796, 'epoch': 0.21}
+ 21%|██▏       | 1441/6779 [53:27<3:16:10,  2.20s/it] 21%|██▏       | 1442/6779 [53:29<3:15:55,  2.20s/it]                                                     {'loss': 1.7426, 'learning_rate': 0.0003614598813297779, 'epoch': 0.21}
+ 21%|██▏       | 1442/6779 [53:29<3:15:55,  2.20s/it] 21%|██▏       | 1443/6779 [53:31<3:12:47,  2.17s/it]                                                     {'loss': 1.8693, 'learning_rate': 0.0003614043465966378, 'epoch': 0.21}
+ 21%|██▏       | 1443/6779 [53:31<3:12:47,  2.17s/it] 21%|██▏       | 1444/6779 [53:34<3:17:03,  2.22s/it]                                                     {'loss': 1.6413, 'learning_rate': 0.0003613487761533147, 'epoch': 0.21}
+ 21%|██▏       | 1444/6779 [53:34<3:17:03,  2.22s/it] 21%|██▏       | 1445/6779 [53:36<3:15:31,  2.20s/it]                                                     {'loss': 1.8151, 'learning_rate': 0.0003612931700121033, 'epoch': 0.21}
+ 21%|██▏       | 1445/6779 [53:36<3:15:31,  2.20s/it] 21%|██▏       | 1446/6779 [53:38<3:13:14,  2.17s/it]                                                     {'loss': 1.6464, 'learning_rate': 0.00036123752818530635, 'epoch': 0.21}
+ 21%|██▏       | 1446/6779 [53:38<3:13:14,  2.17s/it] 21%|██▏       | 1447/6779 [53:40<3:15:35,  2.20s/it]                                                     {'loss': 1.7811, 'learning_rate': 0.0003611818506852343, 'epoch': 0.21}
+ 21%|██▏       | 1447/6779 [53:40<3:15:35,  2.20s/it] 21%|██▏       | 1448/6779 [53:42<3:12:12,  2.16s/it]                                                     {'loss': 1.8851, 'learning_rate': 0.00036112613752420575, 'epoch': 0.21}
+ 21%|██▏       | 1448/6779 [53:42<3:12:12,  2.16s/it] 21%|██▏       | 1449/6779 [53:45<3:20:18,  2.25s/it]                                                     {'loss': 1.8165, 'learning_rate': 0.00036107038871454694, 'epoch': 0.21}
+ 21%|██▏       | 1449/6779 [53:45<3:20:18,  2.25s/it] 21%|██▏       | 1450/6779 [53:47<3:14:09,  2.19s/it]                                                     {'loss': 1.6938, 'learning_rate': 0.00036101460426859214, 'epoch': 0.21}
+ 21%|██▏       | 1450/6779 [53:47<3:14:09,  2.19s/it] 21%|██▏       | 1451/6779 [53:49<3:10:33,  2.15s/it]                                                     {'loss': 1.7957, 'learning_rate': 0.00036095878419868357, 'epoch': 0.21}
+ 21%|██▏       | 1451/6779 [53:49<3:10:33,  2.15s/it] 21%|██▏       | 1452/6779 [53:51<3:06:40,  2.10s/it]                                                     {'loss': 1.7368, 'learning_rate': 0.0003609029285171711, 'epoch': 0.21}
+ 21%|██▏       | 1452/6779 [53:51<3:06:40,  2.10s/it] 21%|██▏       | 1453/6779 [53:53<3:10:10,  2.14s/it]                                                     {'loss': 1.6123, 'learning_rate': 0.0003608470372364127, 'epoch': 0.21}
+ 21%|██▏       | 1453/6779 [53:53<3:10:10,  2.14s/it] 21%|██▏       | 1454/6779 [53:55<3:18:38,  2.24s/it]                                                     {'loss': 1.916, 'learning_rate': 0.0003607911103687741, 'epoch': 0.21}
+ 21%|██▏       | 1454/6779 [53:55<3:18:38,  2.24s/it] 21%|██▏       | 1455/6779 [53:58<3:25:03,  2.31s/it]                                                     {'loss': 1.866, 'learning_rate': 0.00036073514792662895, 'epoch': 0.21}
+ 21%|██▏       | 1455/6779 [53:58<3:25:03,  2.31s/it] 21%|██▏       | 1456/6779 [54:00<3:27:36,  2.34s/it]                                                     {'loss': 1.7706, 'learning_rate': 0.0003606791499223588, 'epoch': 0.21}
+ 21%|██▏       | 1456/6779 [54:00<3:27:36,  2.34s/it] 21%|██▏       | 1457/6779 [54:03<3:23:12,  2.29s/it]                                                     {'loss': 1.752, 'learning_rate': 0.0003606231163683529, 'epoch': 0.21}
+ 21%|██▏       | 1457/6779 [54:03<3:23:12,  2.29s/it] 22%|██▏       | 1458/6779 [54:05<3:21:28,  2.27s/it]                                                     {'loss': 1.8133, 'learning_rate': 0.00036056704727700865, 'epoch': 0.22}
+ 22%|██▏       | 1458/6779 [54:05<3:21:28,  2.27s/it] 22%|██▏       | 1459/6779 [54:07<3:18:09,  2.23s/it]                                                     {'loss': 1.7715, 'learning_rate': 0.000360510942660731, 'epoch': 0.22}
+ 22%|██▏       | 1459/6779 [54:07<3:18:09,  2.23s/it] 22%|██▏       | 1460/6779 [54:09<3:17:26,  2.23s/it]                                                     {'loss': 1.825, 'learning_rate': 0.00036045480253193307, 'epoch': 0.22}
+ 22%|██▏       | 1460/6779 [54:09<3:17:26,  2.23s/it] 22%|██▏       | 1461/6779 [54:11<3:18:22,  2.24s/it]                                                     {'loss': 1.6501, 'learning_rate': 0.00036039862690303556, 'epoch': 0.22}
+ 22%|██▏       | 1461/6779 [54:11<3:18:22,  2.24s/it] 22%|██▏       | 1462/6779 [54:14<3:17:04,  2.22s/it]                                                     {'loss': 1.8821, 'learning_rate': 0.00036034241578646715, 'epoch': 0.22}
+ 22%|██▏       | 1462/6779 [54:14<3:17:04,  2.22s/it] 22%|██▏       | 1463/6779 [54:16<3:15:17,  2.20s/it]                                                     {'loss': 1.804, 'learning_rate': 0.0003602861691946644, 'epoch': 0.22}
+ 22%|██▏       | 1463/6779 [54:16<3:15:17,  2.20s/it] 22%|██▏       | 1464/6779 [54:18<3:13:58,  2.19s/it]                                                     {'loss': 1.8797, 'learning_rate': 0.00036022988714007174, 'epoch': 0.22}
+ 22%|██▏       | 1464/6779 [54:18<3:13:58,  2.19s/it] 22%|██▏       | 1465/6779 [54:20<3:13:06,  2.18s/it]                                                     {'loss': 1.7922, 'learning_rate': 0.0003601735696351413, 'epoch': 0.22}
+ 22%|██▏       | 1465/6779 [54:20<3:13:06,  2.18s/it] 22%|██▏       | 1466/6779 [54:22<3:15:49,  2.21s/it]                                                     {'loss': 1.8579, 'learning_rate': 0.00036011721669233315, 'epoch': 0.22}
+ 22%|██▏       | 1466/6779 [54:22<3:15:49,  2.21s/it] 22%|██▏       | 1467/6779 [54:24<3:13:09,  2.18s/it]                                                     {'loss': 1.8309, 'learning_rate': 0.00036006082832411524, 'epoch': 0.22}
+ 22%|██▏       | 1467/6779 [54:24<3:13:09,  2.18s/it] 22%|██▏       | 1468/6779 [54:27<3:11:06,  2.16s/it]                                                     {'loss': 1.6966, 'learning_rate': 0.0003600044045429633, 'epoch': 0.22}
+ 22%|██▏       | 1468/6779 [54:27<3:11:06,  2.16s/it] 22%|██▏       | 1469/6779 [54:29<3:08:26,  2.13s/it]                                                     {'loss': 1.8873, 'learning_rate': 0.00035994794536136086, 'epoch': 0.22}
+ 22%|██▏       | 1469/6779 [54:29<3:08:26,  2.13s/it] 22%|██▏       | 1470/6779 [54:31<3:07:17,  2.12s/it]                                                     {'loss': 1.7683, 'learning_rate': 0.0003598914507917994, 'epoch': 0.22}
+ 22%|██▏       | 1470/6779 [54:31<3:07:17,  2.12s/it] 22%|██▏       | 1471/6779 [54:33<3:13:48,  2.19s/it]                                                     {'loss': 1.8651, 'learning_rate': 0.00035983492084677807, 'epoch': 0.22}
+ 22%|██▏       | 1471/6779 [54:33<3:13:48,  2.19s/it] 22%|██▏       | 1472/6779 [54:35<3:13:50,  2.19s/it]                                                     {'loss': 1.8432, 'learning_rate': 0.000359778355538804, 'epoch': 0.22}
+ 22%|██▏       | 1472/6779 [54:35<3:13:50,  2.19s/it] 22%|██▏       | 1473/6779 [54:38<3:19:52,  2.26s/it]                                                     {'loss': 1.6583, 'learning_rate': 0.0003597217548803921, 'epoch': 0.22}
+ 22%|██▏       | 1473/6779 [54:38<3:19:52,  2.26s/it] 22%|██▏       | 1474/6779 [54:40<3:18:32,  2.25s/it]                                                     {'loss': 1.814, 'learning_rate': 0.00035966511888406503, 'epoch': 0.22}
+ 22%|██▏       | 1474/6779 [54:40<3:18:32,  2.25s/it] 22%|██▏       | 1475/6779 [54:42<3:17:52,  2.24s/it]                                                     {'loss': 1.8304, 'learning_rate': 0.00035960844756235337, 'epoch': 0.22}
+ 22%|██▏       | 1475/6779 [54:42<3:17:52,  2.24s/it] 22%|██▏       | 1476/6779 [54:44<3:20:23,  2.27s/it]                                                     {'loss': 1.7602, 'learning_rate': 0.00035955174092779546, 'epoch': 0.22}
+ 22%|██▏       | 1476/6779 [54:44<3:20:23,  2.27s/it] 22%|██▏       | 1477/6779 [54:47<3:19:28,  2.26s/it]                                                     {'loss': 1.9282, 'learning_rate': 0.00035949499899293733, 'epoch': 0.22}
+ 22%|██▏       | 1477/6779 [54:47<3:19:28,  2.26s/it] 22%|██▏       | 1478/6779 [54:49<3:12:51,  2.18s/it]                                                     {'loss': 1.6705, 'learning_rate': 0.0003594382217703331, 'epoch': 0.22}
+ 22%|██▏       | 1478/6779 [54:49<3:12:51,  2.18s/it] 22%|██▏       | 1479/6779 [54:51<3:10:54,  2.16s/it]                                                     {'loss': 1.8359, 'learning_rate': 0.00035938140927254455, 'epoch': 0.22}
+ 22%|██▏       | 1479/6779 [54:51<3:10:54,  2.16s/it] 22%|██▏       | 1480/6779 [54:53<3:12:03,  2.17s/it]                                                     {'loss': 1.6568, 'learning_rate': 0.0003593245615121411, 'epoch': 0.22}
+ 22%|██▏       | 1480/6779 [54:53<3:12:03,  2.17s/it] 22%|██▏       | 1481/6779 [54:55<3:12:53,  2.18s/it]                                                     {'loss': 1.7306, 'learning_rate': 0.0003592676785017003, 'epoch': 0.22}
+ 22%|██▏       | 1481/6779 [54:55<3:12:53,  2.18s/it] 22%|██▏       | 1482/6779 [54:57<3:10:33,  2.16s/it]                                                     {'loss': 1.9175, 'learning_rate': 0.00035921076025380717, 'epoch': 0.22}
+ 22%|██▏       | 1482/6779 [54:57<3:10:33,  2.16s/it] 22%|██▏       | 1483/6779 [54:59<3:06:16,  2.11s/it]                                                     {'loss': 1.8597, 'learning_rate': 0.00035915380678105485, 'epoch': 0.22}
+ 22%|██▏       | 1483/6779 [54:59<3:06:16,  2.11s/it] 22%|██▏       | 1484/6779 [55:01<3:07:13,  2.12s/it]                                                     {'loss': 1.7314, 'learning_rate': 0.00035909681809604397, 'epoch': 0.22}
+ 22%|██▏       | 1484/6779 [55:01<3:07:13,  2.12s/it] 22%|██▏       | 1485/6779 [55:03<3:05:09,  2.10s/it]                                                     {'loss': 1.7737, 'learning_rate': 0.00035903979421138325, 'epoch': 0.22}
+ 22%|██▏       | 1485/6779 [55:03<3:05:09,  2.10s/it] 22%|██▏       | 1486/6779 [55:06<3:05:02,  2.10s/it]                                                     {'loss': 1.7369, 'learning_rate': 0.00035898273513968886, 'epoch': 0.22}
+ 22%|██▏       | 1486/6779 [55:06<3:05:02,  2.10s/it] 22%|██▏       | 1487/6779 [55:08<3:11:48,  2.17s/it]                                                     {'loss': 1.6749, 'learning_rate': 0.00035892564089358507, 'epoch': 0.22}
+ 22%|██▏       | 1487/6779 [55:08<3:11:48,  2.17s/it] 22%|██▏       | 1488/6779 [55:10<3:11:45,  2.17s/it]                                                     {'loss': 1.6353, 'learning_rate': 0.0003588685114857037, 'epoch': 0.22}
+ 22%|██▏       | 1488/6779 [55:10<3:11:45,  2.17s/it] 22%|██▏       | 1489/6779 [55:13<3:19:33,  2.26s/it]                                                     {'loss': 1.739, 'learning_rate': 0.0003588113469286845, 'epoch': 0.22}
+ 22%|██▏       | 1489/6779 [55:13<3:19:33,  2.26s/it] 22%|██▏       | 1490/6779 [55:15<3:19:13,  2.26s/it]                                                     {'loss': 1.8145, 'learning_rate': 0.000358754147235175, 'epoch': 0.22}
+ 22%|██▏       | 1490/6779 [55:15<3:19:13,  2.26s/it] 22%|██▏       | 1491/6779 [55:17<3:21:13,  2.28s/it]                                                     {'loss': 1.6463, 'learning_rate': 0.00035869691241783024, 'epoch': 0.22}
+ 22%|██▏       | 1491/6779 [55:17<3:21:13,  2.28s/it] 22%|██▏       | 1492/6779 [55:19<3:19:03,  2.26s/it]                                                     {'loss': 1.7943, 'learning_rate': 0.0003586396424893135, 'epoch': 0.22}
+ 22%|██▏       | 1492/6779 [55:19<3:19:03,  2.26s/it] 22%|██▏       | 1493/6779 [55:22<3:17:49,  2.25s/it]                                                     {'loss': 1.7665, 'learning_rate': 0.0003585823374622953, 'epoch': 0.22}
+ 22%|██▏       | 1493/6779 [55:22<3:17:49,  2.25s/it] 22%|██▏       | 1494/6779 [55:24<3:21:38,  2.29s/it]                                                     {'loss': 1.7273, 'learning_rate': 0.0003585249973494544, 'epoch': 0.22}
+ 22%|██▏       | 1494/6779 [55:24<3:21:38,  2.29s/it] 22%|██▏       | 1495/6779 [55:26<3:23:46,  2.31s/it]                                                     {'loss': 1.7483, 'learning_rate': 0.00035846762216347705, 'epoch': 0.22}
+ 22%|██▏       | 1495/6779 [55:26<3:23:46,  2.31s/it] 22%|██▏       | 1496/6779 [55:28<3:18:13,  2.25s/it]                                                     {'loss': 1.7729, 'learning_rate': 0.0003584102119170572, 'epoch': 0.22}
+ 22%|██▏       | 1496/6779 [55:28<3:18:13,  2.25s/it] 22%|██▏       | 1497/6779 [55:31<3:19:38,  2.27s/it]                                                     {'loss': 1.8689, 'learning_rate': 0.0003583527666228969, 'epoch': 0.22}
+ 22%|██▏       | 1497/6779 [55:31<3:19:38,  2.27s/it] 22%|██▏       | 1498/6779 [55:33<3:15:01,  2.22s/it]                                                     {'loss': 1.9075, 'learning_rate': 0.00035829528629370555, 'epoch': 0.22}
+ 22%|██▏       | 1498/6779 [55:33<3:15:01,  2.22s/it] 22%|██▏       | 1499/6779 [55:35<3:08:49,  2.15s/it]                                                     {'loss': 1.6338, 'learning_rate': 0.0003582377709422006, 'epoch': 0.22}
+ 22%|██▏       | 1499/6779 [55:35<3:08:49,  2.15s/it] 22%|██▏       | 1500/6779 [55:37<3:16:54,  2.24s/it]                                                     {'loss': 1.6777, 'learning_rate': 0.000358180220581107, 'epoch': 0.22}
+ 22%|██▏       | 1500/6779 [55:37<3:16:54,  2.24s/it] 22%|██▏       | 1501/6779 [55:40<3:18:29,  2.26s/it]                                                     {'loss': 1.691, 'learning_rate': 0.00035812263522315776, 'epoch': 0.22}
+ 22%|██▏       | 1501/6779 [55:40<3:18:29,  2.26s/it] 22%|██▏       | 1502/6779 [55:42<3:17:02,  2.24s/it]                                                     {'loss': 1.6561, 'learning_rate': 0.0003580650148810933, 'epoch': 0.22}
+ 22%|██▏       | 1502/6779 [55:42<3:17:02,  2.24s/it] 22%|██▏       | 1503/6779 [55:44<3:24:23,  2.32s/it]                                                     {'loss': 1.7566, 'learning_rate': 0.00035800735956766197, 'epoch': 0.22}
+ 22%|██▏       | 1503/6779 [55:44<3:24:23,  2.32s/it] 22%|██▏       | 1504/6779 [55:47<3:24:55,  2.33s/it]                                                     {'loss': 1.7529, 'learning_rate': 0.0003579496692956199, 'epoch': 0.22}
+ 22%|██▏       | 1504/6779 [55:47<3:24:55,  2.33s/it] 22%|██▏       | 1505/6779 [55:49<3:20:26,  2.28s/it]                                                     {'loss': 1.8339, 'learning_rate': 0.0003578919440777307, 'epoch': 0.22}
+ 22%|██▏       | 1505/6779 [55:49<3:20:26,  2.28s/it] 22%|██▏       | 1506/6779 [55:51<3:19:43,  2.27s/it]                                                     {'loss': 1.8389, 'learning_rate': 0.00035783418392676614, 'epoch': 0.22}
+ 22%|██▏       | 1506/6779 [55:51<3:19:43,  2.27s/it] 22%|██▏       | 1507/6779 [55:53<3:19:18,  2.27s/it]                                                     {'loss': 1.7698, 'learning_rate': 0.0003577763888555052, 'epoch': 0.22}
+ 22%|██▏       | 1507/6779 [55:53<3:19:18,  2.27s/it] 22%|██▏       | 1508/6779 [55:56<3:19:01,  2.27s/it]                                                     {'loss': 1.701, 'learning_rate': 0.00035771855887673507, 'epoch': 0.22}
+ 22%|██▏       | 1508/6779 [55:56<3:19:01,  2.27s/it] 22%|██▏       | 1509/6779 [55:58<3:14:58,  2.22s/it]                                                     {'loss': 1.8879, 'learning_rate': 0.00035766069400325025, 'epoch': 0.22}
+ 22%|██▏       | 1509/6779 [55:58<3:14:58,  2.22s/it] 22%|██▏       | 1510/6779 [56:00<3:12:32,  2.19s/it]                                                     {'loss': 1.8094, 'learning_rate': 0.00035760279424785335, 'epoch': 0.22}
+ 22%|██▏       | 1510/6779 [56:00<3:12:32,  2.19s/it] 22%|██▏       | 1511/6779 [56:02<3:09:20,  2.16s/it]                                                     {'loss': 1.8237, 'learning_rate': 0.0003575448596233543, 'epoch': 0.22}
+ 22%|██▏       | 1511/6779 [56:02<3:09:20,  2.16s/it] 22%|██▏       | 1512/6779 [56:04<3:12:29,  2.19s/it]                                                     {'loss': 1.7066, 'learning_rate': 0.00035748689014257105, 'epoch': 0.22}
+ 22%|██▏       | 1512/6779 [56:04<3:12:29,  2.19s/it] 22%|██▏       | 1513/6779 [56:06<3:10:32,  2.17s/it]                                                     {'loss': 1.8622, 'learning_rate': 0.0003574288858183292, 'epoch': 0.22}
+ 22%|██▏       | 1513/6779 [56:06<3:10:32,  2.17s/it] 22%|██▏       | 1514/6779 [56:08<3:04:50,  2.11s/it]                                                     {'loss': 1.6329, 'learning_rate': 0.00035737084666346197, 'epoch': 0.22}
+ 22%|██▏       | 1514/6779 [56:08<3:04:50,  2.11s/it] 22%|██▏       | 1515/6779 [56:11<3:09:33,  2.16s/it]                                                     {'loss': 1.5701, 'learning_rate': 0.0003573127726908103, 'epoch': 0.22}
+ 22%|██▏       | 1515/6779 [56:11<3:09:33,  2.16s/it] 22%|██▏       | 1516/6779 [56:13<3:10:49,  2.18s/it]                                                     {'loss': 1.7985, 'learning_rate': 0.0003572546639132229, 'epoch': 0.22}
+ 22%|██▏       | 1516/6779 [56:13<3:10:49,  2.18s/it] 22%|██▏       | 1517/6779 [56:15<3:05:30,  2.12s/it]                                                     {'loss': 1.7546, 'learning_rate': 0.0003571965203435562, 'epoch': 0.22}
+ 22%|██▏       | 1517/6779 [56:15<3:05:30,  2.12s/it] 22%|██▏       | 1518/6779 [56:17<3:10:37,  2.17s/it]                                                     {'loss': 1.5509, 'learning_rate': 0.0003571383419946742, 'epoch': 0.22}
+ 22%|██▏       | 1518/6779 [56:17<3:10:37,  2.17s/it] 22%|██▏       | 1519/6779 [56:19<3:06:11,  2.12s/it]                                                     {'loss': 1.7278, 'learning_rate': 0.0003570801288794487, 'epoch': 0.22}
+ 22%|██▏       | 1519/6779 [56:19<3:06:11,  2.12s/it] 22%|██▏       | 1520/6779 [56:21<3:03:47,  2.10s/it]                                                     {'loss': 1.6881, 'learning_rate': 0.00035702188101075904, 'epoch': 0.22}
+ 22%|██▏       | 1520/6779 [56:21<3:03:47,  2.10s/it] 22%|██▏       | 1521/6779 [56:23<3:03:09,  2.09s/it]                                                     {'loss': 1.7025, 'learning_rate': 0.00035696359840149255, 'epoch': 0.22}
+ 22%|██▏       | 1521/6779 [56:23<3:03:09,  2.09s/it] 22%|██▏       | 1522/6779 [56:25<3:00:38,  2.06s/it]                                                     {'loss': 1.7462, 'learning_rate': 0.000356905281064544, 'epoch': 0.22}
+ 22%|██▏       | 1522/6779 [56:25<3:00:38,  2.06s/it] 22%|██▏       | 1523/6779 [56:27<3:06:39,  2.13s/it]                                                     {'loss': 1.7618, 'learning_rate': 0.0003568469290128159, 'epoch': 0.22}
+ 22%|██▏       | 1523/6779 [56:27<3:06:39,  2.13s/it] 22%|██▏       | 1524/6779 [56:30<3:09:36,  2.16s/it]                                                     {'loss': 1.7032, 'learning_rate': 0.0003567885422592185, 'epoch': 0.22}
+ 22%|██▏       | 1524/6779 [56:30<3:09:36,  2.16s/it] 22%|██▏       | 1525/6779 [56:32<3:21:09,  2.30s/it]                                                     {'loss': 1.7536, 'learning_rate': 0.0003567301208166696, 'epoch': 0.22}
+ 22%|██▏       | 1525/6779 [56:32<3:21:09,  2.30s/it] 23%|██▎       | 1526/6779 [56:34<3:18:28,  2.27s/it]                                                     {'loss': 1.6433, 'learning_rate': 0.00035667166469809477, 'epoch': 0.23}
+ 23%|██▎       | 1526/6779 [56:34<3:18:28,  2.27s/it] 23%|██▎       | 1527/6779 [56:37<3:12:25,  2.20s/it]                                                     {'loss': 1.5689, 'learning_rate': 0.00035661317391642725, 'epoch': 0.23}
+ 23%|██▎       | 1527/6779 [56:37<3:12:25,  2.20s/it] 23%|██▎       | 1528/6779 [56:39<3:08:13,  2.15s/it]                                                     {'loss': 1.8087, 'learning_rate': 0.00035655464848460795, 'epoch': 0.23}
+ 23%|██▎       | 1528/6779 [56:39<3:08:13,  2.15s/it] 23%|██▎       | 1529/6779 [56:41<3:06:01,  2.13s/it]                                                     {'loss': 1.709, 'learning_rate': 0.00035649608841558544, 'epoch': 0.23}
+ 23%|██▎       | 1529/6779 [56:41<3:06:01,  2.13s/it] 23%|██▎       | 1530/6779 [56:43<3:07:50,  2.15s/it]                                                     {'loss': 1.9046, 'learning_rate': 0.0003564374937223159, 'epoch': 0.23}
+ 23%|██▎       | 1530/6779 [56:43<3:07:50,  2.15s/it] 23%|██▎       | 1531/6779 [56:45<3:07:33,  2.14s/it]                                                     {'loss': 1.817, 'learning_rate': 0.0003563788644177632, 'epoch': 0.23}
+ 23%|██▎       | 1531/6779 [56:45<3:07:33,  2.14s/it] 23%|██▎       | 1532/6779 [56:47<3:08:58,  2.16s/it]                                                     {'loss': 1.8499, 'learning_rate': 0.00035632020051489893, 'epoch': 0.23}
+ 23%|██▎       | 1532/6779 [56:47<3:08:58,  2.16s/it] 23%|██▎       | 1533/6779 [56:49<3:07:24,  2.14s/it]                                                     {'loss': 1.9163, 'learning_rate': 0.0003562615020267023, 'epoch': 0.23}
+ 23%|██▎       | 1533/6779 [56:49<3:07:24,  2.14s/it] 23%|██▎       | 1534/6779 [56:51<3:06:53,  2.14s/it]                                                     {'loss': 2.0344, 'learning_rate': 0.00035620276896616013, 'epoch': 0.23}
+ 23%|██▎       | 1534/6779 [56:51<3:06:53,  2.14s/it] 23%|██▎       | 1535/6779 [56:54<3:09:23,  2.17s/it]                                                     {'loss': 1.6674, 'learning_rate': 0.00035614400134626687, 'epoch': 0.23}
+ 23%|██▎       | 1535/6779 [56:54<3:09:23,  2.17s/it] 23%|██▎       | 1536/6779 [56:56<3:17:58,  2.27s/it]                                                     {'loss': 1.9265, 'learning_rate': 0.0003560851991800248, 'epoch': 0.23}
+ 23%|██▎       | 1536/6779 [56:56<3:17:58,  2.27s/it] 23%|██▎       | 1537/6779 [56:58<3:18:43,  2.27s/it]                                                     {'loss': 1.6647, 'learning_rate': 0.0003560263624804435, 'epoch': 0.23}
+ 23%|██▎       | 1537/6779 [56:58<3:18:43,  2.27s/it] 23%|██▎       | 1538/6779 [57:01<3:14:46,  2.23s/it]                                                     {'loss': 1.8114, 'learning_rate': 0.0003559674912605406, 'epoch': 0.23}
+ 23%|██▎       | 1538/6779 [57:01<3:14:46,  2.23s/it] 23%|██▎       | 1539/6779 [57:03<3:22:52,  2.32s/it]                                                     {'loss': 1.6516, 'learning_rate': 0.000355908585533341, 'epoch': 0.23}
+ 23%|██▎       | 1539/6779 [57:03<3:22:52,  2.32s/it] 23%|██▎       | 1540/6779 [57:05<3:16:45,  2.25s/it]                                                     {'loss': 1.8022, 'learning_rate': 0.00035584964531187754, 'epoch': 0.23}
+ 23%|██▎       | 1540/6779 [57:05<3:16:45,  2.25s/it] 23%|██▎       | 1541/6779 [57:07<3:16:08,  2.25s/it]                                                     {'loss': 1.7885, 'learning_rate': 0.0003557906706091905, 'epoch': 0.23}
+ 23%|██▎       | 1541/6779 [57:07<3:16:08,  2.25s/it] 23%|██▎       | 1542/6779 [57:10<3:15:36,  2.24s/it]                                                     {'loss': 1.8298, 'learning_rate': 0.0003557316614383278, 'epoch': 0.23}
+ 23%|██▎       | 1542/6779 [57:10<3:15:36,  2.24s/it] 23%|██▎       | 1543/6779 [57:12<3:08:50,  2.16s/it]                                                     {'loss': 1.8174, 'learning_rate': 0.0003556726178123451, 'epoch': 0.23}
+ 23%|██▎       | 1543/6779 [57:12<3:08:50,  2.16s/it] 23%|██▎       | 1544/6779 [57:14<3:10:19,  2.18s/it]                                                     {'loss': 1.7775, 'learning_rate': 0.00035561353974430547, 'epoch': 0.23}
+ 23%|██▎       | 1544/6779 [57:14<3:10:19,  2.18s/it] 23%|██▎       | 1545/6779 [57:16<3:10:56,  2.19s/it]                                                     {'loss': 1.6195, 'learning_rate': 0.0003555544272472799, 'epoch': 0.23}
+ 23%|██▎       | 1545/6779 [57:16<3:10:56,  2.19s/it] 23%|██▎       | 1546/6779 [57:18<3:15:01,  2.24s/it]                                                     {'loss': 1.7727, 'learning_rate': 0.00035549528033434677, 'epoch': 0.23}
+ 23%|██▎       | 1546/6779 [57:18<3:15:01,  2.24s/it] 23%|██▎       | 1547/6779 [57:21<3:14:43,  2.23s/it]                                                     {'loss': 1.8178, 'learning_rate': 0.0003554360990185921, 'epoch': 0.23}
+ 23%|██▎       | 1547/6779 [57:21<3:14:43,  2.23s/it] 23%|██▎       | 1548/6779 [57:23<3:09:16,  2.17s/it]                                                     {'loss': 1.7704, 'learning_rate': 0.00035537688331310963, 'epoch': 0.23}
+ 23%|██▎       | 1548/6779 [57:23<3:09:16,  2.17s/it] 23%|██▎       | 1549/6779 [57:25<3:13:34,  2.22s/it]                                                     {'loss': 1.7831, 'learning_rate': 0.0003553176332310006, 'epoch': 0.23}
+ 23%|██▎       | 1549/6779 [57:25<3:13:34,  2.22s/it] 23%|██▎       | 1550/6779 [57:27<3:16:54,  2.26s/it]                                                     {'loss': 1.8114, 'learning_rate': 0.0003552583487853739, 'epoch': 0.23}
+ 23%|██▎       | 1550/6779 [57:27<3:16:54,  2.26s/it] 23%|██▎       | 1551/6779 [57:30<3:17:01,  2.26s/it]                                                     {'loss': 1.8428, 'learning_rate': 0.000355199029989346, 'epoch': 0.23}
+ 23%|██▎       | 1551/6779 [57:30<3:17:01,  2.26s/it] 23%|██▎       | 1552/6779 [57:32<3:14:05,  2.23s/it]                                                     {'loss': 1.8397, 'learning_rate': 0.00035513967685604113, 'epoch': 0.23}
+ 23%|██▎       | 1552/6779 [57:32<3:14:05,  2.23s/it] 23%|██▎       | 1553/6779 [57:34<3:12:10,  2.21s/it]                                                     {'loss': 1.7154, 'learning_rate': 0.0003550802893985908, 'epoch': 0.23}
+ 23%|██▎       | 1553/6779 [57:34<3:12:10,  2.21s/it] 23%|██▎       | 1554/6779 [57:36<3:13:16,  2.22s/it]                                                     {'loss': 1.7132, 'learning_rate': 0.00035502086763013435, 'epoch': 0.23}
+ 23%|██▎       | 1554/6779 [57:36<3:13:16,  2.22s/it] 23%|██▎       | 1555/6779 [57:38<3:13:22,  2.22s/it]                                                     {'loss': 1.7472, 'learning_rate': 0.00035496141156381866, 'epoch': 0.23}
+ 23%|██▎       | 1555/6779 [57:38<3:13:22,  2.22s/it] 23%|██▎       | 1556/6779 [57:41<3:18:43,  2.28s/it]                                                     {'loss': 1.7483, 'learning_rate': 0.0003549019212127981, 'epoch': 0.23}
+ 23%|██▎       | 1556/6779 [57:41<3:18:43,  2.28s/it] 23%|██▎       | 1557/6779 [57:43<3:16:17,  2.26s/it]                                                     {'loss': 1.7986, 'learning_rate': 0.000354842396590235, 'epoch': 0.23}
+ 23%|██▎       | 1557/6779 [57:43<3:16:17,  2.26s/it] 23%|██▎       | 1558/6779 [57:45<3:09:44,  2.18s/it]                                                     {'loss': 1.7568, 'learning_rate': 0.0003547828377092986, 'epoch': 0.23}
+ 23%|██▎       | 1558/6779 [57:45<3:09:44,  2.18s/it] 23%|██▎       | 1559/6779 [57:47<3:06:28,  2.14s/it]                                                     {'loss': 1.6811, 'learning_rate': 0.00035472324458316637, 'epoch': 0.23}
+ 23%|██▎       | 1559/6779 [57:47<3:06:28,  2.14s/it] 23%|██▎       | 1560/6779 [57:49<3:12:17,  2.21s/it]                                                     {'loss': 1.9144, 'learning_rate': 0.00035466361722502306, 'epoch': 0.23}
+ 23%|██▎       | 1560/6779 [57:49<3:12:17,  2.21s/it] 23%|██▎       | 1561/6779 [57:52<3:12:39,  2.22s/it]                                                     {'loss': 1.7979, 'learning_rate': 0.00035460395564806095, 'epoch': 0.23}
+ 23%|██▎       | 1561/6779 [57:52<3:12:39,  2.22s/it] 23%|██▎       | 1562/6779 [57:54<3:10:38,  2.19s/it]                                                     {'loss': 1.7393, 'learning_rate': 0.00035454425986548003, 'epoch': 0.23}
+ 23%|██▎       | 1562/6779 [57:54<3:10:38,  2.19s/it] 23%|██▎       | 1563/6779 [57:56<3:15:45,  2.25s/it]                                                     {'loss': 1.8093, 'learning_rate': 0.00035448452989048773, 'epoch': 0.23}
+ 23%|██▎       | 1563/6779 [57:56<3:15:45,  2.25s/it] 23%|██▎       | 1564/6779 [57:58<3:14:12,  2.23s/it]                                                     {'loss': 1.8365, 'learning_rate': 0.0003544247657362991, 'epoch': 0.23}
+ 23%|██▎       | 1564/6779 [57:58<3:14:12,  2.23s/it] 23%|██▎       | 1565/6779 [58:01<3:19:18,  2.29s/it]                                                     {'loss': 1.5508, 'learning_rate': 0.0003543649674161369, 'epoch': 0.23}
+ 23%|██▎       | 1565/6779 [58:01<3:19:18,  2.29s/it] 23%|██▎       | 1566/6779 [58:03<3:13:10,  2.22s/it]                                                     {'loss': 1.8636, 'learning_rate': 0.0003543051349432313, 'epoch': 0.23}
+ 23%|██▎       | 1566/6779 [58:03<3:13:10,  2.22s/it] 23%|██▎       | 1567/6779 [58:05<3:10:18,  2.19s/it]                                                     {'loss': 1.8589, 'learning_rate': 0.00035424526833081985, 'epoch': 0.23}
+ 23%|██▎       | 1567/6779 [58:05<3:10:18,  2.19s/it] 23%|██▎       | 1568/6779 [58:07<3:16:27,  2.26s/it]                                                     {'loss': 1.7636, 'learning_rate': 0.00035418536759214804, 'epoch': 0.23}
+ 23%|██▎       | 1568/6779 [58:07<3:16:27,  2.26s/it] 23%|██▎       | 1569/6779 [58:10<3:14:03,  2.23s/it]                                                     {'loss': 1.7591, 'learning_rate': 0.00035412543274046857, 'epoch': 0.23}
+ 23%|██▎       | 1569/6779 [58:10<3:14:03,  2.23s/it] 23%|██▎       | 1570/6779 [58:12<3:13:08,  2.22s/it]                                                     {'loss': 1.7911, 'learning_rate': 0.0003540654637890419, 'epoch': 0.23}
+ 23%|██▎       | 1570/6779 [58:12<3:13:08,  2.22s/it] 23%|██▎       | 1571/6779 [58:14<3:11:26,  2.21s/it]                                                     {'loss': 1.8015, 'learning_rate': 0.000354005460751136, 'epoch': 0.23}
+ 23%|██▎       | 1571/6779 [58:14<3:11:26,  2.21s/it] 23%|██▎       | 1572/6779 [58:16<3:13:09,  2.23s/it]                                                     {'loss': 2.1545, 'learning_rate': 0.00035394542364002626, 'epoch': 0.23}
+ 23%|██▎       | 1572/6779 [58:16<3:13:09,  2.23s/it] 23%|██▎       | 1573/6779 [58:18<3:11:49,  2.21s/it]                                                     {'loss': 1.7584, 'learning_rate': 0.0003538853524689958, 'epoch': 0.23}
+ 23%|██▎       | 1573/6779 [58:18<3:11:49,  2.21s/it] 23%|██▎       | 1574/6779 [58:21<3:19:33,  2.30s/it]                                                     {'loss': 1.6779, 'learning_rate': 0.000353825247251335, 'epoch': 0.23}
+ 23%|██▎       | 1574/6779 [58:21<3:19:33,  2.30s/it] 23%|██▎       | 1575/6779 [58:24<3:32:00,  2.44s/it]                                                     {'loss': 1.6399, 'learning_rate': 0.00035376510800034215, 'epoch': 0.23}
+ 23%|██▎       | 1575/6779 [58:24<3:32:00,  2.44s/it] 23%|██▎       | 1576/6779 [58:26<3:24:50,  2.36s/it]                                                     {'loss': 1.7753, 'learning_rate': 0.0003537049347293227, 'epoch': 0.23}
+ 23%|██▎       | 1576/6779 [58:26<3:24:50,  2.36s/it] 23%|██▎       | 1577/6779 [58:28<3:16:34,  2.27s/it]                                                     {'loss': 1.778, 'learning_rate': 0.0003536447274515899, 'epoch': 0.23}
+ 23%|██▎       | 1577/6779 [58:28<3:16:34,  2.27s/it] 23%|██▎       | 1578/6779 [58:30<3:14:56,  2.25s/it]                                                     {'loss': 1.8353, 'learning_rate': 0.0003535844861804643, 'epoch': 0.23}
+ 23%|██▎       | 1578/6779 [58:30<3:14:56,  2.25s/it] 23%|██▎       | 1579/6779 [58:32<3:12:38,  2.22s/it]                                                     {'loss': 1.8296, 'learning_rate': 0.00035352421092927424, 'epoch': 0.23}
+ 23%|██▎       | 1579/6779 [58:32<3:12:38,  2.22s/it] 23%|██▎       | 1580/6779 [58:34<3:08:31,  2.18s/it]                                                     {'loss': 1.7863, 'learning_rate': 0.00035346390171135526, 'epoch': 0.23}
+ 23%|██▎       | 1580/6779 [58:34<3:08:31,  2.18s/it] 23%|██▎       | 1581/6779 [58:37<3:10:11,  2.20s/it]                                                     {'loss': 1.8683, 'learning_rate': 0.00035340355854005065, 'epoch': 0.23}
+ 23%|██▎       | 1581/6779 [58:37<3:10:11,  2.20s/it] 23%|██▎       | 1582/6779 [58:39<3:22:22,  2.34s/it]                                                     {'loss': 1.8012, 'learning_rate': 0.00035334318142871113, 'epoch': 0.23}
+ 23%|██▎       | 1582/6779 [58:39<3:22:22,  2.34s/it] 23%|██▎       | 1583/6779 [58:41<3:15:21,  2.26s/it]                                                     {'loss': 1.8108, 'learning_rate': 0.000353282770390695, 'epoch': 0.23}
+ 23%|██▎       | 1583/6779 [58:41<3:15:21,  2.26s/it] 23%|██▎       | 1584/6779 [58:43<3:09:26,  2.19s/it]                                                     {'loss': 1.9045, 'learning_rate': 0.0003532223254393679, 'epoch': 0.23}
+ 23%|██▎       | 1584/6779 [58:43<3:09:26,  2.19s/it] 23%|██▎       | 1585/6779 [58:46<3:21:13,  2.32s/it]                                                     {'loss': 1.5714, 'learning_rate': 0.0003531618465881031, 'epoch': 0.23}
+ 23%|██▎       | 1585/6779 [58:46<3:21:13,  2.32s/it] 23%|██▎       | 1586/6779 [58:48<3:17:42,  2.28s/it]                                                     {'loss': 1.8212, 'learning_rate': 0.00035310133385028144, 'epoch': 0.23}
+ 23%|██▎       | 1586/6779 [58:48<3:17:42,  2.28s/it] 23%|██▎       | 1587/6779 [58:50<3:14:55,  2.25s/it]                                                     {'loss': 1.7302, 'learning_rate': 0.00035304078723929106, 'epoch': 0.23}
+ 23%|██▎       | 1587/6779 [58:50<3:14:55,  2.25s/it] 23%|██▎       | 1588/6779 [58:53<3:12:57,  2.23s/it]                                                     {'loss': 1.6834, 'learning_rate': 0.0003529802067685277, 'epoch': 0.23}
+ 23%|██▎       | 1588/6779 [58:53<3:12:57,  2.23s/it] 23%|██▎       | 1589/6779 [58:55<3:11:07,  2.21s/it]                                                     {'loss': 1.8177, 'learning_rate': 0.0003529195924513947, 'epoch': 0.23}
+ 23%|██▎       | 1589/6779 [58:55<3:11:07,  2.21s/it] 23%|██▎       | 1590/6779 [58:57<3:10:34,  2.20s/it]                                                     {'loss': 1.6969, 'learning_rate': 0.0003528589443013027, 'epoch': 0.23}
+ 23%|██▎       | 1590/6779 [58:57<3:10:34,  2.20s/it] 23%|██▎       | 1591/6779 [58:59<3:13:50,  2.24s/it]                                                     {'loss': 1.7562, 'learning_rate': 0.0003527982623316699, 'epoch': 0.23}
+ 23%|██▎       | 1591/6779 [58:59<3:13:50,  2.24s/it] 23%|██▎       | 1592/6779 [59:01<3:10:13,  2.20s/it]                                                     {'loss': 1.6936, 'learning_rate': 0.00035273754655592193, 'epoch': 0.23}
+ 23%|██▎       | 1592/6779 [59:01<3:10:13,  2.20s/it] 23%|██▎       | 1593/6779 [59:04<3:11:40,  2.22s/it]                                                     {'loss': 1.78, 'learning_rate': 0.0003526767969874921, 'epoch': 0.23}
+ 23%|██▎       | 1593/6779 [59:04<3:11:40,  2.22s/it] 24%|██▎       | 1594/6779 [59:06<3:08:34,  2.18s/it]                                                     {'loss': 1.8953, 'learning_rate': 0.000352616013639821, 'epoch': 0.24}
+ 24%|██▎       | 1594/6779 [59:06<3:08:34,  2.18s/it] 24%|██▎       | 1595/6779 [59:08<3:05:13,  2.14s/it]                                                     {'loss': 1.7533, 'learning_rate': 0.00035255519652635666, 'epoch': 0.24}
+ 24%|██▎       | 1595/6779 [59:08<3:05:13,  2.14s/it] 24%|██▎       | 1596/6779 [59:10<3:03:05,  2.12s/it]                                                     {'loss': 1.6825, 'learning_rate': 0.0003524943456605548, 'epoch': 0.24}
+ 24%|██▎       | 1596/6779 [59:10<3:03:05,  2.12s/it] 24%|██▎       | 1597/6779 [59:12<3:02:13,  2.11s/it]                                                     {'loss': 1.7707, 'learning_rate': 0.00035243346105587835, 'epoch': 0.24}
+ 24%|██▎       | 1597/6779 [59:12<3:02:13,  2.11s/it] 24%|██▎       | 1598/6779 [59:14<3:01:03,  2.10s/it]                                                     {'loss': 1.5876, 'learning_rate': 0.0003523725427257979, 'epoch': 0.24}
+ 24%|██▎       | 1598/6779 [59:14<3:01:03,  2.10s/it] 24%|██▎       | 1599/6779 [59:16<3:00:10,  2.09s/it]                                                     {'loss': 1.7878, 'learning_rate': 0.0003523115906837914, 'epoch': 0.24}
+ 24%|██▎       | 1599/6779 [59:16<3:00:10,  2.09s/it] 24%|██▎       | 1600/6779 [59:18<2:57:10,  2.05s/it]                                                     {'loss': 1.6445, 'learning_rate': 0.0003522506049433443, 'epoch': 0.24}
+ 24%|██▎       | 1600/6779 [59:18<2:57:10,  2.05s/it] 24%|██▎       | 1601/6779 [59:20<3:07:37,  2.17s/it]                                                     {'loss': 1.7112, 'learning_rate': 0.0003521895855179496, 'epoch': 0.24}
+ 24%|██▎       | 1601/6779 [59:20<3:07:37,  2.17s/it] 24%|██▎       | 1602/6779 [59:23<3:10:03,  2.20s/it]                                                     {'loss': 1.6741, 'learning_rate': 0.0003521285324211075, 'epoch': 0.24}
+ 24%|██▎       | 1602/6779 [59:23<3:10:03,  2.20s/it] 24%|██▎       | 1603/6779 [59:25<3:05:25,  2.15s/it]                                                     {'loss': 1.7501, 'learning_rate': 0.0003520674456663258, 'epoch': 0.24}
+ 24%|██▎       | 1603/6779 [59:25<3:05:25,  2.15s/it] 24%|██▎       | 1604/6779 [59:27<3:03:17,  2.13s/it]                                                     {'loss': 1.8521, 'learning_rate': 0.00035200632526711986, 'epoch': 0.24}
+ 24%|██▎       | 1604/6779 [59:27<3:03:17,  2.13s/it] 24%|██▎       | 1605/6779 [59:29<3:04:04,  2.13s/it]                                                     {'loss': 1.6575, 'learning_rate': 0.00035194517123701225, 'epoch': 0.24}
+ 24%|██▎       | 1605/6779 [59:29<3:04:04,  2.13s/it] 24%|██▎       | 1606/6779 [59:31<3:09:57,  2.20s/it]                                                     {'loss': 1.6585, 'learning_rate': 0.00035188398358953316, 'epoch': 0.24}
+ 24%|██▎       | 1606/6779 [59:31<3:09:57,  2.20s/it] 24%|██▎       | 1607/6779 [59:34<3:15:59,  2.27s/it]                                                     {'loss': 1.7841, 'learning_rate': 0.00035182276233822017, 'epoch': 0.24}
+ 24%|██▎       | 1607/6779 [59:34<3:15:59,  2.27s/it] 24%|██▎       | 1608/6779 [59:36<3:13:11,  2.24s/it]                                                     {'loss': 1.7752, 'learning_rate': 0.0003517615074966182, 'epoch': 0.24}
+ 24%|██▎       | 1608/6779 [59:36<3:13:11,  2.24s/it] 24%|██▎       | 1609/6779 [59:38<3:06:41,  2.17s/it]                                                     {'loss': 1.8197, 'learning_rate': 0.00035170021907827986, 'epoch': 0.24}
+ 24%|██▎       | 1609/6779 [59:38<3:06:41,  2.17s/it] 24%|██▎       | 1610/6779 [59:40<3:03:52,  2.13s/it]                                                     {'loss': 1.8378, 'learning_rate': 0.0003516388970967648, 'epoch': 0.24}
+ 24%|██▎       | 1610/6779 [59:40<3:03:52,  2.13s/it] 24%|██▍       | 1611/6779 [59:42<3:07:47,  2.18s/it]                                                     {'loss': 1.7459, 'learning_rate': 0.00035157754156564037, 'epoch': 0.24}
+ 24%|██▍       | 1611/6779 [59:42<3:07:47,  2.18s/it] 24%|██▍       | 1612/6779 [59:44<3:04:09,  2.14s/it]                                                     {'loss': 1.5958, 'learning_rate': 0.00035151615249848136, 'epoch': 0.24}
+ 24%|██▍       | 1612/6779 [59:44<3:04:09,  2.14s/it] 24%|██▍       | 1613/6779 [59:47<3:11:14,  2.22s/it]                                                     {'loss': 1.7998, 'learning_rate': 0.00035145472990886985, 'epoch': 0.24}
+ 24%|██▍       | 1613/6779 [59:47<3:11:14,  2.22s/it] 24%|██▍       | 1614/6779 [59:49<3:22:00,  2.35s/it]                                                     {'loss': 1.7559, 'learning_rate': 0.0003513932738103954, 'epoch': 0.24}
+ 24%|██▍       | 1614/6779 [59:49<3:22:00,  2.35s/it] 24%|██▍       | 1615/6779 [59:52<3:28:23,  2.42s/it]                                                     {'loss': 1.7284, 'learning_rate': 0.0003513317842166549, 'epoch': 0.24}
+ 24%|██▍       | 1615/6779 [59:52<3:28:23,  2.42s/it] 24%|██▍       | 1616/6779 [59:54<3:22:51,  2.36s/it]                                                     {'loss': 1.684, 'learning_rate': 0.0003512702611412528, 'epoch': 0.24}
+ 24%|██▍       | 1616/6779 [59:54<3:22:51,  2.36s/it] 24%|██▍       | 1617/6779 [59:56<3:20:04,  2.33s/it]                                                     {'loss': 1.7602, 'learning_rate': 0.00035120870459780094, 'epoch': 0.24}
+ 24%|██▍       | 1617/6779 [59:56<3:20:04,  2.33s/it] 24%|██▍       | 1618/6779 [59:59<3:15:17,  2.27s/it]                                                     {'loss': 1.9868, 'learning_rate': 0.00035114711459991837, 'epoch': 0.24}
+ 24%|██▍       | 1618/6779 [59:59<3:15:17,  2.27s/it] 24%|██▍       | 1619/6779 [1:00:01<3:14:12,  2.26s/it]                                                       {'loss': 1.5582, 'learning_rate': 0.00035108549116123164, 'epoch': 0.24}
+ 24%|██▍       | 1619/6779 [1:00:01<3:14:12,  2.26s/it] 24%|██▍       | 1620/6779 [1:00:03<3:12:10,  2.24s/it]                                                       {'loss': 1.7034, 'learning_rate': 0.0003510238342953749, 'epoch': 0.24}
+ 24%|██▍       | 1620/6779 [1:00:03<3:12:10,  2.24s/it] 24%|██▍       | 1621/6779 [1:00:05<3:11:37,  2.23s/it]                                                       {'loss': 1.5935, 'learning_rate': 0.00035096214401598953, 'epoch': 0.24}
+ 24%|██▍       | 1621/6779 [1:00:05<3:11:37,  2.23s/it] 24%|██▍       | 1622/6779 [1:00:07<3:08:45,  2.20s/it]                                                       {'loss': 1.7443, 'learning_rate': 0.0003509004203367241, 'epoch': 0.24}
+ 24%|██▍       | 1622/6779 [1:00:07<3:08:45,  2.20s/it] 24%|██▍       | 1623/6779 [1:00:09<3:06:25,  2.17s/it]                                                       {'loss': 1.9169, 'learning_rate': 0.00035083866327123494, 'epoch': 0.24}
+ 24%|██▍       | 1623/6779 [1:00:09<3:06:25,  2.17s/it] 24%|██▍       | 1624/6779 [1:00:12<3:10:43,  2.22s/it]                                                       {'loss': 1.746, 'learning_rate': 0.0003507768728331856, 'epoch': 0.24}
+ 24%|██▍       | 1624/6779 [1:00:12<3:10:43,  2.22s/it] 24%|██▍       | 1625/6779 [1:00:14<3:14:22,  2.26s/it]                                                       {'loss': 1.7771, 'learning_rate': 0.0003507150490362469, 'epoch': 0.24}
+ 24%|██▍       | 1625/6779 [1:00:14<3:14:22,  2.26s/it] 24%|██▍       | 1626/6779 [1:00:16<3:12:43,  2.24s/it]                                                       {'loss': 1.6251, 'learning_rate': 0.0003506531918940972, 'epoch': 0.24}
+ 24%|██▍       | 1626/6779 [1:00:16<3:12:43,  2.24s/it] 24%|██▍       | 1627/6779 [1:00:18<3:10:17,  2.22s/it]                                                       {'loss': 1.7417, 'learning_rate': 0.00035059130142042224, 'epoch': 0.24}
+ 24%|██▍       | 1627/6779 [1:00:18<3:10:17,  2.22s/it] 24%|██▍       | 1628/6779 [1:00:21<3:06:37,  2.17s/it]                                                       {'loss': 1.6939, 'learning_rate': 0.00035052937762891504, 'epoch': 0.24}
+ 24%|██▍       | 1628/6779 [1:00:21<3:06:37,  2.17s/it] 24%|██▍       | 1629/6779 [1:00:23<3:15:01,  2.27s/it]                                                       {'loss': 1.8365, 'learning_rate': 0.0003504674205332761, 'epoch': 0.24}
+ 24%|██▍       | 1629/6779 [1:00:23<3:15:01,  2.27s/it] 24%|██▍       | 1630/6779 [1:00:26<3:21:17,  2.35s/it]                                                       {'loss': 1.8653, 'learning_rate': 0.00035040543014721307, 'epoch': 0.24}
+ 24%|██▍       | 1630/6779 [1:00:26<3:21:17,  2.35s/it] 24%|██▍       | 1631/6779 [1:00:28<3:22:20,  2.36s/it]                                                       {'loss': 1.8034, 'learning_rate': 0.0003503434064844413, 'epoch': 0.24}
+ 24%|██▍       | 1631/6779 [1:00:28<3:22:20,  2.36s/it] 24%|██▍       | 1632/6779 [1:00:30<3:15:45,  2.28s/it]                                                       {'loss': 1.9187, 'learning_rate': 0.0003502813495586833, 'epoch': 0.24}
+ 24%|██▍       | 1632/6779 [1:00:30<3:15:45,  2.28s/it] 24%|██▍       | 1633/6779 [1:00:32<3:10:48,  2.22s/it]                                                       {'loss': 1.5668, 'learning_rate': 0.0003502192593836688, 'epoch': 0.24}
+ 24%|██▍       | 1633/6779 [1:00:32<3:10:48,  2.22s/it] 24%|██▍       | 1634/6779 [1:00:35<3:16:32,  2.29s/it]                                                       {'loss': 1.7923, 'learning_rate': 0.00035015713597313523, 'epoch': 0.24}
+ 24%|██▍       | 1634/6779 [1:00:35<3:16:32,  2.29s/it] 24%|██▍       | 1635/6779 [1:00:37<3:16:18,  2.29s/it]                                                       {'loss': 1.6871, 'learning_rate': 0.0003500949793408271, 'epoch': 0.24}
+ 24%|██▍       | 1635/6779 [1:00:37<3:16:18,  2.29s/it] 24%|██▍       | 1636/6779 [1:00:40<3:25:48,  2.40s/it]                                                       {'loss': 1.7124, 'learning_rate': 0.0003500327895004963, 'epoch': 0.24}
+ 24%|██▍       | 1636/6779 [1:00:40<3:25:48,  2.40s/it] 24%|██▍       | 1637/6779 [1:00:42<3:19:56,  2.33s/it]                                                       {'loss': 1.8508, 'learning_rate': 0.00034997056646590225, 'epoch': 0.24}
+ 24%|██▍       | 1637/6779 [1:00:42<3:19:56,  2.33s/it] 24%|██▍       | 1638/6779 [1:00:44<3:13:47,  2.26s/it]                                                       {'loss': 1.701, 'learning_rate': 0.0003499083102508116, 'epoch': 0.24}
+ 24%|██▍       | 1638/6779 [1:00:44<3:13:47,  2.26s/it] 24%|██▍       | 1639/6779 [1:00:46<3:12:26,  2.25s/it]                                                       {'loss': 1.9549, 'learning_rate': 0.00034984602086899827, 'epoch': 0.24}
+ 24%|██▍       | 1639/6779 [1:00:46<3:12:26,  2.25s/it] 24%|██▍       | 1640/6779 [1:00:48<3:06:03,  2.17s/it]                                                       {'loss': 1.5959, 'learning_rate': 0.00034978369833424356, 'epoch': 0.24}
+ 24%|██▍       | 1640/6779 [1:00:48<3:06:03,  2.17s/it] 24%|██▍       | 1641/6779 [1:00:50<3:03:04,  2.14s/it]                                                       {'loss': 1.7311, 'learning_rate': 0.00034972134266033614, 'epoch': 0.24}
+ 24%|██▍       | 1641/6779 [1:00:50<3:03:04,  2.14s/it] 24%|██▍       | 1642/6779 [1:00:52<3:05:32,  2.17s/it]                                                       {'loss': 1.7179, 'learning_rate': 0.0003496589538610721, 'epoch': 0.24}
+ 24%|██▍       | 1642/6779 [1:00:52<3:05:32,  2.17s/it] 24%|██▍       | 1643/6779 [1:00:55<3:07:32,  2.19s/it]                                                       {'loss': 1.6965, 'learning_rate': 0.0003495965319502546, 'epoch': 0.24}
+ 24%|██▍       | 1643/6779 [1:00:55<3:07:32,  2.19s/it] 24%|██▍       | 1644/6779 [1:00:57<3:11:03,  2.23s/it]                                                       {'loss': 1.801, 'learning_rate': 0.00034953407694169437, 'epoch': 0.24}
+ 24%|██▍       | 1644/6779 [1:00:57<3:11:03,  2.23s/it] 24%|██▍       | 1645/6779 [1:01:00<3:23:36,  2.38s/it]                                                       {'loss': 1.6146, 'learning_rate': 0.00034947158884920937, 'epoch': 0.24}
+ 24%|██▍       | 1645/6779 [1:01:00<3:23:36,  2.38s/it] 24%|██▍       | 1646/6779 [1:01:02<3:14:40,  2.28s/it]                                                       {'loss': 1.72, 'learning_rate': 0.00034940906768662493, 'epoch': 0.24}
+ 24%|██▍       | 1646/6779 [1:01:02<3:14:40,  2.28s/it] 24%|██▍       | 1647/6779 [1:01:05<3:33:26,  2.50s/it]                                                       {'loss': 1.6936, 'learning_rate': 0.00034934651346777356, 'epoch': 0.24}
+ 24%|██▍       | 1647/6779 [1:01:05<3:33:26,  2.50s/it] 24%|██▍       | 1648/6779 [1:01:07<3:33:51,  2.50s/it]                                                       {'loss': 1.7703, 'learning_rate': 0.0003492839262064952, 'epoch': 0.24}
+ 24%|██▍       | 1648/6779 [1:01:07<3:33:51,  2.50s/it] 24%|██▍       | 1649/6779 [1:01:09<3:26:19,  2.41s/it]                                                       {'loss': 1.765, 'learning_rate': 0.00034922130591663717, 'epoch': 0.24}
+ 24%|██▍       | 1649/6779 [1:01:09<3:26:19,  2.41s/it] 24%|██▍       | 1650/6779 [1:01:11<3:16:14,  2.30s/it]                                                       {'loss': 1.7489, 'learning_rate': 0.0003491586526120539, 'epoch': 0.24}
+ 24%|██▍       | 1650/6779 [1:01:11<3:16:14,  2.30s/it] 24%|██▍       | 1651/6779 [1:01:14<3:13:31,  2.26s/it]                                                       {'loss': 1.7286, 'learning_rate': 0.00034909596630660716, 'epoch': 0.24}
+ 24%|██▍       | 1651/6779 [1:01:14<3:13:31,  2.26s/it] 24%|██▍       | 1652/6779 [1:01:16<3:07:37,  2.20s/it]                                                       {'loss': 1.8284, 'learning_rate': 0.0003490332470141663, 'epoch': 0.24}
+ 24%|██▍       | 1652/6779 [1:01:16<3:07:37,  2.20s/it] 24%|██▍       | 1653/6779 [1:01:18<3:04:46,  2.16s/it]                                                       {'loss': 1.65, 'learning_rate': 0.00034897049474860763, 'epoch': 0.24}
+ 24%|██▍       | 1653/6779 [1:01:18<3:04:46,  2.16s/it] 24%|██▍       | 1654/6779 [1:01:20<3:03:34,  2.15s/it]                                                       {'loss': 1.7801, 'learning_rate': 0.0003489077095238149, 'epoch': 0.24}
+ 24%|██▍       | 1654/6779 [1:01:20<3:03:34,  2.15s/it] 24%|██▍       | 1655/6779 [1:01:22<3:06:11,  2.18s/it]                                                       {'loss': 1.7232, 'learning_rate': 0.00034884489135367914, 'epoch': 0.24}
+ 24%|██▍       | 1655/6779 [1:01:22<3:06:11,  2.18s/it] 24%|██▍       | 1656/6779 [1:01:24<3:01:19,  2.12s/it]                                                       {'loss': 1.6546, 'learning_rate': 0.00034878204025209865, 'epoch': 0.24}
+ 24%|██▍       | 1656/6779 [1:01:24<3:01:19,  2.12s/it] 24%|██▍       | 1657/6779 [1:01:26<3:03:04,  2.14s/it]                                                       {'loss': 1.7221, 'learning_rate': 0.000348719156232979, 'epoch': 0.24}
+ 24%|██▍       | 1657/6779 [1:01:26<3:03:04,  2.14s/it] 24%|██▍       | 1658/6779 [1:01:28<3:04:11,  2.16s/it]                                                       {'loss': 1.7321, 'learning_rate': 0.0003486562393102331, 'epoch': 0.24}
+ 24%|██▍       | 1658/6779 [1:01:28<3:04:11,  2.16s/it] 24%|██▍       | 1659/6779 [1:01:31<3:03:03,  2.15s/it]                                                       {'loss': 1.8199, 'learning_rate': 0.00034859328949778123, 'epoch': 0.24}
+ 24%|██▍       | 1659/6779 [1:01:31<3:03:03,  2.15s/it] 24%|██▍       | 1660/6779 [1:01:33<3:03:13,  2.15s/it]                                                       {'loss': 1.6659, 'learning_rate': 0.00034853030680955075, 'epoch': 0.24}
+ 24%|██▍       | 1660/6779 [1:01:33<3:03:13,  2.15s/it] 25%|██▍       | 1661/6779 [1:01:35<3:02:17,  2.14s/it]                                                       {'loss': 1.7136, 'learning_rate': 0.0003484672912594762, 'epoch': 0.25}
+ 25%|██▍       | 1661/6779 [1:01:35<3:02:17,  2.14s/it] 25%|██▍       | 1662/6779 [1:01:37<3:01:51,  2.13s/it]                                                       {'loss': 1.8106, 'learning_rate': 0.0003484042428614998, 'epoch': 0.25}
+ 25%|██▍       | 1662/6779 [1:01:37<3:01:51,  2.13s/it] 25%|██▍       | 1663/6779 [1:01:39<3:02:06,  2.14s/it]                                                       {'loss': 1.7933, 'learning_rate': 0.0003483411616295707, 'epoch': 0.25}
+ 25%|██▍       | 1663/6779 [1:01:39<3:02:06,  2.14s/it] 25%|██▍       | 1664/6779 [1:01:41<2:58:40,  2.10s/it]                                                       {'loss': 1.6334, 'learning_rate': 0.0003482780475776455, 'epoch': 0.25}
+ 25%|██▍       | 1664/6779 [1:01:41<2:58:40,  2.10s/it] 25%|██▍       | 1665/6779 [1:01:43<2:58:09,  2.09s/it]                                                       {'loss': 1.7362, 'learning_rate': 0.00034821490071968776, 'epoch': 0.25}
+ 25%|██▍       | 1665/6779 [1:01:43<2:58:09,  2.09s/it] 25%|██▍       | 1666/6779 [1:01:46<3:21:16,  2.36s/it]                                                       {'loss': 1.6871, 'learning_rate': 0.0003481517210696688, 'epoch': 0.25}
+ 25%|██▍       | 1666/6779 [1:01:46<3:21:16,  2.36s/it] 25%|██▍       | 1667/6779 [1:01:48<3:12:49,  2.26s/it]                                                       {'loss': 1.6552, 'learning_rate': 0.0003480885086415667, 'epoch': 0.25}
+ 25%|██▍       | 1667/6779 [1:01:48<3:12:49,  2.26s/it] 25%|██▍       | 1668/6779 [1:01:50<3:09:30,  2.22s/it]                                                       {'loss': 1.6772, 'learning_rate': 0.0003480252634493671, 'epoch': 0.25}
+ 25%|██▍       | 1668/6779 [1:01:50<3:09:30,  2.22s/it] 25%|██▍       | 1669/6779 [1:01:53<3:08:41,  2.22s/it]                                                       {'loss': 1.8163, 'learning_rate': 0.00034796198550706277, 'epoch': 0.25}
+ 25%|██▍       | 1669/6779 [1:01:53<3:08:41,  2.22s/it] 25%|██▍       | 1670/6779 [1:01:55<3:12:29,  2.26s/it]                                                       {'loss': 1.8217, 'learning_rate': 0.00034789867482865375, 'epoch': 0.25}
+ 25%|██▍       | 1670/6779 [1:01:55<3:12:29,  2.26s/it] 25%|██▍       | 1671/6779 [1:01:57<3:17:09,  2.32s/it]                                                       {'loss': 1.7966, 'learning_rate': 0.0003478353314281473, 'epoch': 0.25}
+ 25%|██▍       | 1671/6779 [1:01:57<3:17:09,  2.32s/it] 25%|██▍       | 1672/6779 [1:02:00<3:13:12,  2.27s/it]                                                       {'loss': 1.6935, 'learning_rate': 0.00034777195531955797, 'epoch': 0.25}
+ 25%|██▍       | 1672/6779 [1:02:00<3:13:12,  2.27s/it] 25%|██▍       | 1673/6779 [1:02:02<3:17:11,  2.32s/it]                                                       {'loss': 1.6681, 'learning_rate': 0.0003477085465169076, 'epoch': 0.25}
+ 25%|██▍       | 1673/6779 [1:02:02<3:17:11,  2.32s/it] 25%|██▍       | 1674/6779 [1:02:04<3:16:00,  2.30s/it]                                                       {'loss': 1.9224, 'learning_rate': 0.0003476451050342249, 'epoch': 0.25}
+ 25%|██▍       | 1674/6779 [1:02:04<3:16:00,  2.30s/it] 25%|██▍       | 1675/6779 [1:02:06<3:10:10,  2.24s/it]                                                       {'loss': 1.7996, 'learning_rate': 0.0003475816308855464, 'epoch': 0.25}
+ 25%|██▍       | 1675/6779 [1:02:06<3:10:10,  2.24s/it] 25%|██▍       | 1676/6779 [1:02:09<3:09:46,  2.23s/it]                                                       {'loss': 1.7535, 'learning_rate': 0.00034751812408491536, 'epoch': 0.25}
+ 25%|██▍       | 1676/6779 [1:02:09<3:09:46,  2.23s/it] 25%|██▍       | 1677/6779 [1:02:11<3:05:48,  2.19s/it]                                                       {'loss': 1.7439, 'learning_rate': 0.00034745458464638255, 'epoch': 0.25}
+ 25%|██▍       | 1677/6779 [1:02:11<3:05:48,  2.19s/it] 25%|██▍       | 1678/6779 [1:02:13<3:08:35,  2.22s/it]                                                       {'loss': 1.8175, 'learning_rate': 0.00034739101258400584, 'epoch': 0.25}
+ 25%|██▍       | 1678/6779 [1:02:13<3:08:35,  2.22s/it] 25%|██▍       | 1679/6779 [1:02:15<3:04:13,  2.17s/it]                                                       {'loss': 1.6754, 'learning_rate': 0.0003473274079118503, 'epoch': 0.25}
+ 25%|██▍       | 1679/6779 [1:02:15<3:04:13,  2.17s/it] 25%|██▍       | 1680/6779 [1:02:17<3:02:15,  2.14s/it]                                                       {'loss': 1.724, 'learning_rate': 0.00034726377064398824, 'epoch': 0.25}
+ 25%|██▍       | 1680/6779 [1:02:17<3:02:15,  2.14s/it] 25%|██▍       | 1681/6779 [1:02:19<3:08:56,  2.22s/it]                                                       {'loss': 1.8837, 'learning_rate': 0.0003472001007944993, 'epoch': 0.25}
+ 25%|██▍       | 1681/6779 [1:02:19<3:08:56,  2.22s/it] 25%|██▍       | 1682/6779 [1:02:22<3:14:16,  2.29s/it]                                                       {'loss': 1.6788, 'learning_rate': 0.0003471363983774702, 'epoch': 0.25}
+ 25%|██▍       | 1682/6779 [1:02:22<3:14:16,  2.29s/it] 25%|██▍       | 1683/6779 [1:02:24<3:21:01,  2.37s/it]                                                       {'loss': 1.7602, 'learning_rate': 0.0003470726634069948, 'epoch': 0.25}
+ 25%|██▍       | 1683/6779 [1:02:24<3:21:01,  2.37s/it] 25%|██▍       | 1684/6779 [1:02:26<3:10:38,  2.25s/it]                                                       {'loss': 1.6202, 'learning_rate': 0.00034700889589717426, 'epoch': 0.25}
+ 25%|██▍       | 1684/6779 [1:02:26<3:10:38,  2.25s/it] 25%|██▍       | 1685/6779 [1:02:28<3:03:14,  2.16s/it]                                                       {'loss': 1.7716, 'learning_rate': 0.00034694509586211705, 'epoch': 0.25}
+ 25%|██▍       | 1685/6779 [1:02:28<3:03:14,  2.16s/it] 25%|██▍       | 1686/6779 [1:02:31<3:10:47,  2.25s/it]                                                       {'loss': 1.833, 'learning_rate': 0.0003468812633159386, 'epoch': 0.25}
+ 25%|██▍       | 1686/6779 [1:02:31<3:10:47,  2.25s/it] 25%|██▍       | 1687/6779 [1:02:33<3:10:13,  2.24s/it]                                                       {'loss': 1.7629, 'learning_rate': 0.00034681739827276174, 'epoch': 0.25}
+ 25%|██▍       | 1687/6779 [1:02:33<3:10:13,  2.24s/it] 25%|██▍       | 1688/6779 [1:02:35<3:01:53,  2.14s/it]                                                       {'loss': 1.8519, 'learning_rate': 0.0003467535007467164, 'epoch': 0.25}
+ 25%|██▍       | 1688/6779 [1:02:35<3:01:53,  2.14s/it] 25%|██▍       | 1689/6779 [1:02:37<3:01:48,  2.14s/it]                                                       {'loss': 1.8185, 'learning_rate': 0.0003466895707519396, 'epoch': 0.25}
+ 25%|██▍       | 1689/6779 [1:02:37<3:01:48,  2.14s/it] 25%|██▍       | 1690/6779 [1:02:39<3:02:33,  2.15s/it]                                                       {'loss': 1.7892, 'learning_rate': 0.0003466256083025757, 'epoch': 0.25}
+ 25%|██▍       | 1690/6779 [1:02:39<3:02:33,  2.15s/it] 25%|██▍       | 1691/6779 [1:02:41<3:04:34,  2.18s/it]                                                       {'loss': 1.6856, 'learning_rate': 0.0003465616134127762, 'epoch': 0.25}
+ 25%|██▍       | 1691/6779 [1:02:41<3:04:34,  2.18s/it] 25%|██▍       | 1692/6779 [1:02:44<3:03:32,  2.16s/it]                                                       {'loss': 1.7699, 'learning_rate': 0.00034649758609669985, 'epoch': 0.25}
+ 25%|██▍       | 1692/6779 [1:02:44<3:03:32,  2.16s/it] 25%|██▍       | 1693/6779 [1:02:46<3:03:11,  2.16s/it]                                                       {'loss': 1.7575, 'learning_rate': 0.0003464335263685122, 'epoch': 0.25}
+ 25%|██▍       | 1693/6779 [1:02:46<3:03:11,  2.16s/it] 25%|██▍       | 1694/6779 [1:02:48<3:02:56,  2.16s/it]                                                       {'loss': 1.6917, 'learning_rate': 0.0003463694342423866, 'epoch': 0.25}
+ 25%|██▍       | 1694/6779 [1:02:48<3:02:56,  2.16s/it] 25%|██▌       | 1695/6779 [1:02:50<3:03:14,  2.16s/it]                                                       {'loss': 1.7932, 'learning_rate': 0.0003463053097325029, 'epoch': 0.25}
+ 25%|██▌       | 1695/6779 [1:02:50<3:03:14,  2.16s/it] 25%|██▌       | 1696/6779 [1:02:52<3:02:11,  2.15s/it]                                                       {'loss': 1.7677, 'learning_rate': 0.00034624115285304875, 'epoch': 0.25}
+ 25%|██▌       | 1696/6779 [1:02:52<3:02:11,  2.15s/it] 25%|██▌       | 1697/6779 [1:02:54<2:57:42,  2.10s/it]                                                       {'loss': 1.6178, 'learning_rate': 0.0003461769636182184, 'epoch': 0.25}
+ 25%|██▌       | 1697/6779 [1:02:54<2:57:42,  2.10s/it] 25%|██▌       | 1698/6779 [1:02:57<3:04:04,  2.17s/it]                                                       {'loss': 1.6919, 'learning_rate': 0.0003461127420422136, 'epoch': 0.25}
+ 25%|██▌       | 1698/6779 [1:02:57<3:04:04,  2.17s/it] 25%|██▌       | 1699/6779 [1:02:59<2:59:50,  2.12s/it]                                                       {'loss': 1.911, 'learning_rate': 0.0003460484881392432, 'epoch': 0.25}
+ 25%|██▌       | 1699/6779 [1:02:59<2:59:50,  2.12s/it] 25%|██▌       | 1700/6779 [1:03:01<3:04:23,  2.18s/it]                                                       {'loss': 1.5402, 'learning_rate': 0.0003459842019235231, 'epoch': 0.25}
+ 25%|██▌       | 1700/6779 [1:03:01<3:04:23,  2.18s/it] 25%|██▌       | 1701/6779 [1:03:03<3:05:49,  2.20s/it]                                                       {'loss': 1.8417, 'learning_rate': 0.0003459198834092765, 'epoch': 0.25}
+ 25%|██▌       | 1701/6779 [1:03:03<3:05:49,  2.20s/it] 25%|██▌       | 1702/6779 [1:03:05<3:07:00,  2.21s/it]                                                       {'loss': 1.9433, 'learning_rate': 0.00034585553261073357, 'epoch': 0.25}
+ 25%|██▌       | 1702/6779 [1:03:05<3:07:00,  2.21s/it] 25%|██▌       | 1703/6779 [1:03:08<3:07:51,  2.22s/it]                                                       {'loss': 1.6901, 'learning_rate': 0.00034579114954213174, 'epoch': 0.25}
+ 25%|██▌       | 1703/6779 [1:03:08<3:07:51,  2.22s/it] 25%|██▌       | 1704/6779 [1:03:10<3:05:47,  2.20s/it]                                                       {'loss': 1.8564, 'learning_rate': 0.00034572673421771563, 'epoch': 0.25}
+ 25%|██▌       | 1704/6779 [1:03:10<3:05:47,  2.20s/it] 25%|██▌       | 1705/6779 [1:03:12<3:08:23,  2.23s/it]                                                       {'loss': 1.7412, 'learning_rate': 0.0003456622866517368, 'epoch': 0.25}
+ 25%|██▌       | 1705/6779 [1:03:12<3:08:23,  2.23s/it] 25%|██▌       | 1706/6779 [1:03:14<3:04:32,  2.18s/it]                                                       {'loss': 1.6887, 'learning_rate': 0.00034559780685845413, 'epoch': 0.25}
+ 25%|██▌       | 1706/6779 [1:03:14<3:04:32,  2.18s/it] 25%|██▌       | 1707/6779 [1:03:16<3:02:56,  2.16s/it]                                                       {'loss': 1.7668, 'learning_rate': 0.00034553329485213357, 'epoch': 0.25}
+ 25%|██▌       | 1707/6779 [1:03:16<3:02:56,  2.16s/it] 25%|██▌       | 1708/6779 [1:03:18<3:01:05,  2.14s/it]                                                       {'loss': 1.8712, 'learning_rate': 0.00034546875064704813, 'epoch': 0.25}
+ 25%|██▌       | 1708/6779 [1:03:18<3:01:05,  2.14s/it] 25%|██▌       | 1709/6779 [1:03:20<2:58:05,  2.11s/it]                                                       {'loss': 1.6827, 'learning_rate': 0.0003454041742574781, 'epoch': 0.25}
+ 25%|██▌       | 1709/6779 [1:03:20<2:58:05,  2.11s/it] 25%|██▌       | 1710/6779 [1:03:23<2:59:36,  2.13s/it]                                                       {'loss': 1.7276, 'learning_rate': 0.0003453395656977107, 'epoch': 0.25}
+ 25%|██▌       | 1710/6779 [1:03:23<2:59:36,  2.13s/it] 25%|██▌       | 1711/6779 [1:03:25<2:59:57,  2.13s/it]                                                       {'loss': 1.5842, 'learning_rate': 0.00034527492498204036, 'epoch': 0.25}
+ 25%|██▌       | 1711/6779 [1:03:25<2:59:57,  2.13s/it] 25%|██▌       | 1712/6779 [1:03:27<3:00:16,  2.13s/it]                                                       {'loss': 1.8399, 'learning_rate': 0.00034521025212476875, 'epoch': 0.25}
+ 25%|██▌       | 1712/6779 [1:03:27<3:00:16,  2.13s/it] 25%|██▌       | 1713/6779 [1:03:29<2:55:42,  2.08s/it]                                                       {'loss': 1.672, 'learning_rate': 0.0003451455471402044, 'epoch': 0.25}
+ 25%|██▌       | 1713/6779 [1:03:29<2:55:42,  2.08s/it] 25%|██▌       | 1714/6779 [1:03:31<2:59:05,  2.12s/it]                                                       {'loss': 1.838, 'learning_rate': 0.0003450808100426631, 'epoch': 0.25}
+ 25%|██▌       | 1714/6779 [1:03:31<2:59:05,  2.12s/it] 25%|██▌       | 1715/6779 [1:03:33<3:01:20,  2.15s/it]                                                       {'loss': 1.85, 'learning_rate': 0.0003450160408464678, 'epoch': 0.25}
+ 25%|██▌       | 1715/6779 [1:03:33<3:01:20,  2.15s/it] 25%|██▌       | 1716/6779 [1:03:35<3:04:27,  2.19s/it]                                                       {'loss': 1.7668, 'learning_rate': 0.0003449512395659483, 'epoch': 0.25}
+ 25%|██▌       | 1716/6779 [1:03:35<3:04:27,  2.19s/it] 25%|██▌       | 1717/6779 [1:03:38<3:04:35,  2.19s/it]                                                       {'loss': 1.7168, 'learning_rate': 0.0003448864062154419, 'epoch': 0.25}
+ 25%|██▌       | 1717/6779 [1:03:38<3:04:35,  2.19s/it] 25%|██▌       | 1718/6779 [1:03:40<3:02:46,  2.17s/it]                                                       {'loss': 1.6194, 'learning_rate': 0.0003448215408092927, 'epoch': 0.25}
+ 25%|██▌       | 1718/6779 [1:03:40<3:02:46,  2.17s/it] 25%|██▌       | 1719/6779 [1:03:42<3:05:03,  2.19s/it]                                                       {'loss': 1.727, 'learning_rate': 0.00034475664336185185, 'epoch': 0.25}
+ 25%|██▌       | 1719/6779 [1:03:42<3:05:03,  2.19s/it] 25%|██▌       | 1720/6779 [1:03:44<3:04:36,  2.19s/it]                                                       {'loss': 1.7601, 'learning_rate': 0.00034469171388747767, 'epoch': 0.25}
+ 25%|██▌       | 1720/6779 [1:03:44<3:04:36,  2.19s/it] 25%|██▌       | 1721/6779 [1:03:46<3:06:19,  2.21s/it]                                                       {'loss': 1.7198, 'learning_rate': 0.00034462675240053576, 'epoch': 0.25}
+ 25%|██▌       | 1721/6779 [1:03:46<3:06:19,  2.21s/it] 25%|██▌       | 1722/6779 [1:03:49<3:09:43,  2.25s/it]                                                       {'loss': 1.7307, 'learning_rate': 0.0003445617589153986, 'epoch': 0.25}
+ 25%|██▌       | 1722/6779 [1:03:49<3:09:43,  2.25s/it] 25%|██▌       | 1723/6779 [1:03:51<3:05:08,  2.20s/it]                                                       {'loss': 1.7954, 'learning_rate': 0.00034449673344644563, 'epoch': 0.25}
+ 25%|██▌       | 1723/6779 [1:03:51<3:05:08,  2.20s/it] 25%|██▌       | 1724/6779 [1:03:53<3:13:46,  2.30s/it]                                                       {'loss': 1.5928, 'learning_rate': 0.00034443167600806373, 'epoch': 0.25}
+ 25%|██▌       | 1724/6779 [1:03:53<3:13:46,  2.30s/it] 25%|██▌       | 1725/6779 [1:03:56<3:13:06,  2.29s/it]                                                       {'loss': 1.7159, 'learning_rate': 0.00034436658661464654, 'epoch': 0.25}
+ 25%|██▌       | 1725/6779 [1:03:56<3:13:06,  2.29s/it] 25%|██▌       | 1726/6779 [1:03:58<3:10:39,  2.26s/it]                                                       {'loss': 1.8096, 'learning_rate': 0.00034430146528059485, 'epoch': 0.25}
+ 25%|██▌       | 1726/6779 [1:03:58<3:10:39,  2.26s/it] 25%|██▌       | 1727/6779 [1:04:00<3:05:41,  2.21s/it]                                                       {'loss': 1.5964, 'learning_rate': 0.0003442363120203166, 'epoch': 0.25}
+ 25%|██▌       | 1727/6779 [1:04:00<3:05:41,  2.21s/it] 25%|██▌       | 1728/6779 [1:04:02<3:02:24,  2.17s/it]                                                       {'loss': 1.6955, 'learning_rate': 0.00034417112684822674, 'epoch': 0.25}
+ 25%|██▌       | 1728/6779 [1:04:02<3:02:24,  2.17s/it] 26%|██▌       | 1729/6779 [1:04:04<3:08:25,  2.24s/it]                                                       {'loss': 1.6374, 'learning_rate': 0.00034410590977874717, 'epoch': 0.26}
+ 26%|██▌       | 1729/6779 [1:04:04<3:08:25,  2.24s/it] 26%|██▌       | 1730/6779 [1:04:07<3:12:33,  2.29s/it]                                                       {'loss': 1.7288, 'learning_rate': 0.0003440406608263071, 'epoch': 0.26}
+ 26%|██▌       | 1730/6779 [1:04:07<3:12:33,  2.29s/it] 26%|██▌       | 1731/6779 [1:04:09<3:09:52,  2.26s/it]                                                       {'loss': 1.7248, 'learning_rate': 0.0003439753800053426, 'epoch': 0.26}
+ 26%|██▌       | 1731/6779 [1:04:09<3:09:52,  2.26s/it] 26%|██▌       | 1732/6779 [1:04:12<3:18:04,  2.35s/it]                                                       {'loss': 1.7844, 'learning_rate': 0.0003439100673302967, 'epoch': 0.26}
+ 26%|██▌       | 1732/6779 [1:04:12<3:18:04,  2.35s/it] 26%|██▌       | 1733/6779 [1:04:14<3:20:35,  2.39s/it]                                                       {'loss': 1.809, 'learning_rate': 0.00034384472281561985, 'epoch': 0.26}
+ 26%|██▌       | 1733/6779 [1:04:14<3:20:35,  2.39s/it] 26%|██▌       | 1734/6779 [1:04:16<3:16:48,  2.34s/it]                                                       {'loss': 1.6159, 'learning_rate': 0.00034377934647576914, 'epoch': 0.26}
+ 26%|██▌       | 1734/6779 [1:04:16<3:16:48,  2.34s/it] 26%|██▌       | 1735/6779 [1:04:18<3:09:38,  2.26s/it]                                                       {'loss': 1.8423, 'learning_rate': 0.000343713938325209, 'epoch': 0.26}
+ 26%|██▌       | 1735/6779 [1:04:18<3:09:38,  2.26s/it] 26%|██▌       | 1736/6779 [1:04:21<3:09:43,  2.26s/it]                                                       {'loss': 1.745, 'learning_rate': 0.0003436484983784106, 'epoch': 0.26}
+ 26%|██▌       | 1736/6779 [1:04:21<3:09:43,  2.26s/it] 26%|██▌       | 1737/6779 [1:04:23<3:07:13,  2.23s/it]                                                       {'loss': 1.6926, 'learning_rate': 0.0003435830266498524, 'epoch': 0.26}
+ 26%|██▌       | 1737/6779 [1:04:23<3:07:13,  2.23s/it] 26%|██▌       | 1738/6779 [1:04:25<3:11:14,  2.28s/it]                                                       {'loss': 1.8702, 'learning_rate': 0.0003435175231540199, 'epoch': 0.26}
+ 26%|██▌       | 1738/6779 [1:04:25<3:11:14,  2.28s/it] 26%|██▌       | 1739/6779 [1:04:27<3:10:47,  2.27s/it]                                                       {'loss': 1.5439, 'learning_rate': 0.0003434519879054054, 'epoch': 0.26}
+ 26%|██▌       | 1739/6779 [1:04:27<3:10:47,  2.27s/it] 26%|██▌       | 1740/6779 [1:04:30<3:09:30,  2.26s/it]                                                       {'loss': 1.9089, 'learning_rate': 0.00034338642091850843, 'epoch': 0.26}
+ 26%|██▌       | 1740/6779 [1:04:30<3:09:30,  2.26s/it] 26%|██▌       | 1741/6779 [1:04:32<3:03:45,  2.19s/it]                                                       {'loss': 1.9519, 'learning_rate': 0.0003433208222078354, 'epoch': 0.26}
+ 26%|██▌       | 1741/6779 [1:04:32<3:03:45,  2.19s/it] 26%|██▌       | 1742/6779 [1:04:34<3:01:51,  2.17s/it]                                                       {'loss': 1.6886, 'learning_rate': 0.0003432551917878999, 'epoch': 0.26}
+ 26%|██▌       | 1742/6779 [1:04:34<3:01:51,  2.17s/it] 26%|██▌       | 1743/6779 [1:04:36<3:01:30,  2.16s/it]                                                       {'loss': 1.7971, 'learning_rate': 0.00034318952967322237, 'epoch': 0.26}
+ 26%|██▌       | 1743/6779 [1:04:36<3:01:30,  2.16s/it] 26%|██▌       | 1744/6779 [1:04:38<3:00:52,  2.16s/it]                                                       {'loss': 1.5054, 'learning_rate': 0.0003431238358783304, 'epoch': 0.26}
+ 26%|██▌       | 1744/6779 [1:04:38<3:00:52,  2.16s/it] 26%|██▌       | 1745/6779 [1:04:40<3:01:30,  2.16s/it]                                                       {'loss': 1.6638, 'learning_rate': 0.0003430581104177584, 'epoch': 0.26}
+ 26%|██▌       | 1745/6779 [1:04:40<3:01:30,  2.16s/it] 26%|██▌       | 1746/6779 [1:04:43<3:07:17,  2.23s/it]                                                       {'loss': 1.9072, 'learning_rate': 0.00034299235330604807, 'epoch': 0.26}
+ 26%|██▌       | 1746/6779 [1:04:43<3:07:17,  2.23s/it] 26%|██▌       | 1747/6779 [1:04:45<3:03:52,  2.19s/it]                                                       {'loss': 1.6743, 'learning_rate': 0.00034292656455774795, 'epoch': 0.26}
+ 26%|██▌       | 1747/6779 [1:04:45<3:03:52,  2.19s/it] 26%|██▌       | 1748/6779 [1:04:47<3:02:10,  2.17s/it]                                                       {'loss': 1.8382, 'learning_rate': 0.0003428607441874135, 'epoch': 0.26}
+ 26%|██▌       | 1748/6779 [1:04:47<3:02:10,  2.17s/it] 26%|██▌       | 1749/6779 [1:04:49<2:59:41,  2.14s/it]                                                       {'loss': 1.7824, 'learning_rate': 0.0003427948922096073, 'epoch': 0.26}
+ 26%|██▌       | 1749/6779 [1:04:49<2:59:41,  2.14s/it] 26%|██▌       | 1750/6779 [1:04:51<2:59:40,  2.14s/it]                                                       {'loss': 1.8248, 'learning_rate': 0.00034272900863889885, 'epoch': 0.26}
+ 26%|██▌       | 1750/6779 [1:04:51<2:59:40,  2.14s/it] 26%|██▌       | 1751/6779 [1:04:53<2:57:54,  2.12s/it]                                                       {'loss': 1.9125, 'learning_rate': 0.0003426630934898647, 'epoch': 0.26}
+ 26%|██▌       | 1751/6779 [1:04:53<2:57:54,  2.12s/it] 26%|██▌       | 1752/6779 [1:04:55<2:54:56,  2.09s/it]                                                       {'loss': 1.7244, 'learning_rate': 0.00034259714677708835, 'epoch': 0.26}
+ 26%|██▌       | 1752/6779 [1:04:55<2:54:56,  2.09s/it] 26%|██▌       | 1753/6779 [1:04:57<2:53:29,  2.07s/it]                                                       {'loss': 1.6779, 'learning_rate': 0.0003425311685151603, 'epoch': 0.26}
+ 26%|██▌       | 1753/6779 [1:04:57<2:53:29,  2.07s/it] 26%|██▌       | 1754/6779 [1:04:59<2:58:23,  2.13s/it]                                                       {'loss': 1.9262, 'learning_rate': 0.0003424651587186781, 'epoch': 0.26}
+ 26%|██▌       | 1754/6779 [1:04:59<2:58:23,  2.13s/it] 26%|██▌       | 1755/6779 [1:05:02<2:59:22,  2.14s/it]                                                       {'loss': 1.7627, 'learning_rate': 0.0003423991174022461, 'epoch': 0.26}
+ 26%|██▌       | 1755/6779 [1:05:02<2:59:22,  2.14s/it] 26%|██▌       | 1756/6779 [1:05:04<3:11:24,  2.29s/it]                                                       {'loss': 1.6917, 'learning_rate': 0.0003423330445804757, 'epoch': 0.26}
+ 26%|██▌       | 1756/6779 [1:05:04<3:11:24,  2.29s/it] 26%|██▌       | 1757/6779 [1:05:07<3:18:09,  2.37s/it]                                                       {'loss': 1.7324, 'learning_rate': 0.0003422669402679854, 'epoch': 0.26}
+ 26%|██▌       | 1757/6779 [1:05:07<3:18:09,  2.37s/it] 26%|██▌       | 1758/6779 [1:05:09<3:17:15,  2.36s/it]                                                       {'loss': 1.7402, 'learning_rate': 0.0003422008044794005, 'epoch': 0.26}
+ 26%|██▌       | 1758/6779 [1:05:09<3:17:15,  2.36s/it] 26%|██▌       | 1759/6779 [1:05:12<3:16:46,  2.35s/it]                                                       {'loss': 1.8846, 'learning_rate': 0.0003421346372293534, 'epoch': 0.26}
+ 26%|██▌       | 1759/6779 [1:05:12<3:16:46,  2.35s/it] 26%|██▌       | 1760/6779 [1:05:14<3:15:27,  2.34s/it]                                                       {'loss': 1.7387, 'learning_rate': 0.0003420684385324832, 'epoch': 0.26}
+ 26%|██▌       | 1760/6779 [1:05:14<3:15:27,  2.34s/it] 26%|██▌       | 1761/6779 [1:05:16<3:11:34,  2.29s/it]                                                       {'loss': 1.6179, 'learning_rate': 0.0003420022084034364, 'epoch': 0.26}
+ 26%|██▌       | 1761/6779 [1:05:16<3:11:34,  2.29s/it] 26%|██▌       | 1762/6779 [1:05:18<3:06:33,  2.23s/it]                                                       {'loss': 1.6927, 'learning_rate': 0.000341935946856866, 'epoch': 0.26}
+ 26%|██▌       | 1762/6779 [1:05:18<3:06:33,  2.23s/it] 26%|██▌       | 1763/6779 [1:05:21<3:13:35,  2.32s/it]                                                       {'loss': 1.8427, 'learning_rate': 0.00034186965390743223, 'epoch': 0.26}
+ 26%|██▌       | 1763/6779 [1:05:21<3:13:35,  2.32s/it] 26%|██▌       | 1764/6779 [1:05:23<3:09:52,  2.27s/it]                                                       {'loss': 2.0579, 'learning_rate': 0.00034180332956980223, 'epoch': 0.26}
+ 26%|██▌       | 1764/6779 [1:05:23<3:09:52,  2.27s/it] 26%|██▌       | 1765/6779 [1:05:25<3:07:33,  2.24s/it]                                                       {'loss': 1.7653, 'learning_rate': 0.00034173697385864995, 'epoch': 0.26}
+ 26%|██▌       | 1765/6779 [1:05:25<3:07:33,  2.24s/it] 26%|██▌       | 1766/6779 [1:05:27<3:05:45,  2.22s/it]                                                       {'loss': 1.7343, 'learning_rate': 0.0003416705867886564, 'epoch': 0.26}
+ 26%|██▌       | 1766/6779 [1:05:27<3:05:45,  2.22s/it] 26%|██▌       | 1767/6779 [1:05:30<3:09:53,  2.27s/it]                                                       {'loss': 1.7173, 'learning_rate': 0.0003416041683745095, 'epoch': 0.26}
+ 26%|██▌       | 1767/6779 [1:05:30<3:09:53,  2.27s/it] 26%|██▌       | 1768/6779 [1:05:32<3:15:44,  2.34s/it]                                                       {'loss': 1.6902, 'learning_rate': 0.0003415377186309042, 'epoch': 0.26}
+ 26%|██▌       | 1768/6779 [1:05:32<3:15:44,  2.34s/it] 26%|██▌       | 1769/6779 [1:05:34<3:18:00,  2.37s/it]                                                       {'loss': 1.6068, 'learning_rate': 0.00034147123757254213, 'epoch': 0.26}
+ 26%|██▌       | 1769/6779 [1:05:34<3:18:00,  2.37s/it] 26%|██▌       | 1770/6779 [1:05:37<3:15:45,  2.34s/it]                                                       {'loss': 1.8551, 'learning_rate': 0.0003414047252141322, 'epoch': 0.26}
+ 26%|██▌       | 1770/6779 [1:05:37<3:15:45,  2.34s/it] 26%|██▌       | 1771/6779 [1:05:39<3:09:21,  2.27s/it]                                                       {'loss': 1.7128, 'learning_rate': 0.00034133818157038986, 'epoch': 0.26}
+ 26%|██▌       | 1771/6779 [1:05:39<3:09:21,  2.27s/it] 26%|██▌       | 1772/6779 [1:05:41<3:03:51,  2.20s/it]                                                       {'loss': 1.8372, 'learning_rate': 0.0003412716066560377, 'epoch': 0.26}
+ 26%|██▌       | 1772/6779 [1:05:41<3:03:51,  2.20s/it] 26%|██▌       | 1773/6779 [1:05:43<3:06:07,  2.23s/it]                                                       {'loss': 1.7142, 'learning_rate': 0.0003412050004858053, 'epoch': 0.26}
+ 26%|██▌       | 1773/6779 [1:05:43<3:06:07,  2.23s/it] 26%|██▌       | 1774/6779 [1:05:45<3:01:59,  2.18s/it]                                                       {'loss': 1.7099, 'learning_rate': 0.00034113836307442914, 'epoch': 0.26}
+ 26%|██▌       | 1774/6779 [1:05:45<3:01:59,  2.18s/it] 26%|██▌       | 1775/6779 [1:05:48<3:07:01,  2.24s/it]                                                       {'loss': 1.6827, 'learning_rate': 0.00034107169443665225, 'epoch': 0.26}
+ 26%|██▌       | 1775/6779 [1:05:48<3:07:01,  2.24s/it] 26%|██▌       | 1776/6779 [1:05:50<3:04:53,  2.22s/it]                                                       {'loss': 1.9658, 'learning_rate': 0.0003410049945872251, 'epoch': 0.26}
+ 26%|██▌       | 1776/6779 [1:05:50<3:04:53,  2.22s/it] 26%|██▌       | 1777/6779 [1:05:52<3:11:12,  2.29s/it]                                                       {'loss': 1.699, 'learning_rate': 0.00034093826354090464, 'epoch': 0.26}
+ 26%|██▌       | 1777/6779 [1:05:52<3:11:12,  2.29s/it] 26%|██▌       | 1778/6779 [1:05:55<3:10:13,  2.28s/it]                                                       {'loss': 1.7275, 'learning_rate': 0.000340871501312455, 'epoch': 0.26}
+ 26%|██▌       | 1778/6779 [1:05:55<3:10:13,  2.28s/it] 26%|██▌       | 1779/6779 [1:05:57<3:07:54,  2.25s/it]                                                       {'loss': 1.7406, 'learning_rate': 0.00034080470791664707, 'epoch': 0.26}
+ 26%|██▌       | 1779/6779 [1:05:57<3:07:54,  2.25s/it] 26%|██▋       | 1780/6779 [1:05:59<3:02:26,  2.19s/it]                                                       {'loss': 1.7841, 'learning_rate': 0.00034073788336825867, 'epoch': 0.26}
+ 26%|██▋       | 1780/6779 [1:05:59<3:02:26,  2.19s/it] 26%|██▋       | 1781/6779 [1:06:01<3:06:04,  2.23s/it]                                                       {'loss': 1.8414, 'learning_rate': 0.0003406710276820745, 'epoch': 0.26}
+ 26%|██▋       | 1781/6779 [1:06:01<3:06:04,  2.23s/it] 26%|██▋       | 1782/6779 [1:06:03<3:08:40,  2.27s/it]                                                       {'loss': 1.9715, 'learning_rate': 0.00034060414087288616, 'epoch': 0.26}
+ 26%|██▋       | 1782/6779 [1:06:03<3:08:40,  2.27s/it] 26%|██▋       | 1783/6779 [1:06:06<3:07:05,  2.25s/it]                                                       {'loss': 1.7956, 'learning_rate': 0.0003405372229554922, 'epoch': 0.26}
+ 26%|██▋       | 1783/6779 [1:06:06<3:07:05,  2.25s/it] 26%|██▋       | 1784/6779 [1:06:08<3:06:51,  2.24s/it]                                                       {'loss': 1.7585, 'learning_rate': 0.00034047027394469787, 'epoch': 0.26}
+ 26%|██▋       | 1784/6779 [1:06:08<3:06:51,  2.24s/it] 26%|██▋       | 1785/6779 [1:06:10<3:00:39,  2.17s/it]                                                       {'loss': 1.6785, 'learning_rate': 0.0003404032938553156, 'epoch': 0.26}
+ 26%|██▋       | 1785/6779 [1:06:10<3:00:39,  2.17s/it] 26%|██▋       | 1786/6779 [1:06:12<2:58:20,  2.14s/it]                                                       {'loss': 1.7636, 'learning_rate': 0.0003403362827021643, 'epoch': 0.26}
+ 26%|██▋       | 1786/6779 [1:06:12<2:58:20,  2.14s/it] 26%|██▋       | 1787/6779 [1:06:14<2:51:45,  2.06s/it]                                                       {'loss': 1.6882, 'learning_rate': 0.00034026924050007014, 'epoch': 0.26}
+ 26%|██▋       | 1787/6779 [1:06:14<2:51:45,  2.06s/it] 26%|██▋       | 1788/6779 [1:06:16<3:06:18,  2.24s/it]                                                       {'loss': 1.8547, 'learning_rate': 0.00034020216726386596, 'epoch': 0.26}
+ 26%|██▋       | 1788/6779 [1:06:16<3:06:18,  2.24s/it] 26%|██▋       | 1789/6779 [1:06:19<3:07:41,  2.26s/it]                                                       {'loss': 1.7231, 'learning_rate': 0.0003401350630083914, 'epoch': 0.26}
+ 26%|██▋       | 1789/6779 [1:06:19<3:07:41,  2.26s/it] 26%|██▋       | 1790/6779 [1:06:21<3:10:51,  2.30s/it]                                                       {'loss': 1.7131, 'learning_rate': 0.00034006792774849315, 'epoch': 0.26}
+ 26%|██▋       | 1790/6779 [1:06:21<3:10:51,  2.30s/it] 26%|██▋       | 1791/6779 [1:06:23<3:09:05,  2.27s/it]                                                       {'loss': 1.639, 'learning_rate': 0.0003400007614990246, 'epoch': 0.26}
+ 26%|██▋       | 1791/6779 [1:06:23<3:09:05,  2.27s/it] 26%|██▋       | 1792/6779 [1:06:26<3:20:38,  2.41s/it]                                                       {'loss': 1.7871, 'learning_rate': 0.00033993356427484614, 'epoch': 0.26}
+ 26%|██▋       | 1792/6779 [1:06:26<3:20:38,  2.41s/it] 26%|██▋       | 1793/6779 [1:06:28<3:15:19,  2.35s/it]                                                       {'loss': 1.6699, 'learning_rate': 0.00033986633609082485, 'epoch': 0.26}
+ 26%|██▋       | 1793/6779 [1:06:28<3:15:19,  2.35s/it] 26%|██▋       | 1794/6779 [1:06:30<3:07:04,  2.25s/it]                                                       {'loss': 1.7077, 'learning_rate': 0.0003397990769618348, 'epoch': 0.26}
+ 26%|██▋       | 1794/6779 [1:06:30<3:07:04,  2.25s/it] 26%|██▋       | 1795/6779 [1:06:33<3:06:35,  2.25s/it]                                                       {'loss': 1.8121, 'learning_rate': 0.00033973178690275684, 'epoch': 0.26}
+ 26%|██▋       | 1795/6779 [1:06:33<3:06:35,  2.25s/it] 26%|██▋       | 1796/6779 [1:06:35<3:01:46,  2.19s/it]                                                       {'loss': 1.7195, 'learning_rate': 0.0003396644659284787, 'epoch': 0.26}
+ 26%|██▋       | 1796/6779 [1:06:35<3:01:46,  2.19s/it] 27%|██▋       | 1797/6779 [1:06:37<3:12:17,  2.32s/it]                                                       {'loss': 1.8508, 'learning_rate': 0.0003395971140538948, 'epoch': 0.27}
+ 27%|██▋       | 1797/6779 [1:06:37<3:12:17,  2.32s/it] 27%|██▋       | 1798/6779 [1:06:39<3:10:33,  2.30s/it]                                                       {'loss': 1.6373, 'learning_rate': 0.0003395297312939067, 'epoch': 0.27}
+ 27%|█��▋       | 1798/6779 [1:06:39<3:10:33,  2.30s/it] 27%|██▋       | 1799/6779 [1:06:42<3:03:56,  2.22s/it]                                                       {'loss': 1.6967, 'learning_rate': 0.00033946231766342254, 'epoch': 0.27}
+ 27%|██▋       | 1799/6779 [1:06:42<3:03:56,  2.22s/it] 27%|██▋       | 1800/6779 [1:06:44<3:03:54,  2.22s/it]                                                       {'loss': 1.8437, 'learning_rate': 0.0003393948731773573, 'epoch': 0.27}
+ 27%|██▋       | 1800/6779 [1:06:44<3:03:54,  2.22s/it] 27%|██▋       | 1801/6779 [1:06:46<3:00:43,  2.18s/it]                                                       {'loss': 1.5843, 'learning_rate': 0.00033932739785063297, 'epoch': 0.27}
+ 27%|██▋       | 1801/6779 [1:06:46<3:00:43,  2.18s/it] 27%|██▋       | 1802/6779 [1:06:48<2:58:55,  2.16s/it]                                                       {'loss': 1.6361, 'learning_rate': 0.0003392598916981782, 'epoch': 0.27}
+ 27%|██▋       | 1802/6779 [1:06:48<2:58:55,  2.16s/it] 27%|██▋       | 1803/6779 [1:06:50<2:55:49,  2.12s/it]                                                       {'loss': 1.5782, 'learning_rate': 0.00033919235473492843, 'epoch': 0.27}
+ 27%|██▋       | 1803/6779 [1:06:50<2:55:49,  2.12s/it] 27%|██▋       | 1804/6779 [1:06:52<2:53:58,  2.10s/it]                                                       {'loss': 1.7285, 'learning_rate': 0.00033912478697582603, 'epoch': 0.27}
+ 27%|██▋       | 1804/6779 [1:06:52<2:53:58,  2.10s/it] 27%|██▋       | 1805/6779 [1:06:54<2:55:20,  2.12s/it]                                                       {'loss': 1.6049, 'learning_rate': 0.00033905718843582025, 'epoch': 0.27}
+ 27%|██▋       | 1805/6779 [1:06:54<2:55:20,  2.12s/it] 27%|██▋       | 1806/6779 [1:06:57<3:07:20,  2.26s/it]                                                       {'loss': 1.6545, 'learning_rate': 0.00033898955912986696, 'epoch': 0.27}
+ 27%|██▋       | 1806/6779 [1:06:57<3:07:20,  2.26s/it] 27%|██▋       | 1807/6779 [1:06:59<3:10:13,  2.30s/it]                                                       {'loss': 1.8178, 'learning_rate': 0.00033892189907292885, 'epoch': 0.27}
+ 27%|██▋       | 1807/6779 [1:06:59<3:10:13,  2.30s/it] 27%|██▋       | 1808/6779 [1:07:01<3:10:03,  2.29s/it]                                                       {'loss': 1.6726, 'learning_rate': 0.0003388542082799756, 'epoch': 0.27}
+ 27%|██▋       | 1808/6779 [1:07:01<3:10:03,  2.29s/it] 27%|██▋       | 1809/6779 [1:07:04<3:06:42,  2.25s/it]                                                       {'loss': 1.6453, 'learning_rate': 0.00033878648676598363, 'epoch': 0.27}
+ 27%|██▋       | 1809/6779 [1:07:04<3:06:42,  2.25s/it] 27%|██▋       | 1810/6779 [1:07:06<3:00:09,  2.18s/it]                                                       {'loss': 1.6369, 'learning_rate': 0.0003387187345459359, 'epoch': 0.27}
+ 27%|██▋       | 1810/6779 [1:07:06<3:00:09,  2.18s/it] 27%|██▋       | 1811/6779 [1:07:08<3:03:47,  2.22s/it]                                                       {'loss': 1.8458, 'learning_rate': 0.0003386509516348225, 'epoch': 0.27}
+ 27%|██▋       | 1811/6779 [1:07:08<3:03:47,  2.22s/it] 27%|██▋       | 1812/6779 [1:07:10<3:05:46,  2.24s/it]                                                       {'loss': 1.7441, 'learning_rate': 0.00033858313804764015, 'epoch': 0.27}
+ 27%|██▋       | 1812/6779 [1:07:10<3:05:46,  2.24s/it] 27%|██▋       | 1813/6779 [1:07:12<3:03:31,  2.22s/it]                                                       {'loss': 1.6943, 'learning_rate': 0.00033851529379939243, 'epoch': 0.27}
+ 27%|██▋       | 1813/6779 [1:07:12<3:03:31,  2.22s/it] 27%|██▋       | 1814/6779 [1:07:15<3:04:44,  2.23s/it]                                                       {'loss': 1.5658, 'learning_rate': 0.0003384474189050896, 'epoch': 0.27}
+ 27%|██▋       | 1814/6779 [1:07:15<3:04:44,  2.23s/it] 27%|██▋       | 1815/6779 [1:07:17<3:06:55,  2.26s/it]                                                       {'loss': 1.7763, 'learning_rate': 0.00033837951337974874, 'epoch': 0.27}
+ 27%|██▋       | 1815/6779 [1:07:17<3:06:55,  2.26s/it] 27%|██▋       | 1816/6779 [1:07:19<3:02:18,  2.20s/it]                                                       {'loss': 1.8656, 'learning_rate': 0.00033831157723839385, 'epoch': 0.27}
+ 27%|██▋       | 1816/6779 [1:07:19<3:02:18,  2.20s/it] 27%|██▋       | 1817/6779 [1:07:21<2:59:37,  2.17s/it]                                                       {'loss': 1.5815, 'learning_rate': 0.00033824361049605546, 'epoch': 0.27}
+ 27%|██▋       | 1817/6779 [1:07:21<2:59:37,  2.17s/it] 27%|██▋       | 1818/6779 [1:07:23<3:03:39,  2.22s/it]                                                       {'loss': 1.8485, 'learning_rate': 0.0003381756131677709, 'epoch': 0.27}
+ 27%|██▋       | 1818/6779 [1:07:23<3:03:39,  2.22s/it] 27%|██▋       | 1819/6779 [1:07:26<3:03:23,  2.22s/it]                                                       {'loss': 1.7805, 'learning_rate': 0.00033810758526858455, 'epoch': 0.27}
+ 27%|██▋       | 1819/6779 [1:07:26<3:03:23,  2.22s/it] 27%|██▋       | 1820/6779 [1:07:28<3:04:30,  2.23s/it]                                                       {'loss': 1.8877, 'learning_rate': 0.00033803952681354737, 'epoch': 0.27}
+ 27%|██▋       | 1820/6779 [1:07:28<3:04:30,  2.23s/it] 27%|██▋       | 1821/6779 [1:07:30<2:59:26,  2.17s/it]                                                       {'loss': 1.9689, 'learning_rate': 0.00033797143781771693, 'epoch': 0.27}
+ 27%|██▋       | 1821/6779 [1:07:30<2:59:26,  2.17s/it] 27%|██▋       | 1822/6779 [1:07:32<3:00:44,  2.19s/it]                                                       {'loss': 1.8143, 'learning_rate': 0.00033790331829615773, 'epoch': 0.27}
+ 27%|██▋       | 1822/6779 [1:07:32<3:00:44,  2.19s/it] 27%|██▋       | 1823/6779 [1:07:34<2:57:14,  2.15s/it]                                                       {'loss': 1.7215, 'learning_rate': 0.00033783516826394106, 'epoch': 0.27}
+ 27%|██▋       | 1823/6779 [1:07:34<2:57:14,  2.15s/it] 27%|██▋       | 1824/6779 [1:07:36<2:59:45,  2.18s/it]                                                       {'loss': 1.8892, 'learning_rate': 0.00033776698773614475, 'epoch': 0.27}
+ 27%|██▋       | 1824/6779 [1:07:36<2:59:45,  2.18s/it] 27%|██▋       | 1825/6779 [1:07:39<2:59:23,  2.17s/it]                                                       {'loss': 1.7881, 'learning_rate': 0.0003376987767278537, 'epoch': 0.27}
+ 27%|██▋       | 1825/6779 [1:07:39<2:59:23,  2.17s/it] 27%|██▋       | 1826/6779 [1:07:41<2:55:41,  2.13s/it]                                                       {'loss': 1.6711, 'learning_rate': 0.00033763053525415925, 'epoch': 0.27}
+ 27%|██▋       | 1826/6779 [1:07:41<2:55:41,  2.13s/it] 27%|██▋       | 1827/6779 [1:07:43<2:58:25,  2.16s/it]                                                       {'loss': 1.742, 'learning_rate': 0.0003375622633301596, 'epoch': 0.27}
+ 27%|██▋       | 1827/6779 [1:07:43<2:58:25,  2.16s/it] 27%|██▋       | 1828/6779 [1:07:45<3:00:15,  2.18s/it]                                                       {'loss': 1.6847, 'learning_rate': 0.0003374939609709598, 'epoch': 0.27}
+ 27%|██▋       | 1828/6779 [1:07:45<3:00:15,  2.18s/it] 27%|██▋       | 1829/6779 [1:07:47<3:00:01,  2.18s/it]                                                       {'loss': 1.6528, 'learning_rate': 0.0003374256281916714, 'epoch': 0.27}
+ 27%|██▋       | 1829/6779 [1:07:47<3:00:01,  2.18s/it] 27%|██▋       | 1830/6779 [1:07:50<3:03:56,  2.23s/it]                                                       {'loss': 1.7498, 'learning_rate': 0.0003373572650074129, 'epoch': 0.27}
+ 27%|██▋       | 1830/6779 [1:07:50<3:03:56,  2.23s/it] 27%|██▋       | 1831/6779 [1:07:52<3:01:58,  2.21s/it]                                                       {'loss': 1.7824, 'learning_rate': 0.0003372888714333094, 'epoch': 0.27}
+ 27%|██▋       | 1831/6779 [1:07:52<3:01:58,  2.21s/it] 27%|██▋       | 1832/6779 [1:07:54<3:01:18,  2.20s/it]                                                       {'loss': 1.5613, 'learning_rate': 0.00033722044748449266, 'epoch': 0.27}
+ 27%|██▋       | 1832/6779 [1:07:54<3:01:18,  2.20s/it] 27%|██▋       | 1833/6779 [1:07:56<2:57:21,  2.15s/it]                                                       {'loss': 1.6096, 'learning_rate': 0.0003371519931761014, 'epoch': 0.27}
+ 27%|██▋       | 1833/6779 [1:07:56<2:57:21,  2.15s/it] 27%|██▋       | 1834/6779 [1:07:58<3:00:00,  2.18s/it]                                                       {'loss': 1.7017, 'learning_rate': 0.0003370835085232808, 'epoch': 0.27}
+ 27%|██▋       | 1834/6779 [1:07:58<3:00:00,  2.18s/it] 27%|██▋       | 1835/6779 [1:08:01<3:03:18,  2.22s/it]                                                       {'loss': 1.7828, 'learning_rate': 0.00033701499354118293, 'epoch': 0.27}
+ 27%|██▋       | 1835/6779 [1:08:01<3:03:18,  2.22s/it] 27%|██▋       | 1836/6779 [1:08:03<3:10:22,  2.31s/it]                                                       {'loss': 1.7672, 'learning_rate': 0.0003369464482449665, 'epoch': 0.27}
+ 27%|██▋       | 1836/6779 [1:08:03<3:10:22,  2.31s/it] 27%|██▋       | 1837/6779 [1:08:06<3:16:52,  2.39s/it]                                                       {'loss': 1.737, 'learning_rate': 0.00033687787264979695, 'epoch': 0.27}
+ 27%|██▋       | 1837/6779 [1:08:06<3:16:52,  2.39s/it] 27%|██▋       | 1838/6779 [1:08:08<3:18:42,  2.41s/it]                                                       {'loss': 1.8943, 'learning_rate': 0.00033680926677084633, 'epoch': 0.27}
+ 27%|██▋       | 1838/6779 [1:08:08<3:18:42,  2.41s/it] 27%|���█▋       | 1839/6779 [1:08:10<3:15:49,  2.38s/it]                                                       {'loss': 1.8164, 'learning_rate': 0.00033674063062329347, 'epoch': 0.27}
+ 27%|██▋       | 1839/6779 [1:08:10<3:15:49,  2.38s/it] 27%|██▋       | 1840/6779 [1:08:12<3:06:04,  2.26s/it]                                                       {'loss': 1.7339, 'learning_rate': 0.000336671964222324, 'epoch': 0.27}
+ 27%|██▋       | 1840/6779 [1:08:12<3:06:04,  2.26s/it] 27%|██▋       | 1841/6779 [1:08:15<3:10:50,  2.32s/it]                                                       {'loss': 1.7299, 'learning_rate': 0.00033660326758313007, 'epoch': 0.27}
+ 27%|██▋       | 1841/6779 [1:08:15<3:10:50,  2.32s/it] 27%|██▋       | 1842/6779 [1:08:17<3:08:42,  2.29s/it]                                                       {'loss': 1.6379, 'learning_rate': 0.0003365345407209105, 'epoch': 0.27}
+ 27%|██▋       | 1842/6779 [1:08:17<3:08:42,  2.29s/it] 27%|██▋       | 1843/6779 [1:08:19<3:08:05,  2.29s/it]                                                       {'loss': 1.6146, 'learning_rate': 0.00033646578365087107, 'epoch': 0.27}
+ 27%|██▋       | 1843/6779 [1:08:19<3:08:05,  2.29s/it] 27%|██▋       | 1844/6779 [1:08:22<3:07:20,  2.28s/it]                                                       {'loss': 1.8794, 'learning_rate': 0.0003363969963882239, 'epoch': 0.27}
+ 27%|██▋       | 1844/6779 [1:08:22<3:07:20,  2.28s/it] 27%|██▋       | 1845/6779 [1:08:24<3:03:10,  2.23s/it]                                                       {'loss': 1.4869, 'learning_rate': 0.000336328178948188, 'epoch': 0.27}
+ 27%|██▋       | 1845/6779 [1:08:24<3:03:10,  2.23s/it] 27%|██▋       | 1846/6779 [1:08:26<3:01:42,  2.21s/it]                                                       {'loss': 1.8477, 'learning_rate': 0.00033625933134598905, 'epoch': 0.27}
+ 27%|██▋       | 1846/6779 [1:08:26<3:01:42,  2.21s/it] 27%|██▋       | 1847/6779 [1:08:28<3:00:23,  2.19s/it]                                                       {'loss': 1.7512, 'learning_rate': 0.0003361904535968593, 'epoch': 0.27}
+ 27%|██▋       | 1847/6779 [1:08:28<3:00:23,  2.19s/it] 27%|██▋       | 1848/6779 [1:08:30<2:58:29,  2.17s/it]                                                       {'loss': 1.8492, 'learning_rate': 0.00033612154571603767, 'epoch': 0.27}
+ 27%|██▋       | 1848/6779 [1:08:30<2:58:29,  2.17s/it] 27%|██▋       | 1849/6779 [1:08:33<3:03:51,  2.24s/it]                                                       {'loss': 1.8091, 'learning_rate': 0.00033605260771877, 'epoch': 0.27}
+ 27%|██▋       | 1849/6779 [1:08:33<3:03:51,  2.24s/it] 27%|██▋       | 1850/6779 [1:08:35<3:00:27,  2.20s/it]                                                       {'loss': 1.8472, 'learning_rate': 0.00033598363962030836, 'epoch': 0.27}
+ 27%|██▋       | 1850/6779 [1:08:35<3:00:27,  2.20s/it] 27%|██▋       | 1851/6779 [1:08:37<3:01:39,  2.21s/it]                                                       {'loss': 1.8334, 'learning_rate': 0.00033591464143591186, 'epoch': 0.27}
+ 27%|██▋       | 1851/6779 [1:08:37<3:01:39,  2.21s/it] 27%|██▋       | 1852/6779 [1:08:39<3:00:40,  2.20s/it]                                                       {'loss': 1.782, 'learning_rate': 0.0003358456131808461, 'epoch': 0.27}
+ 27%|██▋       | 1852/6779 [1:08:39<3:00:40,  2.20s/it] 27%|██▋       | 1853/6779 [1:08:41<2:56:41,  2.15s/it]                                                       {'loss': 1.6368, 'learning_rate': 0.00033577655487038334, 'epoch': 0.27}
+ 27%|██▋       | 1853/6779 [1:08:41<2:56:41,  2.15s/it] 27%|██▋       | 1854/6779 [1:08:43<2:59:45,  2.19s/it]                                                       {'loss': 1.754, 'learning_rate': 0.0003357074665198025, 'epoch': 0.27}
+ 27%|██▋       | 1854/6779 [1:08:43<2:59:45,  2.19s/it] 27%|██▋       | 1855/6779 [1:08:46<2:58:10,  2.17s/it]                                                       {'loss': 1.6688, 'learning_rate': 0.0003356383481443891, 'epoch': 0.27}
+ 27%|██▋       | 1855/6779 [1:08:46<2:58:10,  2.17s/it] 27%|██▋       | 1856/6779 [1:08:48<3:00:03,  2.19s/it]                                                       {'loss': 1.4993, 'learning_rate': 0.0003355691997594355, 'epoch': 0.27}
+ 27%|██▋       | 1856/6779 [1:08:48<3:00:03,  2.19s/it] 27%|██▋       | 1857/6779 [1:08:50<3:00:39,  2.20s/it]                                                       {'loss': 1.7421, 'learning_rate': 0.0003355000213802404, 'epoch': 0.27}
+ 27%|██▋       | 1857/6779 [1:08:50<3:00:39,  2.20s/it] 27%|██▋       | 1858/6779 [1:08:52<3:00:21,  2.20s/it]                                                       {'loss': 1.6872, 'learning_rate': 0.00033543081302210944, 'epoch': 0.27}
+ 27%|██▋       | 1858/6779 [1:08:52<3:00:21,  2.20s/it] 27%|██▋       | 1859/6779 [1:08:55<3:03:30,  2.24s/it]                                                       {'loss': 1.6958, 'learning_rate': 0.00033536157470035453, 'epoch': 0.27}
+ 27%|██▋       | 1859/6779 [1:08:55<3:03:30,  2.24s/it] 27%|██▋       | 1860/6779 [1:08:57<2:57:37,  2.17s/it]                                                       {'loss': 1.7615, 'learning_rate': 0.00033529230643029466, 'epoch': 0.27}
+ 27%|██▋       | 1860/6779 [1:08:57<2:57:37,  2.17s/it] 27%|██▋       | 1861/6779 [1:08:59<3:00:09,  2.20s/it]                                                       {'loss': 1.6733, 'learning_rate': 0.00033522300822725503, 'epoch': 0.27}
+ 27%|██▋       | 1861/6779 [1:08:59<3:00:09,  2.20s/it] 27%|██▋       | 1862/6779 [1:09:01<3:00:01,  2.20s/it]                                                       {'loss': 2.001, 'learning_rate': 0.0003351536801065677, 'epoch': 0.27}
+ 27%|██▋       | 1862/6779 [1:09:01<3:00:01,  2.20s/it] 27%|██▋       | 1863/6779 [1:09:03<3:02:04,  2.22s/it]                                                       {'loss': 1.8624, 'learning_rate': 0.0003350843220835714, 'epoch': 0.27}
+ 27%|██▋       | 1863/6779 [1:09:03<3:02:04,  2.22s/it] 27%|██▋       | 1864/6779 [1:09:05<3:00:05,  2.20s/it]                                                       {'loss': 1.6982, 'learning_rate': 0.00033501493417361115, 'epoch': 0.27}
+ 27%|██▋       | 1864/6779 [1:09:05<3:00:05,  2.20s/it] 28%|██▊       | 1865/6779 [1:09:08<3:00:41,  2.21s/it]                                                       {'loss': 1.7382, 'learning_rate': 0.00033494551639203895, 'epoch': 0.28}
+ 28%|██▊       | 1865/6779 [1:09:08<3:00:41,  2.21s/it] 28%|██▊       | 1866/6779 [1:09:10<2:56:22,  2.15s/it]                                                       {'loss': 1.8463, 'learning_rate': 0.0003348760687542132, 'epoch': 0.28}
+ 28%|██▊       | 1866/6779 [1:09:10<2:56:22,  2.15s/it] 28%|██▊       | 1867/6779 [1:09:12<2:59:11,  2.19s/it]                                                       {'loss': 1.874, 'learning_rate': 0.000334806591275499, 'epoch': 0.28}
+ 28%|██▊       | 1867/6779 [1:09:12<2:59:11,  2.19s/it] 28%|██▊       | 1868/6779 [1:09:14<2:59:36,  2.19s/it]                                                       {'loss': 1.6682, 'learning_rate': 0.000334737083971268, 'epoch': 0.28}
+ 28%|██▊       | 1868/6779 [1:09:14<2:59:36,  2.19s/it] 28%|██▊       | 1869/6779 [1:09:16<2:58:34,  2.18s/it]                                                       {'loss': 1.8209, 'learning_rate': 0.0003346675468568985, 'epoch': 0.28}
+ 28%|██▊       | 1869/6779 [1:09:16<2:58:34,  2.18s/it] 28%|██▊       | 1870/6779 [1:09:19<3:05:39,  2.27s/it]                                                       {'loss': 1.7793, 'learning_rate': 0.0003345979799477752, 'epoch': 0.28}
+ 28%|██▊       | 1870/6779 [1:09:19<3:05:39,  2.27s/it] 28%|██▊       | 1871/6779 [1:09:21<3:06:33,  2.28s/it]                                                       {'loss': 1.9424, 'learning_rate': 0.00033452838325928976, 'epoch': 0.28}
+ 28%|██▊       | 1871/6779 [1:09:21<3:06:33,  2.28s/it] 28%|██▊       | 1872/6779 [1:09:23<3:03:35,  2.24s/it]                                                       {'loss': 1.836, 'learning_rate': 0.0003344587568068401, 'epoch': 0.28}
+ 28%|██▊       | 1872/6779 [1:09:23<3:03:35,  2.24s/it] 28%|██▊       | 1873/6779 [1:09:26<3:04:58,  2.26s/it]                                                       {'loss': 1.7035, 'learning_rate': 0.0003343891006058309, 'epoch': 0.28}
+ 28%|██▊       | 1873/6779 [1:09:26<3:04:58,  2.26s/it] 28%|██▊       | 1874/6779 [1:09:28<3:00:45,  2.21s/it]                                                       {'loss': 1.7711, 'learning_rate': 0.0003343194146716734, 'epoch': 0.28}
+ 28%|██▊       | 1874/6779 [1:09:28<3:00:45,  2.21s/it] 28%|██▊       | 1875/6779 [1:09:30<2:57:46,  2.17s/it]                                                       {'loss': 1.558, 'learning_rate': 0.00033424969901978515, 'epoch': 0.28}
+ 28%|██▊       | 1875/6779 [1:09:30<2:57:46,  2.17s/it] 28%|██▊       | 1876/6779 [1:09:32<2:58:38,  2.19s/it]                                                       {'loss': 1.7025, 'learning_rate': 0.00033417995366559077, 'epoch': 0.28}
+ 28%|██▊       | 1876/6779 [1:09:32<2:58:38,  2.19s/it] 28%|██▊       | 1877/6779 [1:09:34<2:59:55,  2.20s/it]                                                       {'loss': 1.7982, 'learning_rate': 0.00033411017862452114, 'epoch': 0.28}
+ 28%|██▊       | 1877/6779 [1:09:34<2:59:55,  2.20s/it] 28%|██▊       | 1878/6779 [1:09:37<3:07:28,  2.30s/it]                                                       {'loss': 1.8778, 'learning_rate': 0.0003340403739120136, 'epoch': 0.28}
+ 28%|██▊       | 1878/6779 [1:09:37<3:07:28,  2.30s/it] 28%|██▊       | 1879/6779 [1:09:39<3:04:17,  2.26s/it]                                                       {'loss': 1.8173, 'learning_rate': 0.0003339705395435124, 'epoch': 0.28}
+ 28%|██▊       | 1879/6779 [1:09:39<3:04:17,  2.26s/it] 28%|██▊       | 1880/6779 [1:09:41<3:03:11,  2.24s/it]                                                       {'loss': 1.7381, 'learning_rate': 0.0003339006755344682, 'epoch': 0.28}
+ 28%|██▊       | 1880/6779 [1:09:41<3:03:11,  2.24s/it] 28%|██▊       | 1881/6779 [1:09:43<2:58:52,  2.19s/it]                                                       {'loss': 1.7856, 'learning_rate': 0.000333830781900338, 'epoch': 0.28}
+ 28%|██▊       | 1881/6779 [1:09:43<2:58:52,  2.19s/it] 28%|██▊       | 1882/6779 [1:09:45<2:55:19,  2.15s/it]                                                       {'loss': 1.5277, 'learning_rate': 0.0003337608586565856, 'epoch': 0.28}
+ 28%|██▊       | 1882/6779 [1:09:45<2:55:19,  2.15s/it] 28%|██▊       | 1883/6779 [1:09:47<2:55:38,  2.15s/it]                                                       {'loss': 1.8061, 'learning_rate': 0.0003336909058186814, 'epoch': 0.28}
+ 28%|██▊       | 1883/6779 [1:09:47<2:55:38,  2.15s/it] 28%|██▊       | 1884/6779 [1:09:50<2:56:42,  2.17s/it]                                                       {'loss': 1.7612, 'learning_rate': 0.0003336209234021021, 'epoch': 0.28}
+ 28%|██▊       | 1884/6779 [1:09:50<2:56:42,  2.17s/it] 28%|██▊       | 1885/6779 [1:09:52<2:58:58,  2.19s/it]                                                       {'loss': 1.6562, 'learning_rate': 0.0003335509114223311, 'epoch': 0.28}
+ 28%|██▊       | 1885/6779 [1:09:52<2:58:58,  2.19s/it] 28%|██▊       | 1886/6779 [1:09:54<3:04:16,  2.26s/it]                                                       {'loss': 1.7297, 'learning_rate': 0.00033348086989485833, 'epoch': 0.28}
+ 28%|██▊       | 1886/6779 [1:09:54<3:04:16,  2.26s/it] 28%|██▊       | 1887/6779 [1:09:57<3:06:22,  2.29s/it]                                                       {'loss': 1.583, 'learning_rate': 0.00033341079883518037, 'epoch': 0.28}
+ 28%|██▊       | 1887/6779 [1:09:57<3:06:22,  2.29s/it] 28%|██▊       | 1888/6779 [1:09:59<3:01:17,  2.22s/it]                                                       {'loss': 1.7747, 'learning_rate': 0.0003333406982588, 'epoch': 0.28}
+ 28%|██▊       | 1888/6779 [1:09:59<3:01:17,  2.22s/it] 28%|██▊       | 1889/6779 [1:10:01<2:57:54,  2.18s/it]                                                       {'loss': 1.8446, 'learning_rate': 0.0003332705681812269, 'epoch': 0.28}
+ 28%|██▊       | 1889/6779 [1:10:01<2:57:54,  2.18s/it] 28%|██▊       | 1890/6779 [1:10:03<2:57:01,  2.17s/it]                                                       {'loss': 1.8181, 'learning_rate': 0.0003332004086179771, 'epoch': 0.28}
+ 28%|██▊       | 1890/6779 [1:10:03<2:57:01,  2.17s/it] 28%|██▊       | 1891/6779 [1:10:05<2:58:12,  2.19s/it]                                                       {'loss': 1.9407, 'learning_rate': 0.0003331302195845731, 'epoch': 0.28}
+ 28%|██▊       | 1891/6779 [1:10:05<2:58:12,  2.19s/it] 28%|██▊       | 1892/6779 [1:10:07<2:56:56,  2.17s/it]                                                       {'loss': 1.6876, 'learning_rate': 0.00033306000109654407, 'epoch': 0.28}
+ 28%|██▊       | 1892/6779 [1:10:07<2:56:56,  2.17s/it] 28%|██▊       | 1893/6779 [1:10:10<2:57:29,  2.18s/it]                                                       {'loss': 1.5923, 'learning_rate': 0.0003329897531694256, 'epoch': 0.28}
+ 28%|██▊       | 1893/6779 [1:10:10<2:57:29,  2.18s/it] 28%|██▊       | 1894/6779 [1:10:12<2:54:46,  2.15s/it]                                                       {'loss': 1.8258, 'learning_rate': 0.0003329194758187598, 'epoch': 0.28}
+ 28%|██▊       | 1894/6779 [1:10:12<2:54:46,  2.15s/it] 28%|██▊       | 1895/6779 [1:10:14<2:56:46,  2.17s/it]                                                       {'loss': 1.7792, 'learning_rate': 0.0003328491690600953, 'epoch': 0.28}
+ 28%|██▊       | 1895/6779 [1:10:14<2:56:46,  2.17s/it] 28%|██▊       | 1896/6779 [1:10:16<2:56:45,  2.17s/it]                                                       {'loss': 1.5446, 'learning_rate': 0.0003327788329089872, 'epoch': 0.28}
+ 28%|██▊       | 1896/6779 [1:10:16<2:56:45,  2.17s/it] 28%|██▊       | 1897/6779 [1:10:18<2:59:49,  2.21s/it]                                                       {'loss': 1.922, 'learning_rate': 0.00033270846738099727, 'epoch': 0.28}
+ 28%|██▊       | 1897/6779 [1:10:18<2:59:49,  2.21s/it] 28%|██▊       | 1898/6779 [1:10:20<2:58:25,  2.19s/it]                                                       {'loss': 1.6979, 'learning_rate': 0.00033263807249169354, 'epoch': 0.28}
+ 28%|██▊       | 1898/6779 [1:10:20<2:58:25,  2.19s/it] 28%|██▊       | 1899/6779 [1:10:23<3:04:44,  2.27s/it]                                                       {'loss': 1.6817, 'learning_rate': 0.0003325676482566507, 'epoch': 0.28}
+ 28%|██▊       | 1899/6779 [1:10:23<3:04:44,  2.27s/it] 28%|██▊       | 1900/6779 [1:10:25<2:59:03,  2.20s/it]                                                       {'loss': 1.7273, 'learning_rate': 0.0003324971946914499, 'epoch': 0.28}
+ 28%|██▊       | 1900/6779 [1:10:25<2:59:03,  2.20s/it] 28%|██▊       | 1901/6779 [1:10:27<3:02:53,  2.25s/it]                                                       {'loss': 1.8522, 'learning_rate': 0.00033242671181167864, 'epoch': 0.28}
+ 28%|██▊       | 1901/6779 [1:10:27<3:02:53,  2.25s/it] 28%|██▊       | 1902/6779 [1:10:30<3:04:35,  2.27s/it]                                                       {'loss': 1.7962, 'learning_rate': 0.00033235619963293113, 'epoch': 0.28}
+ 28%|██▊       | 1902/6779 [1:10:30<3:04:35,  2.27s/it] 28%|██▊       | 1903/6779 [1:10:32<3:04:00,  2.26s/it]                                                       {'loss': 1.9089, 'learning_rate': 0.00033228565817080793, 'epoch': 0.28}
+ 28%|██▊       | 1903/6779 [1:10:32<3:04:00,  2.26s/it] 28%|██▊       | 1904/6779 [1:10:34<3:07:15,  2.30s/it]                                                       {'loss': 1.7465, 'learning_rate': 0.0003322150874409162, 'epoch': 0.28}
+ 28%|██▊       | 1904/6779 [1:10:34<3:07:15,  2.30s/it] 28%|██▊       | 1905/6779 [1:10:36<3:03:06,  2.25s/it]                                                       {'loss': 1.8121, 'learning_rate': 0.0003321444874588693, 'epoch': 0.28}
+ 28%|██▊       | 1905/6779 [1:10:36<3:03:06,  2.25s/it] 28%|██▊       | 1906/6779 [1:10:39<3:02:50,  2.25s/it]                                                       {'loss': 1.4758, 'learning_rate': 0.0003320738582402874, 'epoch': 0.28}
+ 28%|██▊       | 1906/6779 [1:10:39<3:02:50,  2.25s/it] 28%|██▊       | 1907/6779 [1:10:41<3:03:25,  2.26s/it]                                                       {'loss': 1.8918, 'learning_rate': 0.0003320031998007969, 'epoch': 0.28}
+ 28%|██▊       | 1907/6779 [1:10:41<3:03:25,  2.26s/it] 28%|██▊       | 1908/6779 [1:10:43<3:03:44,  2.26s/it]                                                       {'loss': 1.806, 'learning_rate': 0.0003319325121560308, 'epoch': 0.28}
+ 28%|██▊       | 1908/6779 [1:10:43<3:03:44,  2.26s/it] 28%|██▊       | 1909/6779 [1:10:45<2:57:35,  2.19s/it]                                                       {'loss': 1.7868, 'learning_rate': 0.0003318617953216285, 'epoch': 0.28}
+ 28%|██▊       | 1909/6779 [1:10:45<2:57:35,  2.19s/it] 28%|██▊       | 1910/6779 [1:10:48<3:04:59,  2.28s/it]                                                       {'loss': 1.7799, 'learning_rate': 0.00033179104931323585, 'epoch': 0.28}
+ 28%|██▊       | 1910/6779 [1:10:48<3:04:59,  2.28s/it] 28%|██▊       | 1911/6779 [1:10:50<3:03:49,  2.27s/it]                                                       {'loss': 1.7588, 'learning_rate': 0.0003317202741465051, 'epoch': 0.28}
+ 28%|██▊       | 1911/6779 [1:10:50<3:03:49,  2.27s/it] 28%|██▊       | 1912/6779 [1:10:52<3:04:37,  2.28s/it]                                                       {'loss': 1.6923, 'learning_rate': 0.0003316494698370952, 'epoch': 0.28}
+ 28%|██▊       | 1912/6779 [1:10:52<3:04:37,  2.28s/it] 28%|██▊       | 1913/6779 [1:10:55<3:07:09,  2.31s/it]                                                       {'loss': 1.7407, 'learning_rate': 0.0003315786364006713, 'epoch': 0.28}
+ 28%|██▊       | 1913/6779 [1:10:55<3:07:09,  2.31s/it] 28%|██▊       | 1914/6779 [1:10:57<3:06:30,  2.30s/it]                                                       {'loss': 1.8134, 'learning_rate': 0.0003315077738529049, 'epoch': 0.28}
+ 28%|██▊       | 1914/6779 [1:10:57<3:06:30,  2.30s/it] 28%|██▊       | 1915/6779 [1:10:59<3:02:42,  2.25s/it]                                                       {'loss': 1.781, 'learning_rate': 0.00033143688220947437, 'epoch': 0.28}
+ 28%|██▊       | 1915/6779 [1:10:59<3:02:42,  2.25s/it] 28%|██▊       | 1916/6779 [1:11:01<2:59:20,  2.21s/it]                                                       {'loss': 1.7402, 'learning_rate': 0.00033136596148606413, 'epoch': 0.28}
+ 28%|██▊       | 1916/6779 [1:11:01<2:59:20,  2.21s/it] 28%|██▊       | 1917/6779 [1:11:03<2:59:48,  2.22s/it]                                                       {'loss': 1.6339, 'learning_rate': 0.00033129501169836505, 'epoch': 0.28}
+ 28%|██▊       | 1917/6779 [1:11:03<2:59:48,  2.22s/it] 28%|██▊       | 1918/6779 [1:11:06<3:01:42,  2.24s/it]                                                       {'loss': 1.8861, 'learning_rate': 0.0003312240328620747, 'epoch': 0.28}
+ 28%|██▊       | 1918/6779 [1:11:06<3:01:42,  2.24s/it] 28%|██▊       | 1919/6779 [1:11:08<3:03:07,  2.26s/it]                                                       {'loss': 1.8319, 'learning_rate': 0.00033115302499289685, 'epoch': 0.28}
+ 28%|██▊       | 1919/6779 [1:11:08<3:03:07,  2.26s/it] 28%|██▊       | 1920/6779 [1:11:10<3:02:49,  2.26s/it]                                                       {'loss': 1.7066, 'learning_rate': 0.00033108198810654184, 'epoch': 0.28}
+ 28%|██▊       | 1920/6779 [1:11:10<3:02:49,  2.26s/it] 28%|██▊       | 1921/6779 [1:11:12<3:00:58,  2.24s/it]                                                       {'loss': 1.7625, 'learning_rate': 0.0003310109222187262, 'epoch': 0.28}
+ 28%|██▊       | 1921/6779 [1:11:12<3:00:58,  2.24s/it] 28%|██▊       | 1922/6779 [1:11:15<3:04:05,  2.27s/it]                                                       {'loss': 1.6236, 'learning_rate': 0.00033093982734517315, 'epoch': 0.28}
+ 28%|██▊       | 1922/6779 [1:11:15<3:04:05,  2.27s/it] 28%|██▊       | 1923/6779 [1:11:17<3:02:14,  2.25s/it]                                                       {'loss': 1.5948, 'learning_rate': 0.00033086870350161206, 'epoch': 0.28}
+ 28%|██▊       | 1923/6779 [1:11:17<3:02:14,  2.25s/it] 28%|██▊       | 1924/6779 [1:11:19<3:07:16,  2.31s/it]                                                       {'loss': 1.762, 'learning_rate': 0.00033079755070377904, 'epoch': 0.28}
+ 28%|██▊       | 1924/6779 [1:11:19<3:07:16,  2.31s/it] 28%|██▊       | 1925/6779 [1:11:22<3:10:12,  2.35s/it]                                                       {'loss': 1.7229, 'learning_rate': 0.0003307263689674163, 'epoch': 0.28}
+ 28%|██▊       | 1925/6779 [1:11:22<3:10:12,  2.35s/it] 28%|██▊       | 1926/6779 [1:11:24<3:05:17,  2.29s/it]                                                       {'loss': 1.7489, 'learning_rate': 0.00033065515830827254, 'epoch': 0.28}
+ 28%|██▊       | 1926/6779 [1:11:24<3:05:17,  2.29s/it] 28%|██▊       | 1927/6779 [1:11:26<3:06:22,  2.30s/it]                                                       {'loss': 1.9086, 'learning_rate': 0.00033058391874210287, 'epoch': 0.28}
+ 28%|██▊       | 1927/6779 [1:11:26<3:06:22,  2.30s/it] 28%|██▊       | 1928/6779 [1:11:28<3:01:36,  2.25s/it]                                                       {'loss': 1.7961, 'learning_rate': 0.0003305126502846689, 'epoch': 0.28}
+ 28%|██▊       | 1928/6779 [1:11:28<3:01:36,  2.25s/it] 28%|██▊       | 1929/6779 [1:11:31<3:01:10,  2.24s/it]                                                       {'loss': 1.6996, 'learning_rate': 0.0003304413529517386, 'epoch': 0.28}
+ 28%|██▊       | 1929/6779 [1:11:31<3:01:10,  2.24s/it] 28%|██▊       | 1930/6779 [1:11:33<3:01:52,  2.25s/it]                                                       {'loss': 1.775, 'learning_rate': 0.00033037002675908607, 'epoch': 0.28}
+ 28%|██▊       | 1930/6779 [1:11:33<3:01:52,  2.25s/it] 28%|██▊       | 1931/6779 [1:11:35<3:04:40,  2.29s/it]                                                       {'loss': 1.7898, 'learning_rate': 0.00033029867172249216, 'epoch': 0.28}
+ 28%|██▊       | 1931/6779 [1:11:35<3:04:40,  2.29s/it] 28%|██▊       | 1932/6779 [1:11:38<3:04:05,  2.28s/it]                                                       {'loss': 1.6773, 'learning_rate': 0.0003302272878577438, 'epoch': 0.28}
+ 28%|██▊       | 1932/6779 [1:11:38<3:04:05,  2.28s/it] 29%|██▊       | 1933/6779 [1:11:40<3:02:05,  2.25s/it]                                                       {'loss': 1.6026, 'learning_rate': 0.0003301558751806346, 'epoch': 0.29}
+ 29%|██▊       | 1933/6779 [1:11:40<3:02:05,  2.25s/it] 29%|██▊       | 1934/6779 [1:11:42<3:05:49,  2.30s/it]                                                       {'loss': 1.6076, 'learning_rate': 0.0003300844337069643, 'epoch': 0.29}
+ 29%|██▊       | 1934/6779 [1:11:42<3:05:49,  2.30s/it] 29%|██▊       | 1935/6779 [1:11:44<2:59:27,  2.22s/it]                                                       {'loss': 1.822, 'learning_rate': 0.0003300129634525391, 'epoch': 0.29}
+ 29%|██▊       | 1935/6779 [1:11:44<2:59:27,  2.22s/it] 29%|██▊       | 1936/6779 [1:11:47<3:13:45,  2.40s/it]                                                       {'loss': 1.7782, 'learning_rate': 0.0003299414644331715, 'epoch': 0.29}
+ 29%|██▊       | 1936/6779 [1:11:47<3:13:45,  2.40s/it] 29%|██▊       | 1937/6779 [1:11:49<3:06:23,  2.31s/it]                                                       {'loss': 1.7169, 'learning_rate': 0.0003298699366646805, 'epoch': 0.29}
+ 29%|██▊       | 1937/6779 [1:11:49<3:06:23,  2.31s/it] 29%|██▊       | 1938/6779 [1:11:52<3:10:35,  2.36s/it]                                                       {'loss': 1.7703, 'learning_rate': 0.0003297983801628913, 'epoch': 0.29}
+ 29%|██▊       | 1938/6779 [1:11:52<3:10:35,  2.36s/it] 29%|██▊       | 1939/6779 [1:11:54<3:03:04,  2.27s/it]                                                       {'loss': 1.8547, 'learning_rate': 0.0003297267949436357, 'epoch': 0.29}
+ 29%|██▊       | 1939/6779 [1:11:54<3:03:04,  2.27s/it] 29%|██▊       | 1940/6779 [1:11:56<3:11:32,  2.37s/it]                                                       {'loss': 1.6644, 'learning_rate': 0.00032965518102275157, 'epoch': 0.29}
+ 29%|██▊       | 1940/6779 [1:11:56<3:11:32,  2.37s/it] 29%|██▊       | 1941/6779 [1:11:59<3:06:46,  2.32s/it]                                                       {'loss': 1.7283, 'learning_rate': 0.00032958353841608325, 'epoch': 0.29}
+ 29%|██▊       | 1941/6779 [1:11:59<3:06:46,  2.32s/it] 29%|██▊       | 1942/6779 [1:12:01<3:09:27,  2.35s/it]                                                       {'loss': 1.7802, 'learning_rate': 0.0003295118671394814, 'epoch': 0.29}
+ 29%|██▊       | 1942/6779 [1:12:01<3:09:27,  2.35s/it] 29%|██▊       | 1943/6779 [1:12:03<3:03:23,  2.28s/it]                                                       {'loss': 1.791, 'learning_rate': 0.00032944016720880324, 'epoch': 0.29}
+ 29%|██▊       | 1943/6779 [1:12:03<3:03:23,  2.28s/it] 29%|██▊       | 1944/6779 [1:12:05<3:04:31,  2.29s/it]                                                       {'loss': 1.6316, 'learning_rate': 0.00032936843863991196, 'epoch': 0.29}
+ 29%|██▊       | 1944/6779 [1:12:05<3:04:31,  2.29s/it] 29%|██▊       | 1945/6779 [1:12:08<3:02:03,  2.26s/it]                                                       {'loss': 1.7226, 'learning_rate': 0.00032929668144867735, 'epoch': 0.29}
+ 29%|██▊       | 1945/6779 [1:12:08<3:02:03,  2.26s/it] 29%|██▊       | 1946/6779 [1:12:10<3:08:54,  2.35s/it]                                                       {'loss': 1.7702, 'learning_rate': 0.0003292248956509754, 'epoch': 0.29}
+ 29%|██▊       | 1946/6779 [1:12:10<3:08:54,  2.35s/it] 29%|██▊       | 1947/6779 [1:12:13<3:14:37,  2.42s/it]                                                       {'loss': 1.5853, 'learning_rate': 0.0003291530812626886, 'epoch': 0.29}
+ 29%|██▊       | 1947/6779 [1:12:13<3:14:37,  2.42s/it] 29%|██▊       | 1948/6779 [1:12:15<3:09:20,  2.35s/it]                                                       {'loss': 1.6864, 'learning_rate': 0.00032908123829970555, 'epoch': 0.29}
+ 29%|██▊       | 1948/6779 [1:12:15<3:09:20,  2.35s/it] 29%|██▉       | 1949/6779 [1:12:17<3:06:00,  2.31s/it]                                                       {'loss': 1.7009, 'learning_rate': 0.00032900936677792125, 'epoch': 0.29}
+ 29%|██▉       | 1949/6779 [1:12:17<3:06:00,  2.31s/it] 29%|██▉       | 1950/6779 [1:12:19<2:59:08,  2.23s/it]                                                       {'loss': 1.8318, 'learning_rate': 0.000328937466713237, 'epoch': 0.29}
+ 29%|██▉       | 1950/6779 [1:12:19<2:59:08,  2.23s/it] 29%|██▉       | 1951/6779 [1:12:21<3:01:59,  2.26s/it]                                                       {'loss': 1.7907, 'learning_rate': 0.00032886553812156073, 'epoch': 0.29}
+ 29%|██▉       | 1951/6779 [1:12:21<3:01:59,  2.26s/it] 29%|██▉       | 1952/6779 [1:12:24<2:59:44,  2.23s/it]                                                       {'loss': 1.7246, 'learning_rate': 0.00032879358101880606, 'epoch': 0.29}
+ 29%|██▉       | 1952/6779 [1:12:24<2:59:44,  2.23s/it] 29%|██▉       | 1953/6779 [1:12:26<2:54:16,  2.17s/it]                                                       {'loss': 1.8426, 'learning_rate': 0.0003287215954208934, 'epoch': 0.29}
+ 29%|██▉       | 1953/6779 [1:12:26<2:54:16,  2.17s/it] 29%|██▉       | 1954/6779 [1:12:28<2:57:58,  2.21s/it]                                                       {'loss': 1.8673, 'learning_rate': 0.00032864958134374943, 'epoch': 0.29}
+ 29%|██▉       | 1954/6779 [1:12:28<2:57:58,  2.21s/it] 29%|██▉       | 1955/6779 [1:12:30<2:55:16,  2.18s/it]                                                       {'loss': 1.8725, 'learning_rate': 0.0003285775388033069, 'epoch': 0.29}
+ 29%|██▉       | 1955/6779 [1:12:30<2:55:16,  2.18s/it] 29%|██▉       | 1956/6779 [1:12:32<2:53:31,  2.16s/it]                                                       {'loss': 1.8212, 'learning_rate': 0.000328505467815505, 'epoch': 0.29}
+ 29%|██▉       | 1956/6779 [1:12:32<2:53:31,  2.16s/it] 29%|██▉       | 1957/6779 [1:12:34<2:55:02,  2.18s/it]                                                       {'loss': 1.7711, 'learning_rate': 0.00032843336839628927, 'epoch': 0.29}
+ 29%|██▉       | 1957/6779 [1:12:34<2:55:02,  2.18s/it] 29%|██▉       | 1958/6779 [1:12:36<2:49:34,  2.11s/it]                                                       {'loss': 1.6974, 'learning_rate': 0.00032836124056161137, 'epoch': 0.29}
+ 29%|██▉       | 1958/6779 [1:12:36<2:49:34,  2.11s/it] 29%|██▉       | 1959/6779 [1:12:39<2:55:27,  2.18s/it]                                                       {'loss': 1.8601, 'learning_rate': 0.0003282890843274294, 'epoch': 0.29}
+ 29%|██▉       | 1959/6779 [1:12:39<2:55:27,  2.18s/it] 29%|██▉       | 1960/6779 [1:12:41<2:56:19,  2.20s/it]                                                       {'loss': 1.706, 'learning_rate': 0.00032821689970970777, 'epoch': 0.29}
+ 29%|██▉       | 1960/6779 [1:12:41<2:56:19,  2.20s/it] 29%|██▉       | 1961/6779 [1:12:43<2:55:39,  2.19s/it]                                                       {'loss': 1.5503, 'learning_rate': 0.00032814468672441696, 'epoch': 0.29}
+ 29%|██▉       | 1961/6779 [1:12:43<2:55:39,  2.19s/it] 29%|██▉       | 1962/6779 [1:12:45<2:54:40,  2.18s/it]                                                       {'loss': 1.7486, 'learning_rate': 0.0003280724453875339, 'epoch': 0.29}
+ 29%|██▉       | 1962/6779 [1:12:45<2:54:40,  2.18s/it] 29%|██▉       | 1963/6779 [1:12:48<2:57:00,  2.21s/it]                                                       {'loss': 1.7722, 'learning_rate': 0.00032800017571504175, 'epoch': 0.29}
+ 29%|██▉       | 1963/6779 [1:12:48<2:57:00,  2.21s/it] 29%|██▉       | 1964/6779 [1:12:50<2:56:05,  2.19s/it]                                                       {'loss': 1.6901, 'learning_rate': 0.0003279278777229299, 'epoch': 0.29}
+ 29%|██▉       | 1964/6779 [1:12:50<2:56:05,  2.19s/it] 29%|██▉       | 1965/6779 [1:12:52<2:57:23,  2.21s/it]                                                       {'loss': 1.8429, 'learning_rate': 0.0003278555514271942, 'epoch': 0.29}
+ 29%|██▉       | 1965/6779 [1:12:52<2:57:23,  2.21s/it] 29%|██▉       | 1966/6779 [1:12:54<2:52:12,  2.15s/it]                                                       {'loss': 1.8266, 'learning_rate': 0.0003277831968438364, 'epoch': 0.29}
+ 29%|██▉       | 1966/6779 [1:12:54<2:52:12,  2.15s/it] 29%|██▉       | 1967/6779 [1:12:56<2:59:07,  2.23s/it]                                                       {'loss': 1.5982, 'learning_rate': 0.00032771081398886486, 'epoch': 0.29}
+ 29%|██▉       | 1967/6779 [1:12:56<2:59:07,  2.23s/it] 29%|██▉       | 1968/6779 [1:12:59<2:58:20,  2.22s/it]                                                       {'loss': 1.7823, 'learning_rate': 0.000327638402878294, 'epoch': 0.29}
+ 29%|██▉       | 1968/6779 [1:12:59<2:58:20,  2.22s/it] 29%|██▉       | 1969/6779 [1:13:01<3:01:21,  2.26s/it]                                                       {'loss': 1.7353, 'learning_rate': 0.00032756596352814457, 'epoch': 0.29}
+ 29%|██▉       | 1969/6779 [1:13:01<3:01:21,  2.26s/it] 29%|██▉       | 1970/6779 [1:13:03<2:57:14,  2.21s/it]                                                       {'loss': 1.7075, 'learning_rate': 0.0003274934959544434, 'epoch': 0.29}
+ 29%|██▉       | 1970/6779 [1:13:03<2:57:14,  2.21s/it] 29%|██▉       | 1971/6779 [1:13:05<2:55:15,  2.19s/it]                                                       {'loss': 1.7154, 'learning_rate': 0.00032742100017322395, 'epoch': 0.29}
+ 29%|██▉       | 1971/6779 [1:13:05<2:55:15,  2.19s/it] 29%|██▉       | 1972/6779 [1:13:07<2:55:00,  2.18s/it]                                                       {'loss': 1.647, 'learning_rate': 0.00032734847620052545, 'epoch': 0.29}
+ 29%|██▉       | 1972/6779 [1:13:07<2:55:00,  2.18s/it] 29%|██▉       | 1973/6779 [1:13:09<2:52:39,  2.16s/it]                                                       {'loss': 1.7006, 'learning_rate': 0.0003272759240523937, 'epoch': 0.29}
+ 29%|██▉       | 1973/6779 [1:13:09<2:52:39,  2.16s/it] 29%|██▉       | 1974/6779 [1:13:12<2:52:36,  2.16s/it]                                                       {'loss': 1.8209, 'learning_rate': 0.0003272033437448806, 'epoch': 0.29}
+ 29%|██▉       | 1974/6779 [1:13:12<2:52:36,  2.16s/it] 29%|██▉       | 1975/6779 [1:13:14<2:49:39,  2.12s/it]                                                       {'loss': 1.6779, 'learning_rate': 0.0003271307352940443, 'epoch': 0.29}
+ 29%|██▉       | 1975/6779 [1:13:14<2:49:39,  2.12s/it] 29%|██▉       | 1976/6779 [1:13:16<2:53:33,  2.17s/it]                                                       {'loss': 1.7442, 'learning_rate': 0.0003270580987159492, 'epoch': 0.29}
+ 29%|██▉       | 1976/6779 [1:13:16<2:53:33,  2.17s/it] 29%|██▉       | 1977/6779 [1:13:18<2:56:21,  2.20s/it]                                                       {'loss': 1.6925, 'learning_rate': 0.0003269854340266659, 'epoch': 0.29}
+ 29%|██▉       | 1977/6779 [1:13:18<2:56:21,  2.20s/it] 29%|██▉       | 1978/6779 [1:13:20<2:54:14,  2.18s/it]                                                       {'loss': 1.8078, 'learning_rate': 0.00032691274124227123, 'epoch': 0.29}
+ 29%|██▉       | 1978/6779 [1:13:20<2:54:14,  2.18s/it] 29%|██▉       | 1979/6779 [1:13:23<2:55:07,  2.19s/it]                                                       {'loss': 1.8137, 'learning_rate': 0.0003268400203788482, 'epoch': 0.29}
+ 29%|██▉       | 1979/6779 [1:13:23<2:55:07,  2.19s/it] 29%|██▉       | 1980/6779 [1:13:25<2:58:15,  2.23s/it]                                                       {'loss': 1.8213, 'learning_rate': 0.0003267672714524861, 'epoch': 0.29}
+ 29%|██▉       | 1980/6779 [1:13:25<2:58:15,  2.23s/it] 29%|██▉       | 1981/6779 [1:13:27<3:01:57,  2.28s/it]                                                       {'loss': 1.8623, 'learning_rate': 0.0003266944944792803, 'epoch': 0.29}
+ 29%|██▉       | 1981/6779 [1:13:27<3:01:57,  2.28s/it] 29%|██▉       | 1982/6779 [1:13:29<2:59:36,  2.25s/it]                                                       {'loss': 1.7186, 'learning_rate': 0.00032662168947533265, 'epoch': 0.29}
+ 29%|██▉       | 1982/6779 [1:13:29<2:59:36,  2.25s/it] 29%|██▉       | 1983/6779 [1:13:32<2:59:45,  2.25s/it]                                                       {'loss': 1.8255, 'learning_rate': 0.00032654885645675086, 'epoch': 0.29}
+ 29%|██▉       | 1983/6779 [1:13:32<2:59:45,  2.25s/it] 29%|██▉       | 1984/6779 [1:13:34<2:54:55,  2.19s/it]                                                       {'loss': 1.673, 'learning_rate': 0.0003264759954396491, 'epoch': 0.29}
+ 29%|██▉       | 1984/6779 [1:13:34<2:54:55,  2.19s/it] 29%|██▉       | 1985/6779 [1:13:36<2:52:11,  2.16s/it]                                                       {'loss': 1.6989, 'learning_rate': 0.0003264031064401475, 'epoch': 0.29}
+ 29%|██▉       | 1985/6779 [1:13:36<2:52:11,  2.16s/it] 29%|██▉       | 1986/6779 [1:13:38<2:49:09,  2.12s/it]                                                       {'loss': 1.7535, 'learning_rate': 0.00032633018947437266, 'epoch': 0.29}
+ 29%|██▉       | 1986/6779 [1:13:38<2:49:09,  2.12s/it] 29%|██▉       | 1987/6779 [1:13:40<2:47:09,  2.09s/it]                                                       {'loss': 1.8201, 'learning_rate': 0.0003262572445584571, 'epoch': 0.29}
+ 29%|██▉       | 1987/6779 [1:13:40<2:47:09,  2.09s/it] 29%|██▉       | 1988/6779 [1:13:42<2:49:04,  2.12s/it]                                                       {'loss': 1.7521, 'learning_rate': 0.0003261842717085397, 'epoch': 0.29}
+ 29%|██▉       | 1988/6779 [1:13:42<2:49:04,  2.12s/it] 29%|██▉       | 1989/6779 [1:13:45<3:00:48,  2.26s/it]                                                       {'loss': 1.7498, 'learning_rate': 0.0003261112709407655, 'epoch': 0.29}
+ 29%|██▉       | 1989/6779 [1:13:45<3:00:48,  2.26s/it] 29%|██▉       | 1990/6779 [1:13:47<2:59:05,  2.24s/it]                                                       {'loss': 1.6727, 'learning_rate': 0.00032603824227128556, 'epoch': 0.29}
+ 29%|██▉       | 1990/6779 [1:13:47<2:59:05,  2.24s/it] 29%|██▉       | 1991/6779 [1:13:49<2:58:08,  2.23s/it]                                                       {'loss': 1.9731, 'learning_rate': 0.0003259651857162574, 'epoch': 0.29}
+ 29%|██▉       | 1991/6779 [1:13:49<2:58:08,  2.23s/it] 29%|██▉       | 1992/6779 [1:13:51<2:54:46,  2.19s/it]                                                       {'loss': 1.8877, 'learning_rate': 0.0003258921012918444, 'epoch': 0.29}
+ 29%|██▉       | 1992/6779 [1:13:51<2:54:46,  2.19s/it] 29%|██▉       | 1993/6779 [1:13:53<2:53:46,  2.18s/it]                                                       {'loss': 1.7571, 'learning_rate': 0.00032581898901421635, 'epoch': 0.29}
+ 29%|██▉       | 1993/6779 [1:13:53<2:53:46,  2.18s/it] 29%|██▉       | 1994/6779 [1:13:55<2:53:21,  2.17s/it]                                                       {'loss': 1.7152, 'learning_rate': 0.0003257458488995491, 'epoch': 0.29}
+ 29%|██▉       | 1994/6779 [1:13:55<2:53:21,  2.17s/it] 29%|██▉       | 1995/6779 [1:13:58<2:53:01,  2.17s/it]                                                       {'loss': 1.8582, 'learning_rate': 0.00032567268096402453, 'epoch': 0.29}
+ 29%|██▉       | 1995/6779 [1:13:58<2:53:01,  2.17s/it] 29%|██▉       | 1996/6779 [1:14:00<2:53:36,  2.18s/it]                                                       {'loss': 1.8215, 'learning_rate': 0.00032559948522383093, 'epoch': 0.29}
+ 29%|██▉       | 1996/6779 [1:14:00<2:53:36,  2.18s/it] 29%|██▉       | 1997/6779 [1:14:02<3:01:07,  2.27s/it]                                                       {'loss': 1.7961, 'learning_rate': 0.0003255262616951626, 'epoch': 0.29}
+ 29%|██▉       | 1997/6779 [1:14:02<3:01:07,  2.27s/it] 29%|██▉       | 1998/6779 [1:14:05<3:00:21,  2.26s/it]                                                       {'loss': 1.7723, 'learning_rate': 0.00032545301039422, 'epoch': 0.29}
+ 29%|██▉       | 1998/6779 [1:14:05<3:00:21,  2.26s/it] 29%|██▉       | 1999/6779 [1:14:07<2:59:42,  2.26s/it]                                                       {'loss': 1.8633, 'learning_rate': 0.00032537973133720964, 'epoch': 0.29}
+ 29%|██▉       | 1999/6779 [1:14:07<2:59:42,  2.26s/it] 30%|██▉       | 2000/6779 [1:14:09<3:02:02,  2.29s/it]                                                       {'loss': 1.664, 'learning_rate': 0.0003253064245403445, 'epoch': 0.3}
+ 30%|██▉       | 2000/6779 [1:14:09<3:02:02,  2.29s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+ 30%|██▉       | 2001/6779 [1:14:12<3:10:45,  2.40s/it]                                                       {'loss': 1.7441, 'learning_rate': 0.0003252330900198432, 'epoch': 0.3}
+ 30%|██▉       | 2001/6779 [1:14:12<3:10:45,  2.40s/it] 30%|██▉       | 2002/6779 [1:14:14<3:05:08,  2.33s/it]                                                       {'loss': 1.8134, 'learning_rate': 0.00032515972779193094, 'epoch': 0.3}
+ 30%|██▉       | 2002/6779 [1:14:14<3:05:08,  2.33s/it] 30%|██▉       | 2003/6779 [1:14:16<3:00:06,  2.26s/it]                                                       {'loss': 1.6695, 'learning_rate': 0.0003250863378728388, 'epoch': 0.3}
+ 30%|██▉       | 2003/6779 [1:14:16<3:00:06,  2.26s/it] 30%|██▉       | 2004/6779 [1:14:18<3:01:09,  2.28s/it]                                                       {'loss': 1.6399, 'learning_rate': 0.00032501292027880413, 'epoch': 0.3}
+ 30%|██▉       | 2004/6779 [1:14:18<3:01:09,  2.28s/it] 30%|██▉       | 2005/6779 [1:14:21<3:01:02,  2.28s/it]                                                       {'loss': 1.7118, 'learning_rate': 0.0003249394750260703, 'epoch': 0.3}
+ 30%|██▉       | 2005/6779 [1:14:21<3:01:02,  2.28s/it] 30%|██▉       | 2006/6779 [1:14:23<3:01:54,  2.29s/it]                                                       {'loss': 1.6273, 'learning_rate': 0.00032486600213088677, 'epoch': 0.3}
+ 30%|██▉       | 2006/6779 [1:14:23<3:01:54,  2.29s/it] 30%|██▉       | 2007/6779 [1:14:25<2:58:56,  2.25s/it]                                                       {'loss': 1.8432, 'learning_rate': 0.00032479250160950926, 'epoch': 0.3}
+ 30%|██▉       | 2007/6779 [1:14:25<2:58:56,  2.25s/it] 30%|██▉       | 2008/6779 [1:14:27<2:55:41,  2.21s/it]                                                       {'loss': 1.6697, 'learning_rate': 0.00032471897347819946, 'epoch': 0.3}
+ 30%|██▉       | 2008/6779 [1:14:27<2:55:41,  2.21s/it] 30%|██▉       | 2009/6779 [1:14:31<3:25:02,  2.58s/it]                                                       {'loss': 1.7412, 'learning_rate': 0.0003246454177532253, 'epoch': 0.3}
+ 30%|██▉       | 2009/6779 [1:14:31<3:25:02,  2.58s/it] 30%|██▉       | 2010/6779 [1:14:33<3:14:47,  2.45s/it]                                                       {'loss': 1.5673, 'learning_rate': 0.00032457183445086063, 'epoch': 0.3}
+ 30%|██▉       | 2010/6779 [1:14:33<3:14:47,  2.45s/it] 30%|██▉       | 2011/6779 [1:14:35<3:05:55,  2.34s/it]                                                       {'loss': 1.5494, 'learning_rate': 0.0003244982235873856, 'epoch': 0.3}
+ 30%|██▉       | 2011/6779 [1:14:35<3:05:55,  2.34s/it] 30%|██▉       | 2012/6779 [1:14:37<2:59:52,  2.26s/it]                                                       {'loss': 1.8153, 'learning_rate': 0.0003244245851790864, 'epoch': 0.3}
+ 30%|██▉       | 2012/6779 [1:14:37<2:59:52,  2.26s/it] 30%|██▉       | 2013/6779 [1:14:39<2:52:59,  2.18s/it]                                                       {'loss': 1.7135, 'learning_rate': 0.0003243509192422551, 'epoch': 0.3}
+ 30%|██▉       | 2013/6779 [1:14:39<2:52:59,  2.18s/it] 30%|██▉       | 2014/6779 [1:14:41<2:52:27,  2.17s/it]                                                       {'loss': 1.7113, 'learning_rate': 0.0003242772257931904, 'epoch': 0.3}
+ 30%|██▉       | 2014/6779 [1:14:41<2:52:27,  2.17s/it] 30%|██▉       | 2015/6779 [1:14:43<2:54:57,  2.20s/it]                                                       {'loss': 1.8381, 'learning_rate': 0.0003242035048481964, 'epoch': 0.3}
+ 30%|██▉       | 2015/6779 [1:14:43<2:54:57,  2.20s/it] 30%|██▉       | 2016/6779 [1:14:46<2:54:46,  2.20s/it]                                                       {'loss': 1.7193, 'learning_rate': 0.00032412975642358375, 'epoch': 0.3}
+ 30%|██▉       | 2016/6779 [1:14:46<2:54:46,  2.20s/it] 30%|██▉       | 2017/6779 [1:14:48<2:53:11,  2.18s/it]                                                       {'loss': 1.7164, 'learning_rate': 0.000324055980535669, 'epoch': 0.3}
+ 30%|██▉       | 2017/6779 [1:14:48<2:53:11,  2.18s/it] 30%|██▉       | 2018/6779 [1:14:50<2:53:17,  2.18s/it]                                                       {'loss': 1.6114, 'learning_rate': 0.00032398217720077494, 'epoch': 0.3}
+ 30%|██▉       | 2018/6779 [1:14:50<2:53:17,  2.18s/it] 30%|██▉       | 2019/6779 [1:14:52<2:52:55,  2.18s/it]                                                       {'loss': 1.6986, 'learning_rate': 0.00032390834643523025, 'epoch': 0.3}
+ 30%|██▉       | 2019/6779 [1:14:52<2:52:55,  2.18s/it] 30%|██▉       | 2020/6779 [1:14:54<2:49:45,  2.14s/it]                                                       {'loss': 1.7609, 'learning_rate': 0.0003238344882553697, 'epoch': 0.3}
+ 30%|██▉       | 2020/6779 [1:14:54<2:49:45,  2.14s/it] 30%|██▉       | 2021/6779 [1:14:56<2:51:21,  2.16s/it]                                                       {'loss': 1.6817, 'learning_rate': 0.0003237606026775341, 'epoch': 0.3}
+ 30%|██▉       | 2021/6779 [1:14:56<2:51:21,  2.16s/it] 30%|██▉       | 2022/6779 [1:14:59<2:53:40,  2.19s/it]                                                       {'loss': 1.6873, 'learning_rate': 0.0003236866897180706, 'epoch': 0.3}
+ 30%|██▉       | 2022/6779 [1:14:59<2:53:40,  2.19s/it] 30%|██▉       | 2023/6779 [1:15:01<2:58:34,  2.25s/it]                                                       {'loss': 1.7534, 'learning_rate': 0.0003236127493933321, 'epoch': 0.3}
+ 30%|██▉       | 2023/6779 [1:15:01<2:58:34,  2.25s/it] 30%|██▉       | 2024/6779 [1:15:03<2:58:48,  2.26s/it]                                                       {'loss': 1.8136, 'learning_rate': 0.0003235387817196776, 'epoch': 0.3}
+ 30%|██▉       | 2024/6779 [1:15:03<2:58:48,  2.26s/it] 30%|██▉       | 2025/6779 [1:15:06<2:59:14,  2.26s/it]                                                       {'loss': 1.7058, 'learning_rate': 0.0003234647867134723, 'epoch': 0.3}
+ 30%|██▉       | 2025/6779 [1:15:06<2:59:14,  2.26s/it] 30%|██▉       | 2026/6779 [1:15:08<2:54:25,  2.20s/it]                                                       {'loss': 1.8149, 'learning_rate': 0.00032339076439108727, 'epoch': 0.3}
+ 30%|██▉       | 2026/6779 [1:15:08<2:54:25,  2.20s/it] 30%|██▉       | 2027/6779 [1:15:10<2:50:11,  2.15s/it]                                                       {'loss': 1.8045, 'learning_rate': 0.00032331671476889975, 'epoch': 0.3}
+ 30%|██▉       | 2027/6779 [1:15:10<2:50:11,  2.15s/it] 30%|██▉       | 2028/6779 [1:15:12<2:52:33,  2.18s/it]                                                       {'loss': 1.7454, 'learning_rate': 0.000323242637863293, 'epoch': 0.3}
+ 30%|██▉       | 2028/6779 [1:15:12<2:52:33,  2.18s/it] 30%|██▉       | 2029/6779 [1:15:14<2:55:15,  2.21s/it]                                                       {'loss': 1.7279, 'learning_rate': 0.00032316853369065626, 'epoch': 0.3}
+ 30%|██▉       | 2029/6779 [1:15:14<2:55:15,  2.21s/it] 30%|██▉       | 2030/6779 [1:15:16<2:57:21,  2.24s/it]                                                       {'loss': 1.6452, 'learning_rate': 0.0003230944022673848, 'epoch': 0.3}
+ 30%|██▉       | 2030/6779 [1:15:16<2:57:21,  2.24s/it] 30%|██▉       | 2031/6779 [1:15:19<2:56:40,  2.23s/it]                                                       {'loss': 1.7889, 'learning_rate': 0.00032302024360988, 'epoch': 0.3}
+ 30%|██▉       | 2031/6779 [1:15:19<2:56:40,  2.23s/it] 30%|██▉       | 2032/6779 [1:15:21<2:52:36,  2.18s/it]                                                       {'loss': 1.9362, 'learning_rate': 0.0003229460577345493, 'epoch': 0.3}
+ 30%|██▉       | 2032/6779 [1:15:21<2:52:36,  2.18s/it] 30%|██▉       | 2033/6779 [1:15:23<2:50:27,  2.15s/it]                                                       {'loss': 1.7183, 'learning_rate': 0.0003228718446578059, 'epoch': 0.3}
+ 30%|██▉       | 2033/6779 [1:15:23<2:50:27,  2.15s/it] 30%|███       | 2034/6779 [1:15:25<2:50:07,  2.15s/it]                                                       {'loss': 1.7026, 'learning_rate': 0.0003227976043960693, 'epoch': 0.3}
+ 30%|███       | 2034/6779 [1:15:25<2:50:07,  2.15s/it] 30%|███       | 2035/6779 [1:15:27<2:48:09,  2.13s/it]                                                       {'loss': 1.7087, 'learning_rate': 0.00032272333696576494, 'epoch': 0.3}
+ 30%|███       | 2035/6779 [1:15:27<2:48:09,  2.13s/it] 30%|███       | 2036/6779 [1:15:29<2:49:42,  2.15s/it]                                                       {'loss': 1.7274, 'learning_rate': 0.0003226490423833242, 'epoch': 0.3}
+ 30%|███       | 2036/6779 [1:15:29<2:49:42,  2.15s/it] 30%|███       | 2037/6779 [1:15:31<2:50:37,  2.16s/it]                                                       {'loss': 1.9432, 'learning_rate': 0.00032257472066518454, 'epoch': 0.3}
+ 30%|███       | 2037/6779 [1:15:31<2:50:37,  2.16s/it] 30%|███       | 2038/6779 [1:15:34<2:52:36,  2.18s/it]                                                       {'loss': 1.8579, 'learning_rate': 0.0003225003718277894, 'epoch': 0.3}
+ 30%|███       | 2038/6779 [1:15:34<2:52:36,  2.18s/it] 30%|███       | 2039/6779 [1:15:36<2:52:15,  2.18s/it]                                                       {'loss': 1.6696, 'learning_rate': 0.0003224259958875882, 'epoch': 0.3}
+ 30%|███       | 2039/6779 [1:15:36<2:52:15,  2.18s/it] 30%|███       | 2040/6779 [1:15:38<2:49:19,  2.14s/it]                                                       {'loss': 1.5806, 'learning_rate': 0.0003223515928610363, 'epoch': 0.3}
+ 30%|███       | 2040/6779 [1:15:38<2:49:19,  2.14s/it] 30%|███       | 2041/6779 [1:15:40<2:49:21,  2.14s/it]                                                       {'loss': 1.8637, 'learning_rate': 0.0003222771627645953, 'epoch': 0.3}
+ 30%|███       | 2041/6779 [1:15:40<2:49:21,  2.14s/it] 30%|███       | 2042/6779 [1:15:42<2:53:10,  2.19s/it]                                                       {'loss': 1.6104, 'learning_rate': 0.0003222027056147325, 'epoch': 0.3}
+ 30%|███       | 2042/6779 [1:15:42<2:53:10,  2.19s/it] 30%|███       | 2043/6779 [1:15:45<2:53:06,  2.19s/it]                                                       {'loss': 1.7341, 'learning_rate': 0.0003221282214279213, 'epoch': 0.3}
+ 30%|███       | 2043/6779 [1:15:45<2:53:06,  2.19s/it] 30%|███       | 2044/6779 [1:15:47<2:49:58,  2.15s/it]                                                       {'loss': 1.791, 'learning_rate': 0.0003220537102206411, 'epoch': 0.3}
+ 30%|███       | 2044/6779 [1:15:47<2:49:58,  2.15s/it] 30%|███       | 2045/6779 [1:15:49<2:47:34,  2.12s/it]                                                       {'loss': 1.6904, 'learning_rate': 0.00032197917200937724, 'epoch': 0.3}
+ 30%|███       | 2045/6779 [1:15:49<2:47:34,  2.12s/it] 30%|███       | 2046/6779 [1:15:51<2:47:41,  2.13s/it]                                                       {'loss': 1.7191, 'learning_rate': 0.0003219046068106211, 'epoch': 0.3}
+ 30%|███       | 2046/6779 [1:15:51<2:47:41,  2.13s/it] 30%|███       | 2047/6779 [1:15:53<2:46:10,  2.11s/it]                                                       {'loss': 1.6296, 'learning_rate': 0.00032183001464086995, 'epoch': 0.3}
+ 30%|███       | 2047/6779 [1:15:53<2:46:10,  2.11s/it] 30%|███       | 2048/6779 [1:15:55<2:52:23,  2.19s/it]                                                       {'loss': 1.664, 'learning_rate': 0.00032175539551662706, 'epoch': 0.3}
+ 30%|███       | 2048/6779 [1:15:55<2:52:23,  2.19s/it] 30%|███       | 2049/6779 [1:15:58<2:56:25,  2.24s/it]                                                       {'loss': 1.7395, 'learning_rate': 0.00032168074945440167, 'epoch': 0.3}
+ 30%|███       | 2049/6779 [1:15:58<2:56:25,  2.24s/it] 30%|███       | 2050/6779 [1:16:00<2:53:34,  2.20s/it]                                                       {'loss': 1.764, 'learning_rate': 0.00032160607647070905, 'epoch': 0.3}
+ 30%|███       | 2050/6779 [1:16:00<2:53:34,  2.20s/it] 30%|███       | 2051/6779 [1:16:02<2:50:58,  2.17s/it]                                                       {'loss': 1.9961, 'learning_rate': 0.0003215313765820702, 'epoch': 0.3}
+ 30%|███       | 2051/6779 [1:16:02<2:50:58,  2.17s/it] 30%|███       | 2052/6779 [1:16:04<2:50:42,  2.17s/it]                                                       {'loss': 1.701, 'learning_rate': 0.00032145664980501234, 'epoch': 0.3}
+ 30%|███       | 2052/6779 [1:16:04<2:50:42,  2.17s/it] 30%|███       | 2053/6779 [1:16:06<2:55:06,  2.22s/it]                                                       {'loss': 1.7558, 'learning_rate': 0.0003213818961560686, 'epoch': 0.3}
+ 30%|███       | 2053/6779 [1:16:06<2:55:06,  2.22s/it] 30%|███       | 2054/6779 [1:16:09<2:55:43,  2.23s/it]                                                       {'loss': 1.7647, 'learning_rate': 0.0003213071156517778, 'epoch': 0.3}
+ 30%|███       | 2054/6779 [1:16:09<2:55:43,  2.23s/it] 30%|███       | 2055/6779 [1:16:11<2:57:02,  2.25s/it]                                                       {'loss': 1.8378, 'learning_rate': 0.000321232308308685, 'epoch': 0.3}
+ 30%|███       | 2055/6779 [1:16:11<2:57:02,  2.25s/it] 30%|███       | 2056/6779 [1:16:13<2:53:50,  2.21s/it]                                                       {'loss': 1.8143, 'learning_rate': 0.000321157474143341, 'epoch': 0.3}
+ 30%|███       | 2056/6779 [1:16:13<2:53:50,  2.21s/it] 30%|███       | 2057/6779 [1:16:15<2:53:24,  2.20s/it]                                                       {'loss': 1.6666, 'learning_rate': 0.00032108261317230274, 'epoch': 0.3}
+ 30%|███       | 2057/6779 [1:16:15<2:53:24,  2.20s/it] 30%|███       | 2058/6779 [1:16:18<3:00:00,  2.29s/it]                                                       {'loss': 1.7484, 'learning_rate': 0.00032100772541213276, 'epoch': 0.3}
+ 30%|███       | 2058/6779 [1:16:18<3:00:00,  2.29s/it] 30%|███       | 2059/6779 [1:16:20<2:55:03,  2.23s/it]                                                       {'loss': 1.7416, 'learning_rate': 0.0003209328108793999, 'epoch': 0.3}
+ 30%|███       | 2059/6779 [1:16:20<2:55:03,  2.23s/it] 30%|███       | 2060/6779 [1:16:22<2:54:06,  2.21s/it]                                                       {'loss': 1.6978, 'learning_rate': 0.0003208578695906788, 'epoch': 0.3}
+ 30%|███       | 2060/6779 [1:16:22<2:54:06,  2.21s/it] 30%|███       | 2061/6779 [1:16:24<2:54:21,  2.22s/it]                                                       {'loss': 1.7207, 'learning_rate': 0.0003207829015625498, 'epoch': 0.3}
+ 30%|███       | 2061/6779 [1:16:24<2:54:21,  2.22s/it] 30%|███       | 2062/6779 [1:16:26<2:53:58,  2.21s/it]                                                       {'loss': 1.7672, 'learning_rate': 0.00032070790681159943, 'epoch': 0.3}
+ 30%|███       | 2062/6779 [1:16:26<2:53:58,  2.21s/it] 30%|███       | 2063/6779 [1:16:28<2:49:32,  2.16s/it]                                                       {'loss': 2.0049, 'learning_rate': 0.00032063288535441993, 'epoch': 0.3}
+ 30%|███       | 2063/6779 [1:16:28<2:49:32,  2.16s/it] 30%|███       | 2064/6779 [1:16:30<2:47:50,  2.14s/it]                                                       {'loss': 1.7368, 'learning_rate': 0.00032055783720760973, 'epoch': 0.3}
+ 30%|███       | 2064/6779 [1:16:30<2:47:50,  2.14s/it] 30%|███       | 2065/6779 [1:16:33<2:49:27,  2.16s/it]                                                       {'loss': 1.6372, 'learning_rate': 0.0003204827623877729, 'epoch': 0.3}
+ 30%|███       | 2065/6779 [1:16:33<2:49:27,  2.16s/it] 30%|███       | 2066/6779 [1:16:35<2:50:41,  2.17s/it]                                                       {'loss': 1.9412, 'learning_rate': 0.00032040766091151945, 'epoch': 0.3}
+ 30%|███       | 2066/6779 [1:16:35<2:50:41,  2.17s/it] 30%|███       | 2067/6779 [1:16:37<2:47:34,  2.13s/it]                                                       {'loss': 1.695, 'learning_rate': 0.0003203325327954654, 'epoch': 0.3}
+ 30%|███       | 2067/6779 [1:16:37<2:47:34,  2.13s/it] 31%|███       | 2068/6779 [1:16:39<2:48:26,  2.15s/it]                                                       {'loss': 1.7543, 'learning_rate': 0.0003202573780562326, 'epoch': 0.31}
+ 31%|███       | 2068/6779 [1:16:39<2:48:26,  2.15s/it] 31%|███       | 2069/6779 [1:16:41<2:51:27,  2.18s/it]                                                       {'loss': 1.788, 'learning_rate': 0.00032018219671044873, 'epoch': 0.31}
+ 31%|███       | 2069/6779 [1:16:41<2:51:27,  2.18s/it] 31%|███       | 2070/6779 [1:16:43<2:48:53,  2.15s/it]                                                       {'loss': 1.7899, 'learning_rate': 0.00032010698877474753, 'epoch': 0.31}
+ 31%|███       | 2070/6779 [1:16:43<2:48:53,  2.15s/it] 31%|███       | 2071/6779 [1:16:46<2:56:23,  2.25s/it]                                                       {'loss': 1.8932, 'learning_rate': 0.00032003175426576836, 'epoch': 0.31}
+ 31%|███       | 2071/6779 [1:16:46<2:56:23,  2.25s/it] 31%|███       | 2072/6779 [1:16:48<2:54:17,  2.22s/it]                                                       {'loss': 1.8116, 'learning_rate': 0.0003199564932001567, 'epoch': 0.31}
+ 31%|███       | 2072/6779 [1:16:48<2:54:17,  2.22s/it] 31%|███       | 2073/6779 [1:16:50<2:53:20,  2.21s/it]                                                       {'loss': 1.8071, 'learning_rate': 0.0003198812055945638, 'epoch': 0.31}
+ 31%|███       | 2073/6779 [1:16:50<2:53:20,  2.21s/it] 31%|███       | 2074/6779 [1:16:52<2:50:48,  2.18s/it]                                                       {'loss': 1.7533, 'learning_rate': 0.0003198058914656468, 'epoch': 0.31}
+ 31%|███       | 2074/6779 [1:16:52<2:50:48,  2.18s/it] 31%|███       | 2075/6779 [1:16:54<2:49:12,  2.16s/it]                                                       {'loss': 1.8424, 'learning_rate': 0.0003197305508300687, 'epoch': 0.31}
+ 31%|███       | 2075/6779 [1:16:54<2:49:12,  2.16s/it] 31%|███       | 2076/6779 [1:16:57<2:53:05,  2.21s/it]                                                       {'loss': 1.7057, 'learning_rate': 0.0003196551837044983, 'epoch': 0.31}
+ 31%|███       | 2076/6779 [1:16:57<2:53:05,  2.21s/it] 31%|███       | 2077/6779 [1:16:59<2:50:39,  2.18s/it]                                                       {'loss': 1.7617, 'learning_rate': 0.00031957979010561045, 'epoch': 0.31}
+ 31%|███       | 2077/6779 [1:16:59<2:50:39,  2.18s/it] 31%|███       | 2078/6779 [1:17:01<2:50:55,  2.18s/it]                                                       {'loss': 1.783, 'learning_rate': 0.0003195043700500857, 'epoch': 0.31}
+ 31%|███       | 2078/6779 [1:17:01<2:50:55,  2.18s/it] 31%|███       | 2079/6779 [1:17:04<2:58:36,  2.28s/it]                                                       {'loss': 1.9042, 'learning_rate': 0.0003194289235546105, 'epoch': 0.31}
+ 31%|███       | 2079/6779 [1:17:04<2:58:36,  2.28s/it] 31%|███       | 2080/6779 [1:17:06<2:58:56,  2.28s/it]                                                       {'loss': 1.5693, 'learning_rate': 0.000319353450635877, 'epoch': 0.31}
+ 31%|███       | 2080/6779 [1:17:06<2:58:56,  2.28s/it] 31%|███       | 2081/6779 [1:17:08<2:53:05,  2.21s/it]                                                       {'loss': 1.8472, 'learning_rate': 0.00031927795131058356, 'epoch': 0.31}
+ 31%|███       | 2081/6779 [1:17:08<2:53:05,  2.21s/it] 31%|███       | 2082/6779 [1:17:10<2:49:14,  2.16s/it]                                                       {'loss': 1.5701, 'learning_rate': 0.000319202425595434, 'epoch': 0.31}
+ 31%|███       | 2082/6779 [1:17:10<2:49:14,  2.16s/it] 31%|███       | 2083/6779 [1:17:12<2:46:40,  2.13s/it]                                                       {'loss': 1.75, 'learning_rate': 0.00031912687350713824, 'epoch': 0.31}
+ 31%|███       | 2083/6779 [1:17:12<2:46:40,  2.13s/it] 31%|███       | 2084/6779 [1:17:14<2:49:07,  2.16s/it]                                                       {'loss': 1.7216, 'learning_rate': 0.0003190512950624117, 'epoch': 0.31}
+ 31%|███       | 2084/6779 [1:17:14<2:49:07,  2.16s/it] 31%|███       | 2085/6779 [1:17:16<2:47:53,  2.15s/it]                                                       {'loss': 1.7525, 'learning_rate': 0.0003189756902779762, 'epoch': 0.31}
+ 31%|███       | 2085/6779 [1:17:16<2:47:53,  2.15s/it] 31%|███       | 2086/6779 [1:17:18<2:41:06,  2.06s/it]                                                       {'loss': 1.8698, 'learning_rate': 0.00031890005917055897, 'epoch': 0.31}
+ 31%|███       | 2086/6779 [1:17:18<2:41:06,  2.06s/it] 31%|███       | 2087/6779 [1:17:20<2:45:27,  2.12s/it]                                                       {'loss': 1.6577, 'learning_rate': 0.00031882440175689294, 'epoch': 0.31}
+ 31%|███       | 2087/6779 [1:17:21<2:45:27,  2.12s/it] 31%|███       | 2088/6779 [1:17:23<2:47:46,  2.15s/it]                                                       {'loss': 1.6611, 'learning_rate': 0.0003187487180537172, 'epoch': 0.31}
+ 31%|███       | 2088/6779 [1:17:23<2:47:46,  2.15s/it] 31%|███       | 2089/6779 [1:17:25<2:48:16,  2.15s/it]                                                       {'loss': 1.6604, 'learning_rate': 0.0003186730080777765, 'epoch': 0.31}
+ 31%|███       | 2089/6779 [1:17:25<2:48:16,  2.15s/it] 31%|███       | 2090/6779 [1:17:27<2:49:51,  2.17s/it]                                                       {'loss': 1.8525, 'learning_rate': 0.0003185972718458215, 'epoch': 0.31}
+ 31%|███       | 2090/6779 [1:17:27<2:49:51,  2.17s/it] 31%|███       | 2091/6779 [1:17:30<2:58:25,  2.28s/it]                                                       {'loss': 1.7193, 'learning_rate': 0.0003185215093746084, 'epoch': 0.31}
+ 31%|███       | 2091/6779 [1:17:30<2:58:25,  2.28s/it] 31%|███       | 2092/6779 [1:17:32<3:00:27,  2.31s/it]                                                       {'loss': 1.7709, 'learning_rate': 0.00031844572068089966, 'epoch': 0.31}
+ 31%|███       | 2092/6779 [1:17:32<3:00:27,  2.31s/it] 31%|███       | 2093/6779 [1:17:34<2:54:53,  2.24s/it]                                                       {'loss': 1.7324, 'learning_rate': 0.0003183699057814631, 'epoch': 0.31}
+ 31%|███       | 2093/6779 [1:17:34<2:54:53,  2.24s/it] 31%|███       | 2094/6779 [1:17:36<2:55:22,  2.25s/it]                                                       {'loss': 1.8166, 'learning_rate': 0.0003182940646930726, 'epoch': 0.31}
+ 31%|███       | 2094/6779 [1:17:36<2:55:22,  2.25s/it] 31%|███       | 2095/6779 [1:17:39<2:54:54,  2.24s/it]                                                       {'loss': 1.8243, 'learning_rate': 0.0003182181974325077, 'epoch': 0.31}
+ 31%|███       | 2095/6779 [1:17:39<2:54:54,  2.24s/it] 31%|███       | 2096/6779 [1:17:41<2:50:11,  2.18s/it]                                                       {'loss': 1.7204, 'learning_rate': 0.0003181423040165538, 'epoch': 0.31}
+ 31%|███       | 2096/6779 [1:17:41<2:50:11,  2.18s/it] 31%|███       | 2097/6779 [1:17:43<2:48:42,  2.16s/it]                                                       {'loss': 1.684, 'learning_rate': 0.00031806638446200204, 'epoch': 0.31}
+ 31%|███       | 2097/6779 [1:17:43<2:48:42,  2.16s/it] 31%|███       | 2098/6779 [1:17:45<2:54:38,  2.24s/it]                                                       {'loss': 1.8559, 'learning_rate': 0.0003179904387856494, 'epoch': 0.31}
+ 31%|███       | 2098/6779 [1:17:45<2:54:38,  2.24s/it] 31%|███       | 2099/6779 [1:17:48<2:58:33,  2.29s/it]                                                       {'loss': 1.8468, 'learning_rate': 0.0003179144670042987, 'epoch': 0.31}
+ 31%|███       | 2099/6779 [1:17:48<2:58:33,  2.29s/it] 31%|███       | 2100/6779 [1:17:50<2:52:45,  2.22s/it]                                                       {'loss': 1.7464, 'learning_rate': 0.0003178384691347583, 'epoch': 0.31}
+ 31%|███       | 2100/6779 [1:17:50<2:52:45,  2.22s/it] 31%|███       | 2101/6779 [1:17:52<2:51:03,  2.19s/it]                                                       {'loss': 1.7719, 'learning_rate': 0.0003177624451938426, 'epoch': 0.31}
+ 31%|███       | 2101/6779 [1:17:52<2:51:03,  2.19s/it] 31%|███       | 2102/6779 [1:17:54<2:50:51,  2.19s/it]                                                       {'loss': 1.7057, 'learning_rate': 0.0003176863951983715, 'epoch': 0.31}
+ 31%|███       | 2102/6779 [1:17:54<2:50:51,  2.19s/it] 31%|███       | 2103/6779 [1:17:56<2:50:05,  2.18s/it]                                                       {'loss': 1.6337, 'learning_rate': 0.00031761031916517103, 'epoch': 0.31}
+ 31%|███       | 2103/6779 [1:17:56<2:50:05,  2.18s/it] 31%|███       | 2104/6779 [1:17:58<2:49:19,  2.17s/it]                                                       {'loss': 1.7411, 'learning_rate': 0.0003175342171110725, 'epoch': 0.31}
+ 31%|███       | 2104/6779 [1:17:58<2:49:19,  2.17s/it] 31%|███       | 2105/6779 [1:18:00<2:50:45,  2.19s/it]                                                       {'loss': 1.7827, 'learning_rate': 0.0003174580890529135, 'epoch': 0.31}
+ 31%|███       | 2105/6779 [1:18:00<2:50:45,  2.19s/it] 31%|███       | 2106/6779 [1:18:03<2:49:18,  2.17s/it]                                                       {'loss': 1.6105, 'learning_rate': 0.00031738193500753693, 'epoch': 0.31}
+ 31%|███       | 2106/6779 [1:18:03<2:49:18,  2.17s/it] 31%|███       | 2107/6779 [1:18:05<2:50:54,  2.19s/it]                                                       {'loss': 1.6262, 'learning_rate': 0.00031730575499179167, 'epoch': 0.31}
+ 31%|███       | 2107/6779 [1:18:05<2:50:54,  2.19s/it] 31%|███       | 2108/6779 [1:18:07<2:47:06,  2.15s/it]                                                       {'loss': 1.7294, 'learning_rate': 0.0003172295490225324, 'epoch': 0.31}
+ 31%|███       | 2108/6779 [1:18:07<2:47:06,  2.15s/it] 31%|███       | 2109/6779 [1:18:09<2:44:50,  2.12s/it]                                                       {'loss': 1.7586, 'learning_rate': 0.0003171533171166193, 'epoch': 0.31}
+ 31%|███       | 2109/6779 [1:18:09<2:44:50,  2.12s/it] 31%|███       | 2110/6779 [1:18:11<2:43:55,  2.11s/it]                                                       {'loss': 1.8016, 'learning_rate': 0.00031707705929091845, 'epoch': 0.31}
+ 31%|███       | 2110/6779 [1:18:11<2:43:55,  2.11s/it] 31%|███       | 2111/6779 [1:18:13<2:45:45,  2.13s/it]                                                       {'loss': 1.75, 'learning_rate': 0.00031700077556230167, 'epoch': 0.31}
+ 31%|███       | 2111/6779 [1:18:13<2:45:45,  2.13s/it] 31%|███       | 2112/6779 [1:18:15<2:48:56,  2.17s/it]                                                       {'loss': 1.7696, 'learning_rate': 0.00031692446594764657, 'epoch': 0.31}
+ 31%|███       | 2112/6779 [1:18:15<2:48:56,  2.17s/it] 31%|███       | 2113/6779 [1:18:18<2:45:30,  2.13s/it]                                                       {'loss': 1.5171, 'learning_rate': 0.00031684813046383624, 'epoch': 0.31}
+ 31%|███       | 2113/6779 [1:18:18<2:45:30,  2.13s/it] 31%|███       | 2114/6779 [1:18:19<2:42:04,  2.08s/it]                                                       {'loss': 1.7547, 'learning_rate': 0.00031677176912775983, 'epoch': 0.31}
+ 31%|███       | 2114/6779 [1:18:19<2:42:04,  2.08s/it] 31%|███       | 2115/6779 [1:18:22<2:52:55,  2.22s/it]                                                       {'loss': 1.7117, 'learning_rate': 0.00031669538195631193, 'epoch': 0.31}
+ 31%|███       | 2115/6779 [1:18:22<2:52:55,  2.22s/it] 31%|███       | 2116/6779 [1:18:24<2:47:47,  2.16s/it]                                                       {'loss': 1.6944, 'learning_rate': 0.0003166189689663929, 'epoch': 0.31}
+ 31%|███       | 2116/6779 [1:18:24<2:47:47,  2.16s/it] 31%|███       | 2117/6779 [1:18:26<2:45:57,  2.14s/it]                                                       {'loss': 1.7516, 'learning_rate': 0.00031654253017490897, 'epoch': 0.31}
+ 31%|███       | 2117/6779 [1:18:26<2:45:57,  2.14s/it] 31%|███       | 2118/6779 [1:18:28<2:44:54,  2.12s/it]                                                       {'loss': 1.6439, 'learning_rate': 0.00031646606559877197, 'epoch': 0.31}
+ 31%|███       | 2118/6779 [1:18:28<2:44:54,  2.12s/it] 31%|███▏      | 2119/6779 [1:18:31<2:49:59,  2.19s/it]                                                       {'loss': 1.7281, 'learning_rate': 0.00031638957525489936, 'epoch': 0.31}
+ 31%|███▏      | 2119/6779 [1:18:31<2:49:59,  2.19s/it] 31%|███▏      | 2120/6779 [1:18:33<2:50:47,  2.20s/it]                                                       {'loss': 1.6504, 'learning_rate': 0.0003163130591602144, 'epoch': 0.31}
+ 31%|███▏      | 2120/6779 [1:18:33<2:50:47,  2.20s/it] 31%|███▏      | 2121/6779 [1:18:35<2:50:28,  2.20s/it]                                                       {'loss': 1.6118, 'learning_rate': 0.0003162365173316461, 'epoch': 0.31}
+ 31%|███▏      | 2121/6779 [1:18:35<2:50:28,  2.20s/it] 31%|███▏      | 2122/6779 [1:18:37<2:49:17,  2.18s/it]                                                       {'loss': 1.653, 'learning_rate': 0.0003161599497861291, 'epoch': 0.31}
+ 31%|███▏      | 2122/6779 [1:18:37<2:49:17,  2.18s/it] 31%|███▏      | 2123/6779 [1:18:39<2:48:33,  2.17s/it]                                                       {'loss': 1.8261, 'learning_rate': 0.0003160833565406035, 'epoch': 0.31}
+ 31%|███▏      | 2123/6779 [1:18:39<2:48:33,  2.17s/it] 31%|███▏      | 2124/6779 [1:18:41<2:48:44,  2.17s/it]                                                       {'loss': 1.8132, 'learning_rate': 0.00031600673761201554, 'epoch': 0.31}
+ 31%|███▏      | 2124/6779 [1:18:41<2:48:44,  2.17s/it] 31%|███▏      | 2125/6779 [1:18:44<2:46:22,  2.14s/it]                                                       {'loss': 1.8917, 'learning_rate': 0.00031593009301731685, 'epoch': 0.31}
+ 31%|███▏      | 2125/6779 [1:18:44<2:46:22,  2.14s/it] 31%|███▏      | 2126/6779 [1:18:46<3:01:31,  2.34s/it]                                                       {'loss': 1.6661, 'learning_rate': 0.00031585342277346473, 'epoch': 0.31}
+ 31%|███▏      | 2126/6779 [1:18:46<3:01:31,  2.34s/it] 31%|███▏      | 2127/6779 [1:18:49<3:02:24,  2.35s/it]                                                       {'loss': 1.7429, 'learning_rate': 0.0003157767268974222, 'epoch': 0.31}
+ 31%|███▏      | 2127/6779 [1:18:49<3:02:24,  2.35s/it] 31%|███▏      | 2128/6779 [1:18:51<3:01:35,  2.34s/it]                                                       {'loss': 1.6725, 'learning_rate': 0.00031570000540615814, 'epoch': 0.31}
+ 31%|███▏      | 2128/6779 [1:18:51<3:01:35,  2.34s/it] 31%|███▏      | 2129/6779 [1:18:53<2:57:44,  2.29s/it]                                                       {'loss': 1.5958, 'learning_rate': 0.0003156232583166468, 'epoch': 0.31}
+ 31%|███▏      | 2129/6779 [1:18:53<2:57:44,  2.29s/it] 31%|███▏      | 2130/6779 [1:18:56<3:01:38,  2.34s/it]                                                       {'loss': 1.5605, 'learning_rate': 0.00031554648564586824, 'epoch': 0.31}
+ 31%|███▏      | 2130/6779 [1:18:56<3:01:38,  2.34s/it] 31%|███▏      | 2131/6779 [1:18:58<2:55:20,  2.26s/it]                                                       {'loss': 1.6119, 'learning_rate': 0.0003154696874108081, 'epoch': 0.31}
+ 31%|███▏      | 2131/6779 [1:18:58<2:55:20,  2.26s/it] 31%|███▏      | 2132/6779 [1:19:00<2:51:47,  2.22s/it]                                                       {'loss': 1.649, 'learning_rate': 0.00031539286362845787, 'epoch': 0.31}
+ 31%|███▏      | 2132/6779 [1:19:00<2:51:47,  2.22s/it] 31%|███▏      | 2133/6779 [1:19:02<2:53:20,  2.24s/it]                                                       {'loss': 1.6445, 'learning_rate': 0.0003153160143158145, 'epoch': 0.31}
+ 31%|███▏      | 2133/6779 [1:19:02<2:53:20,  2.24s/it] 31%|███▏      | 2134/6779 [1:19:04<2:50:31,  2.20s/it]                                                       {'loss': 1.6548, 'learning_rate': 0.0003152391394898806, 'epoch': 0.31}
+ 31%|███▏      | 2134/6779 [1:19:04<2:50:31,  2.20s/it] 31%|███▏      | 2135/6779 [1:19:06<2:47:13,  2.16s/it]                                                       {'loss': 1.6915, 'learning_rate': 0.0003151622391676645, 'epoch': 0.31}
+ 31%|███▏      | 2135/6779 [1:19:06<2:47:13,  2.16s/it] 32%|███▏      | 2136/6779 [1:19:09<2:53:19,  2.24s/it]                                                       {'loss': 1.7782, 'learning_rate': 0.0003150853133661802, 'epoch': 0.32}
+ 32%|███▏      | 2136/6779 [1:19:09<2:53:19,  2.24s/it] 32%|███▏      | 2137/6779 [1:19:11<2:57:57,  2.30s/it]                                                       {'loss': 1.6837, 'learning_rate': 0.00031500836210244723, 'epoch': 0.32}
+ 32%|███▏      | 2137/6779 [1:19:11<2:57:57,  2.30s/it] 32%|███▏      | 2138/6779 [1:19:14<3:04:02,  2.38s/it]                                                       {'loss': 1.5575, 'learning_rate': 0.0003149313853934908, 'epoch': 0.32}
+ 32%|███▏      | 2138/6779 [1:19:14<3:04:02,  2.38s/it] 32%|███▏      | 2139/6779 [1:19:16<2:58:37,  2.31s/it]                                                       {'loss': 1.6626, 'learning_rate': 0.00031485438325634186, 'epoch': 0.32}
+ 32%|███▏      | 2139/6779 [1:19:16<2:58:37,  2.31s/it] 32%|███▏      | 2140/6779 [1:19:18<2:54:48,  2.26s/it]                                                       {'loss': 1.64, 'learning_rate': 0.0003147773557080367, 'epoch': 0.32}
+ 32%|███▏      | 2140/6779 [1:19:18<2:54:48,  2.26s/it] 32%|███▏      | 2141/6779 [1:19:20<2:53:36,  2.25s/it]                                                       {'loss': 1.7764, 'learning_rate': 0.0003147003027656175, 'epoch': 0.32}
+ 32%|███▏      | 2141/6779 [1:19:20<2:53:36,  2.25s/it] 32%|███▏      | 2142/6779 [1:19:22<2:49:37,  2.19s/it]                                                       {'loss': 1.7143, 'learning_rate': 0.000314623224446132, 'epoch': 0.32}
+ 32%|███▏      | 2142/6779 [1:19:22<2:49:37,  2.19s/it] 32%|███▏      | 2143/6779 [1:19:25<2:49:13,  2.19s/it]                                                       {'loss': 1.5473, 'learning_rate': 0.0003145461207666335, 'epoch': 0.32}
+ 32%|███▏      | 2143/6779 [1:19:25<2:49:13,  2.19s/it] 32%|███▏      | 2144/6779 [1:19:27<2:48:19,  2.18s/it]                                                       {'loss': 1.7505, 'learning_rate': 0.00031446899174418096, 'epoch': 0.32}
+ 32%|███▏      | 2144/6779 [1:19:27<2:48:19,  2.18s/it] 32%|███▏      | 2145/6779 [1:19:29<2:53:36,  2.25s/it]                                                       {'loss': 1.7335, 'learning_rate': 0.0003143918373958389, 'epoch': 0.32}
+ 32%|███▏      | 2145/6779 [1:19:29<2:53:36,  2.25s/it] 32%|███▏      | 2146/6779 [1:19:31<2:49:46,  2.20s/it]                                                       {'loss': 1.7235, 'learning_rate': 0.00031431465773867743, 'epoch': 0.32}
+ 32%|███▏      | 2146/6779 [1:19:31<2:49:46,  2.20s/it] 32%|███▏      | 2147/6779 [1:19:34<2:55:26,  2.27s/it]                                                       {'loss': 1.9604, 'learning_rate': 0.00031423745278977234, 'epoch': 0.32}
+ 32%|███▏      | 2147/6779 [1:19:34<2:55:26,  2.27s/it] 32%|███▏      | 2148/6779 [1:19:36<2:51:17,  2.22s/it]                                                       {'loss': 1.5897, 'learning_rate': 0.000314160222566205, 'epoch': 0.32}
+ 32%|███▏      | 2148/6779 [1:19:36<2:51:17,  2.22s/it] 32%|███▏      | 2149/6779 [1:19:38<2:51:09,  2.22s/it]                                                       {'loss': 2.0507, 'learning_rate': 0.00031408296708506235, 'epoch': 0.32}
+ 32%|███▏      | 2149/6779 [1:19:38<2:51:09,  2.22s/it] 32%|███▏      | 2150/6779 [1:19:40<2:52:51,  2.24s/it]                                                       {'loss': 1.7074, 'learning_rate': 0.00031400568636343675, 'epoch': 0.32}
+ 32%|███▏      | 2150/6779 [1:19:40<2:52:51,  2.24s/it] 32%|███▏      | 2151/6779 [1:19:42<2:53:58,  2.26s/it]                                                       {'loss': 1.7496, 'learning_rate': 0.0003139283804184265, 'epoch': 0.32}
+ 32%|███▏      | 2151/6779 [1:19:43<2:53:58,  2.26s/it] 32%|███▏      | 2152/6779 [1:19:45<2:58:29,  2.31s/it]                                                       {'loss': 1.6388, 'learning_rate': 0.00031385104926713527, 'epoch': 0.32}
+ 32%|███▏      | 2152/6779 [1:19:45<2:58:29,  2.31s/it] 32%|███▏      | 2153/6779 [1:19:47<3:02:43,  2.37s/it]                                                       {'loss': 1.7112, 'learning_rate': 0.0003137736929266722, 'epoch': 0.32}
+ 32%|███▏      | 2153/6779 [1:19:47<3:02:43,  2.37s/it] 32%|███▏      | 2154/6779 [1:19:50<2:58:40,  2.32s/it]                                                       {'loss': 1.5898, 'learning_rate': 0.0003136963114141522, 'epoch': 0.32}
+ 32%|███▏      | 2154/6779 [1:19:50<2:58:40,  2.32s/it] 32%|███▏      | 2155/6779 [1:19:52<2:57:38,  2.30s/it]                                                       {'loss': 1.829, 'learning_rate': 0.0003136189047466957, 'epoch': 0.32}
+ 32%|███▏      | 2155/6779 [1:19:52<2:57:38,  2.30s/it] 32%|███▏      | 2156/6779 [1:19:54<2:53:52,  2.26s/it]                                                       {'loss': 1.6975, 'learning_rate': 0.0003135414729414286, 'epoch': 0.32}
+ 32%|███▏      | 2156/6779 [1:19:54<2:53:52,  2.26s/it] 32%|███▏      | 2157/6779 [1:19:56<2:49:26,  2.20s/it]                                                       {'loss': 1.7093, 'learning_rate': 0.00031346401601548257, 'epoch': 0.32}
+ 32%|███▏      | 2157/6779 [1:19:56<2:49:26,  2.20s/it] 32%|███▏      | 2158/6779 [1:19:58<2:45:48,  2.15s/it]                                                       {'loss': 1.5595, 'learning_rate': 0.0003133865339859945, 'epoch': 0.32}
+ 32%|███▏      | 2158/6779 [1:19:58<2:45:48,  2.15s/it] 32%|███▏      | 2159/6779 [1:20:00<2:46:00,  2.16s/it]                                                       {'loss': 1.6826, 'learning_rate': 0.0003133090268701072, 'epoch': 0.32}
+ 32%|███▏      | 2159/6779 [1:20:00<2:46:00,  2.16s/it] 32%|███▏      | 2160/6779 [1:20:03<2:49:29,  2.20s/it]                                                       {'loss': 1.7782, 'learning_rate': 0.00031323149468496885, 'epoch': 0.32}
+ 32%|███▏      | 2160/6779 [1:20:03<2:49:29,  2.20s/it] 32%|███▏      | 2161/6779 [1:20:05<2:47:22,  2.17s/it]                                                       {'loss': 1.7749, 'learning_rate': 0.0003131539374477331, 'epoch': 0.32}
+ 32%|███▏      | 2161/6779 [1:20:05<2:47:22,  2.17s/it] 32%|███▏      | 2162/6779 [1:20:07<2:45:42,  2.15s/it]                                                       {'loss': 1.8205, 'learning_rate': 0.0003130763551755593, 'epoch': 0.32}
+ 32%|███▏      | 2162/6779 [1:20:07<2:45:42,  2.15s/it] 32%|███▏      | 2163/6779 [1:20:09<2:47:23,  2.18s/it]                                                       {'loss': 1.6717, 'learning_rate': 0.00031299874788561226, 'epoch': 0.32}
+ 32%|███▏      | 2163/6779 [1:20:09<2:47:23,  2.18s/it] 32%|███▏      | 2164/6779 [1:20:11<2:50:33,  2.22s/it]                                                       {'loss': 1.8268, 'learning_rate': 0.0003129211155950624, 'epoch': 0.32}
+ 32%|███▏      | 2164/6779 [1:20:11<2:50:33,  2.22s/it] 32%|███▏      | 2165/6779 [1:20:14<2:50:11,  2.21s/it]                                                       {'loss': 1.8399, 'learning_rate': 0.0003128434583210855, 'epoch': 0.32}
+ 32%|███▏      | 2165/6779 [1:20:14<2:50:11,  2.21s/it] 32%|███▏      | 2166/6779 [1:20:16<2:50:19,  2.22s/it]                                                       {'loss': 1.8906, 'learning_rate': 0.000312765776080863, 'epoch': 0.32}
+ 32%|███▏      | 2166/6779 [1:20:16<2:50:19,  2.22s/it] 32%|███▏      | 2167/6779 [1:20:18<2:51:50,  2.24s/it]                                                       {'loss': 1.9352, 'learning_rate': 0.0003126880688915819, 'epoch': 0.32}
+ 32%|███▏      | 2167/6779 [1:20:18<2:51:50,  2.24s/it] 32%|███▏      | 2168/6779 [1:20:20<2:51:11,  2.23s/it]                                                       {'loss': 1.7202, 'learning_rate': 0.00031261033677043457, 'epoch': 0.32}
+ 32%|███▏      | 2168/6779 [1:20:20<2:51:11,  2.23s/it] 32%|███▏      | 2169/6779 [1:20:22<2:45:31,  2.15s/it]                                                       {'loss': 1.7867, 'learning_rate': 0.0003125325797346191, 'epoch': 0.32}
+ 32%|███▏      | 2169/6779 [1:20:22<2:45:31,  2.15s/it] 32%|███▏      | 2170/6779 [1:20:25<2:48:06,  2.19s/it]                                                       {'loss': 1.72, 'learning_rate': 0.0003124547978013389, 'epoch': 0.32}
+ 32%|███▏      | 2170/6779 [1:20:25<2:48:06,  2.19s/it] 32%|███▏      | 2171/6779 [1:20:27<2:46:30,  2.17s/it]                                                       {'loss': 1.5987, 'learning_rate': 0.00031237699098780305, 'epoch': 0.32}
+ 32%|███▏      | 2171/6779 [1:20:27<2:46:30,  2.17s/it] 32%|███▏      | 2172/6779 [1:20:29<2:49:49,  2.21s/it]                                                       {'loss': 1.7277, 'learning_rate': 0.000312299159311226, 'epoch': 0.32}
+ 32%|███▏      | 2172/6779 [1:20:29<2:49:49,  2.21s/it] 32%|███▏      | 2173/6779 [1:20:31<2:51:33,  2.23s/it]                                                       {'loss': 1.7127, 'learning_rate': 0.0003122213027888277, 'epoch': 0.32}
+ 32%|███▏      | 2173/6779 [1:20:31<2:51:33,  2.23s/it] 32%|███▏      | 2174/6779 [1:20:33<2:50:11,  2.22s/it]                                                       {'loss': 1.582, 'learning_rate': 0.0003121434214378337, 'epoch': 0.32}
+ 32%|███▏      | 2174/6779 [1:20:33<2:50:11,  2.22s/it] 32%|███▏      | 2175/6779 [1:20:36<2:50:36,  2.22s/it]                                                       {'loss': 1.7773, 'learning_rate': 0.00031206551527547505, 'epoch': 0.32}
+ 32%|███▏      | 2175/6779 [1:20:36<2:50:36,  2.22s/it] 32%|███▏      | 2176/6779 [1:20:38<2:52:34,  2.25s/it]                                                       {'loss': 1.7968, 'learning_rate': 0.0003119875843189881, 'epoch': 0.32}
+ 32%|███▏      | 2176/6779 [1:20:38<2:52:34,  2.25s/it] 32%|███▏      | 2177/6779 [1:20:40<2:52:48,  2.25s/it]                                                       {'loss': 1.803, 'learning_rate': 0.000311909628585615, 'epoch': 0.32}
+ 32%|███▏      | 2177/6779 [1:20:40<2:52:48,  2.25s/it] 32%|███▏      | 2178/6779 [1:20:42<2:51:37,  2.24s/it]                                                       {'loss': 1.8254, 'learning_rate': 0.000311831648092603, 'epoch': 0.32}
+ 32%|███▏      | 2178/6779 [1:20:42<2:51:37,  2.24s/it] 32%|███▏      | 2179/6779 [1:20:45<2:56:12,  2.30s/it]                                                       {'loss': 1.6005, 'learning_rate': 0.0003117536428572052, 'epoch': 0.32}
+ 32%|███▏      | 2179/6779 [1:20:45<2:56:12,  2.30s/it] 32%|███▏      | 2180/6779 [1:20:47<2:57:01,  2.31s/it]                                                       {'loss': 1.7869, 'learning_rate': 0.0003116756128966799, 'epoch': 0.32}
+ 32%|███▏      | 2180/6779 [1:20:47<2:57:01,  2.31s/it] 32%|███▏      | 2181/6779 [1:20:50<2:57:13,  2.31s/it]                                                       {'loss': 1.786, 'learning_rate': 0.00031159755822829095, 'epoch': 0.32}
+ 32%|███▏      | 2181/6779 [1:20:50<2:57:13,  2.31s/it] 32%|███▏      | 2182/6779 [1:20:52<2:58:37,  2.33s/it]                                                       {'loss': 1.705, 'learning_rate': 0.0003115194788693079, 'epoch': 0.32}
+ 32%|███▏      | 2182/6779 [1:20:52<2:58:37,  2.33s/it] 32%|███▏      | 2183/6779 [1:20:54<2:53:48,  2.27s/it]                                                       {'loss': 1.7512, 'learning_rate': 0.0003114413748370052, 'epoch': 0.32}
+ 32%|███▏      | 2183/6779 [1:20:54<2:53:48,  2.27s/it] 32%|███▏      | 2184/6779 [1:20:56<2:48:15,  2.20s/it]                                                       {'loss': 1.6969, 'learning_rate': 0.00031136324614866346, 'epoch': 0.32}
+ 32%|███▏      | 2184/6779 [1:20:56<2:48:15,  2.20s/it] 32%|███▏      | 2185/6779 [1:20:58<2:49:28,  2.21s/it]                                                       {'loss': 1.7838, 'learning_rate': 0.00031128509282156815, 'epoch': 0.32}
+ 32%|███▏      | 2185/6779 [1:20:58<2:49:28,  2.21s/it] 32%|███▏      | 2186/6779 [1:21:00<2:46:28,  2.17s/it]                                                       {'loss': 1.847, 'learning_rate': 0.0003112069148730106, 'epoch': 0.32}
+ 32%|███▏      | 2186/6779 [1:21:00<2:46:28,  2.17s/it] 32%|███▏      | 2187/6779 [1:21:03<2:53:38,  2.27s/it]                                                       {'loss': 1.8593, 'learning_rate': 0.00031112871232028726, 'epoch': 0.32}
+ 32%|███▏      | 2187/6779 [1:21:03<2:53:38,  2.27s/it] 32%|███▏      | 2188/6779 [1:21:05<2:53:59,  2.27s/it]                                                       {'loss': 1.6846, 'learning_rate': 0.00031105048518070036, 'epoch': 0.32}
+ 32%|███▏      | 2188/6779 [1:21:05<2:53:59,  2.27s/it] 32%|███▏      | 2189/6779 [1:21:07<2:52:12,  2.25s/it]                                                       {'loss': 1.7778, 'learning_rate': 0.0003109722334715573, 'epoch': 0.32}
+ 32%|███▏      | 2189/6779 [1:21:07<2:52:12,  2.25s/it] 32%|███▏      | 2190/6779 [1:21:10<3:03:37,  2.40s/it]                                                       {'loss': 1.521, 'learning_rate': 0.00031089395721017106, 'epoch': 0.32}
+ 32%|███▏      | 2190/6779 [1:21:10<3:03:37,  2.40s/it] 32%|███▏      | 2191/6779 [1:21:12<2:59:55,  2.35s/it]                                                       {'loss': 1.9404, 'learning_rate': 0.00031081565641385994, 'epoch': 0.32}
+ 32%|███▏      | 2191/6779 [1:21:12<2:59:55,  2.35s/it] 32%|███▏      | 2192/6779 [1:21:14<2:51:08,  2.24s/it]                                                       {'loss': 1.9052, 'learning_rate': 0.0003107373310999478, 'epoch': 0.32}
+ 32%|███▏      | 2192/6779 [1:21:14<2:51:08,  2.24s/it] 32%|███▏      | 2193/6779 [1:21:16<2:46:29,  2.18s/it]                                                       {'loss': 1.7406, 'learning_rate': 0.00031065898128576386, 'epoch': 0.32}
+ 32%|███▏      | 2193/6779 [1:21:16<2:46:29,  2.18s/it] 32%|███▏      | 2194/6779 [1:21:19<2:51:08,  2.24s/it]                                                       {'loss': 1.7166, 'learning_rate': 0.0003105806069886427, 'epoch': 0.32}
+ 32%|███▏      | 2194/6779 [1:21:19<2:51:08,  2.24s/it] 32%|███▏      | 2195/6779 [1:21:21<2:48:04,  2.20s/it]                                                       {'loss': 1.7871, 'learning_rate': 0.00031050220822592445, 'epoch': 0.32}
+ 32%|███▏      | 2195/6779 [1:21:21<2:48:04,  2.20s/it] 32%|███▏      | 2196/6779 [1:21:23<2:47:07,  2.19s/it]                                                       {'loss': 1.6588, 'learning_rate': 0.0003104237850149545, 'epoch': 0.32}
+ 32%|███▏      | 2196/6779 [1:21:23<2:47:07,  2.19s/it] 32%|███▏      | 2197/6779 [1:21:25<2:51:11,  2.24s/it]                                                       {'loss': 1.7343, 'learning_rate': 0.0003103453373730838, 'epoch': 0.32}
+ 32%|███▏      | 2197/6779 [1:21:25<2:51:11,  2.24s/it] 32%|███▏      | 2198/6779 [1:21:28<2:47:46,  2.20s/it]                                                       {'loss': 1.816, 'learning_rate': 0.00031026686531766855, 'epoch': 0.32}
+ 32%|███▏      | 2198/6779 [1:21:28<2:47:46,  2.20s/it] 32%|███▏      | 2199/6779 [1:21:30<2:46:53,  2.19s/it]                                                       {'loss': 1.7613, 'learning_rate': 0.00031018836886607064, 'epoch': 0.32}
+ 32%|███▏      | 2199/6779 [1:21:30<2:46:53,  2.19s/it] 32%|███▏      | 2200/6779 [1:21:32<2:41:07,  2.11s/it]                                                       {'loss': 1.7249, 'learning_rate': 0.00031010984803565687, 'epoch': 0.32}
+ 32%|███▏      | 2200/6779 [1:21:32<2:41:07,  2.11s/it] 32%|███▏      | 2201/6779 [1:21:34<2:50:16,  2.23s/it]                                                       {'loss': 1.6767, 'learning_rate': 0.00031003130284379984, 'epoch': 0.32}
+ 32%|███▏      | 2201/6779 [1:21:34<2:50:16,  2.23s/it] 32%|███▏      | 2202/6779 [1:21:36<2:51:02,  2.24s/it]                                                       {'loss': 1.6741, 'learning_rate': 0.00030995273330787753, 'epoch': 0.32}
+ 32%|███▏      | 2202/6779 [1:21:36<2:51:02,  2.24s/it] 32%|███▏      | 2203/6779 [1:21:39<2:54:28,  2.29s/it]                                                       {'loss': 1.7595, 'learning_rate': 0.00030987413944527306, 'epoch': 0.32}
+ 32%|███▏      | 2203/6779 [1:21:39<2:54:28,  2.29s/it] 33%|███▎      | 2204/6779 [1:21:41<2:56:10,  2.31s/it]                                                       {'loss': 1.6407, 'learning_rate': 0.0003097955212733751, 'epoch': 0.33}
+ 33%|███▎      | 2204/6779 [1:21:41<2:56:10,  2.31s/it] 33%|███▎      | 2205/6779 [1:21:43<2:53:22,  2.27s/it]                                                       {'loss': 1.5947, 'learning_rate': 0.00030971687880957755, 'epoch': 0.33}
+ 33%|███▎      | 2205/6779 [1:21:43<2:53:22,  2.27s/it] 33%|███▎      | 2206/6779 [1:21:45<2:47:46,  2.20s/it]                                                       {'loss': 1.7871, 'learning_rate': 0.00030963821207128, 'epoch': 0.33}
+ 33%|███▎      | 2206/6779 [1:21:45<2:47:46,  2.20s/it] 33%|███▎      | 2207/6779 [1:21:48<2:47:07,  2.19s/it]                                                       {'loss': 1.8245, 'learning_rate': 0.00030955952107588713, 'epoch': 0.33}
+ 33%|███▎      | 2207/6779 [1:21:48<2:47:07,  2.19s/it] 33%|███▎      | 2208/6779 [1:21:50<2:47:11,  2.19s/it]                                                       {'loss': 1.806, 'learning_rate': 0.00030948080584080896, 'epoch': 0.33}
+ 33%|███▎      | 2208/6779 [1:21:50<2:47:11,  2.19s/it] 33%|███▎      | 2209/6779 [1:21:52<2:46:30,  2.19s/it]                                                       {'loss': 1.7028, 'learning_rate': 0.0003094020663834611, 'epoch': 0.33}
+ 33%|███▎      | 2209/6779 [1:21:52<2:46:30,  2.19s/it] 33%|███▎      | 2210/6779 [1:21:54<2:44:39,  2.16s/it]                                                       {'loss': 1.6574, 'learning_rate': 0.0003093233027212644, 'epoch': 0.33}
+ 33%|███▎      | 2210/6779 [1:21:54<2:44:39,  2.16s/it] 33%|███▎      | 2211/6779 [1:21:56<2:45:12,  2.17s/it]                                                       {'loss': 1.6796, 'learning_rate': 0.00030924451487164507, 'epoch': 0.33}
+ 33%|███▎      | 2211/6779 [1:21:56<2:45:12,  2.17s/it] 33%|███▎      | 2212/6779 [1:21:58<2:42:37,  2.14s/it]                                                       {'loss': 1.7892, 'learning_rate': 0.0003091657028520345, 'epoch': 0.33}
+ 33%|███▎      | 2212/6779 [1:21:58<2:42:37,  2.14s/it] 33%|███▎      | 2213/6779 [1:22:01<2:46:57,  2.19s/it]                                                       {'loss': 1.7974, 'learning_rate': 0.00030908686667986977, 'epoch': 0.33}
+ 33%|███▎      | 2213/6779 [1:22:01<2:46:57,  2.19s/it] 33%|███▎      | 2214/6779 [1:22:03<2:46:48,  2.19s/it]                                                       {'loss': 1.8121, 'learning_rate': 0.0003090080063725931, 'epoch': 0.33}
+ 33%|███▎      | 2214/6779 [1:22:03<2:46:48,  2.19s/it] 33%|███▎      | 2215/6779 [1:22:05<2:44:35,  2.16s/it]                                                       {'loss': 1.8421, 'learning_rate': 0.0003089291219476519, 'epoch': 0.33}
+ 33%|███▎      | 2215/6779 [1:22:05<2:44:35,  2.16s/it] 33%|███▎      | 2216/6779 [1:22:07<2:47:12,  2.20s/it]                                                       {'loss': 1.837, 'learning_rate': 0.0003088502134224994, 'epoch': 0.33}
+ 33%|███▎      | 2216/6779 [1:22:07<2:47:12,  2.20s/it] 33%|███▎      | 2217/6779 [1:22:10<2:50:40,  2.24s/it]                                                       {'loss': 1.6128, 'learning_rate': 0.0003087712808145936, 'epoch': 0.33}
+ 33%|███▎      | 2217/6779 [1:22:10<2:50:40,  2.24s/it] 33%|███▎      | 2218/6779 [1:22:12<2:45:13,  2.17s/it]                                                       {'loss': 1.7933, 'learning_rate': 0.0003086923241413982, 'epoch': 0.33}
+ 33%|███▎      | 2218/6779 [1:22:12<2:45:13,  2.17s/it] 33%|███▎      | 2219/6779 [1:22:14<2:44:35,  2.17s/it]                                                       {'loss': 1.7699, 'learning_rate': 0.000308613343420382, 'epoch': 0.33}
+ 33%|███▎      | 2219/6779 [1:22:14<2:44:35,  2.17s/it] 33%|███▎      | 2220/6779 [1:22:16<2:48:59,  2.22s/it]                                                       {'loss': 1.732, 'learning_rate': 0.0003085343386690194, 'epoch': 0.33}
+ 33%|███▎      | 2220/6779 [1:22:16<2:48:59,  2.22s/it] 33%|███▎      | 2221/6779 [1:22:19<2:58:50,  2.35s/it]                                                       {'loss': 1.9072, 'learning_rate': 0.0003084553099047897, 'epoch': 0.33}
+ 33%|███▎      | 2221/6779 [1:22:19<2:58:50,  2.35s/it] 33%|███▎      | 2222/6779 [1:22:21<3:00:27,  2.38s/it]                                                       {'loss': 1.9054, 'learning_rate': 0.00030837625714517794, 'epoch': 0.33}
+ 33%|███▎      | 2222/6779 [1:22:21<3:00:27,  2.38s/it] 33%|███▎      | 2223/6779 [1:22:23<2:55:05,  2.31s/it]                                                       {'loss': 1.6786, 'learning_rate': 0.00030829718040767433, 'epoch': 0.33}
+ 33%|███▎      | 2223/6779 [1:22:23<2:55:05,  2.31s/it] 33%|███▎      | 2224/6779 [1:22:25<2:53:16,  2.28s/it]                                                       {'loss': 1.6489, 'learning_rate': 0.0003082180797097742, 'epoch': 0.33}
+ 33%|███▎      | 2224/6779 [1:22:25<2:53:16,  2.28s/it] 33%|███▎      | 2225/6779 [1:22:28<2:50:57,  2.25s/it]                                                       {'loss': 1.6425, 'learning_rate': 0.00030813895506897834, 'epoch': 0.33}
+ 33%|███▎      | 2225/6779 [1:22:28<2:50:57,  2.25s/it] 33%|███▎      | 2226/6779 [1:22:30<2:48:58,  2.23s/it]                                                       {'loss': 1.6192, 'learning_rate': 0.00030805980650279284, 'epoch': 0.33}
+ 33%|███▎      | 2226/6779 [1:22:30<2:48:58,  2.23s/it] 33%|███▎      | 2227/6779 [1:22:32<2:45:02,  2.18s/it]                                                       {'loss': 1.7899, 'learning_rate': 0.0003079806340287291, 'epoch': 0.33}
+ 33%|███▎      | 2227/6779 [1:22:32<2:45:02,  2.18s/it] 33%|███▎      | 2228/6779 [1:22:34<2:46:28,  2.19s/it]                                                       {'loss': 1.7219, 'learning_rate': 0.0003079014376643037, 'epoch': 0.33}
+ 33%|███▎      | 2228/6779 [1:22:34<2:46:28,  2.19s/it] 33%|███▎      | 2229/6779 [1:22:37<2:51:35,  2.26s/it]                                                       {'loss': 1.7063, 'learning_rate': 0.0003078222174270386, 'epoch': 0.33}
+ 33%|███▎      | 2229/6779 [1:22:37<2:51:35,  2.26s/it] 33%|███▎      | 2230/6779 [1:22:39<2:49:46,  2.24s/it]                                                       {'loss': 1.6725, 'learning_rate': 0.00030774297333446105, 'epoch': 0.33}
+ 33%|███▎      | 2230/6779 [1:22:39<2:49:46,  2.24s/it] 33%|███▎      | 2231/6779 [1:22:41<2:44:44,  2.17s/it]                                                       {'loss': 1.688, 'learning_rate': 0.0003076637054041036, 'epoch': 0.33}
+ 33%|███▎      | 2231/6779 [1:22:41<2:44:44,  2.17s/it] 33%|███▎      | 2232/6779 [1:22:43<2:48:28,  2.22s/it]                                                       {'loss': 1.8319, 'learning_rate': 0.0003075844136535039, 'epoch': 0.33}
+ 33%|███▎      | 2232/6779 [1:22:43<2:48:28,  2.22s/it] 33%|███▎      | 2233/6779 [1:22:45<2:43:27,  2.16s/it]                                                       {'loss': 1.7618, 'learning_rate': 0.00030750509810020495, 'epoch': 0.33}
+ 33%|███▎      | 2233/6779 [1:22:45<2:43:27,  2.16s/it] 33%|███▎      | 2234/6779 [1:22:47<2:44:19,  2.17s/it]                                                       {'loss': 1.6607, 'learning_rate': 0.00030742575876175525, 'epoch': 0.33}
+ 33%|███▎      | 2234/6779 [1:22:47<2:44:19,  2.17s/it] 33%|███▎      | 2235/6779 [1:22:50<2:45:16,  2.18s/it]                                                       {'loss': 1.5615, 'learning_rate': 0.0003073463956557082, 'epoch': 0.33}
+ 33%|███▎      | 2235/6779 [1:22:50<2:45:16,  2.18s/it] 33%|███▎      | 2236/6779 [1:22:52<2:49:43,  2.24s/it]                                                       {'loss': 1.794, 'learning_rate': 0.0003072670087996227, 'epoch': 0.33}
+ 33%|███▎      | 2236/6779 [1:22:52<2:49:43,  2.24s/it] 33%|███▎      | 2237/6779 [1:22:54<2:48:22,  2.22s/it]                                                       {'loss': 1.9005, 'learning_rate': 0.0003071875982110628, 'epoch': 0.33}
+ 33%|███▎      | 2237/6779 [1:22:54<2:48:22,  2.22s/it] 33%|███▎      | 2238/6779 [1:22:56<2:43:53,  2.17s/it]                                                       {'loss': 1.5293, 'learning_rate': 0.00030710816390759794, 'epoch': 0.33}
+ 33%|███▎      | 2238/6779 [1:22:56<2:43:53,  2.17s/it] 33%|███▎      | 2239/6779 [1:22:58<2:47:07,  2.21s/it]                                                       {'loss': 1.8186, 'learning_rate': 0.00030702870590680256, 'epoch': 0.33}
+ 33%|███▎      | 2239/6779 [1:22:58<2:47:07,  2.21s/it] 33%|███▎      | 2240/6779 [1:23:00<2:42:08,  2.14s/it]                                                       {'loss': 1.6743, 'learning_rate': 0.00030694922422625653, 'epoch': 0.33}
+ 33%|███▎      | 2240/6779 [1:23:00<2:42:08,  2.14s/it] 33%|███▎      | 2241/6779 [1:23:03<2:45:20,  2.19s/it]                                                       {'loss': 1.7703, 'learning_rate': 0.0003068697188835449, 'epoch': 0.33}
+ 33%|███▎      | 2241/6779 [1:23:03<2:45:20,  2.19s/it] 33%|███▎      | 2242/6779 [1:23:05<2:46:01,  2.20s/it]                                                       {'loss': 1.6306, 'learning_rate': 0.000306790189896258, 'epoch': 0.33}
+ 33%|███▎      | 2242/6779 [1:23:05<2:46:01,  2.20s/it] 33%|███▎      | 2243/6779 [1:23:07<2:46:49,  2.21s/it]                                                       {'loss': 1.8208, 'learning_rate': 0.00030671063728199136, 'epoch': 0.33}
+ 33%|███▎      | 2243/6779 [1:23:07<2:46:49,  2.21s/it] 33%|███▎      | 2244/6779 [1:23:09<2:48:17,  2.23s/it]                                                       {'loss': 1.8369, 'learning_rate': 0.0003066310610583457, 'epoch': 0.33}
+ 33%|███▎      | 2244/6779 [1:23:09<2:48:17,  2.23s/it] 33%|███▎      | 2245/6779 [1:23:12<2:47:23,  2.22s/it]                                                       {'loss': 1.7201, 'learning_rate': 0.00030655146124292706, 'epoch': 0.33}
+ 33%|███▎      | 2245/6779 [1:23:12<2:47:23,  2.22s/it] 33%|███▎      | 2246/6779 [1:23:14<2:50:04,  2.25s/it]                                                       {'loss': 1.8017, 'learning_rate': 0.00030647183785334654, 'epoch': 0.33}
+ 33%|███▎      | 2246/6779 [1:23:14<2:50:04,  2.25s/it] 33%|███▎      | 2247/6779 [1:23:16<2:50:11,  2.25s/it]                                                       {'loss': 1.8814, 'learning_rate': 0.0003063921909072206, 'epoch': 0.33}
+ 33%|███▎      | 2247/6779 [1:23:16<2:50:11,  2.25s/it] 33%|███▎      | 2248/6779 [1:23:18<2:44:15,  2.18s/it]                                                       {'loss': 1.6655, 'learning_rate': 0.00030631252042217084, 'epoch': 0.33}
+ 33%|███▎      | 2248/6779 [1:23:18<2:44:15,  2.18s/it] 33%|███▎      | 2249/6779 [1:23:20<2:42:03,  2.15s/it]                                                       {'loss': 1.6843, 'learning_rate': 0.0003062328264158242, 'epoch': 0.33}
+ 33%|███▎      | 2249/6779 [1:23:20<2:42:03,  2.15s/it] 33%|███▎      | 2250/6779 [1:23:23<2:47:14,  2.22s/it]                                                       {'loss': 1.6878, 'learning_rate': 0.0003061531089058127, 'epoch': 0.33}
+ 33%|███▎      | 2250/6779 [1:23:23<2:47:14,  2.22s/it] 33%|███▎      | 2251/6779 [1:23:25<2:44:42,  2.18s/it]                                                       {'loss': 1.7302, 'learning_rate': 0.00030607336790977336, 'epoch': 0.33}
+ 33%|███▎      | 2251/6779 [1:23:25<2:44:42,  2.18s/it] 33%|███▎      | 2252/6779 [1:23:29<3:22:18,  2.68s/it]                                                       {'loss': 1.6636, 'learning_rate': 0.0003059936034453489, 'epoch': 0.33}
+ 33%|███▎      | 2252/6779 [1:23:29<3:22:18,  2.68s/it] 33%|███▎      | 2253/6779 [1:23:31<3:10:19,  2.52s/it]                                                       {'loss': 1.8216, 'learning_rate': 0.0003059138155301868, 'epoch': 0.33}
+ 33%|███▎      | 2253/6779 [1:23:31<3:10:19,  2.52s/it] 33%|███▎      | 2254/6779 [1:23:33<3:04:25,  2.45s/it]                                                       {'loss': 1.7926, 'learning_rate': 0.00030583400418193984, 'epoch': 0.33}
+ 33%|███▎      | 2254/6779 [1:23:33<3:04:25,  2.45s/it] 33%|███▎      | 2255/6779 [1:23:35<2:58:11,  2.36s/it]                                                       {'loss': 1.5939, 'learning_rate': 0.00030575416941826613, 'epoch': 0.33}
+ 33%|███▎      | 2255/6779 [1:23:35<2:58:11,  2.36s/it] 33%|███▎      | 2256/6779 [1:23:37<2:53:12,  2.30s/it]                                                       {'loss': 1.8611, 'learning_rate': 0.0003056743112568288, 'epoch': 0.33}
+ 33%|███▎      | 2256/6779 [1:23:37<2:53:12,  2.30s/it] 33%|███▎      | 2257/6779 [1:23:40<2:54:46,  2.32s/it]                                                       {'loss': 1.7131, 'learning_rate': 0.00030559442971529624, 'epoch': 0.33}
+ 33%|███▎      | 2257/6779 [1:23:40<2:54:46,  2.32s/it] 33%|███▎      | 2258/6779 [1:23:42<2:51:05,  2.27s/it]                                                       {'loss': 1.7386, 'learning_rate': 0.0003055145248113419, 'epoch': 0.33}
+ 33%|███▎      | 2258/6779 [1:23:42<2:51:05,  2.27s/it] 33%|███▎      | 2259/6779 [1:23:44<2:46:19,  2.21s/it]                                                       {'loss': 1.6317, 'learning_rate': 0.00030543459656264454, 'epoch': 0.33}
+ 33%|███▎      | 2259/6779 [1:23:44<2:46:19,  2.21s/it] 33%|███▎      | 2260/6779 [1:23:46<2:46:43,  2.21s/it]                                                       {'loss': 1.6881, 'learning_rate': 0.000305354644986888, 'epoch': 0.33}
+ 33%|███▎      | 2260/6779 [1:23:46<2:46:43,  2.21s/it] 33%|███▎      | 2261/6779 [1:23:48<2:44:15,  2.18s/it]                                                       {'loss': 1.7415, 'learning_rate': 0.0003052746701017613, 'epoch': 0.33}
+ 33%|███▎      | 2261/6779 [1:23:48<2:44:15,  2.18s/it] 33%|███▎      | 2262/6779 [1:23:50<2:45:39,  2.20s/it]                                                       {'loss': 1.6416, 'learning_rate': 0.0003051946719249586, 'epoch': 0.33}
+ 33%|███▎      | 2262/6779 [1:23:50<2:45:39,  2.20s/it] 33%|███▎      | 2263/6779 [1:23:53<3:01:30,  2.41s/it]                                                       {'loss': 1.6744, 'learning_rate': 0.00030511465047417934, 'epoch': 0.33}
+ 33%|███▎      | 2263/6779 [1:23:53<3:01:30,  2.41s/it] 33%|███▎      | 2264/6779 [1:23:56<2:55:02,  2.33s/it]                                                       {'loss': 1.7008, 'learning_rate': 0.0003050346057671279, 'epoch': 0.33}
+ 33%|███▎      | 2264/6779 [1:23:56<2:55:02,  2.33s/it] 33%|███▎      | 2265/6779 [1:23:58<2:49:51,  2.26s/it]                                                       {'loss': 1.544, 'learning_rate': 0.00030495453782151396, 'epoch': 0.33}
+ 33%|███▎      | 2265/6779 [1:23:58<2:49:51,  2.26s/it] 33%|███▎      | 2266/6779 [1:24:00<2:56:14,  2.34s/it]                                                       {'loss': 1.68, 'learning_rate': 0.0003048744466550523, 'epoch': 0.33}
+ 33%|███▎      | 2266/6779 [1:24:00<2:56:14,  2.34s/it] 33%|███▎      | 2267/6779 [1:24:02<2:51:44,  2.28s/it]                                                       {'loss': 1.6806, 'learning_rate': 0.0003047943322854627, 'epoch': 0.33}
+ 33%|███▎      | 2267/6779 [1:24:02<2:51:44,  2.28s/it] 33%|███▎      | 2268/6779 [1:24:04<2:47:08,  2.22s/it]                                                       {'loss': 1.8234, 'learning_rate': 0.00030471419473047034, 'epoch': 0.33}
+ 33%|███▎      | 2268/6779 [1:24:04<2:47:08,  2.22s/it] 33%|███▎      | 2269/6779 [1:24:07<2:50:42,  2.27s/it]                                                       {'loss': 1.7955, 'learning_rate': 0.0003046340340078054, 'epoch': 0.33}
+ 33%|███▎      | 2269/6779 [1:24:07<2:50:42,  2.27s/it] 33%|███▎      | 2270/6779 [1:24:09<2:49:11,  2.25s/it]                                                       {'loss': 1.8255, 'learning_rate': 0.00030455385013520306, 'epoch': 0.33}
+ 33%|███▎      | 2270/6779 [1:24:09<2:49:11,  2.25s/it] 34%|███▎      | 2271/6779 [1:24:11<2:51:48,  2.29s/it]                                                       {'loss': 1.8485, 'learning_rate': 0.0003044736431304039, 'epoch': 0.34}
+ 34%|███▎      | 2271/6779 [1:24:11<2:51:48,  2.29s/it] 34%|███▎      | 2272/6779 [1:24:13<2:48:32,  2.24s/it]                                                       {'loss': 1.8019, 'learning_rate': 0.0003043934130111533, 'epoch': 0.34}
+ 34%|███▎      | 2272/6779 [1:24:13<2:48:32,  2.24s/it] 34%|███▎      | 2273/6779 [1:24:16<2:50:37,  2.27s/it]                                                       {'loss': 1.517, 'learning_rate': 0.000304313159795202, 'epoch': 0.34}
+ 34%|███▎      | 2273/6779 [1:24:16<2:50:37,  2.27s/it] 34%|███▎      | 2274/6779 [1:24:18<2:46:16,  2.21s/it]                                                       {'loss': 1.836, 'learning_rate': 0.0003042328835003057, 'epoch': 0.34}
+ 34%|███▎      | 2274/6779 [1:24:18<2:46:16,  2.21s/it] 34%|███▎      | 2275/6779 [1:24:20<2:42:56,  2.17s/it]                                                       {'loss': 1.7349, 'learning_rate': 0.0003041525841442253, 'epoch': 0.34}
+ 34%|███▎      | 2275/6779 [1:24:20<2:42:56,  2.17s/it] 34%|███▎      | 2276/6779 [1:24:22<2:46:18,  2.22s/it]                                                       {'loss': 1.7473, 'learning_rate': 0.0003040722617447268, 'epoch': 0.34}
+ 34%|███▎      | 2276/6779 [1:24:22<2:46:18,  2.22s/it] 34%|███▎      | 2277/6779 [1:24:24<2:42:12,  2.16s/it]                                                       {'loss': 1.8429, 'learning_rate': 0.0003039919163195813, 'epoch': 0.34}
+ 34%|███▎      | 2277/6779 [1:24:24<2:42:12,  2.16s/it] 34%|███▎      | 2278/6779 [1:24:26<2:40:50,  2.14s/it]                                                       {'loss': 1.882, 'learning_rate': 0.00030391154788656486, 'epoch': 0.34}
+ 34%|███▎      | 2278/6779 [1:24:26<2:40:50,  2.14s/it] 34%|███▎      | 2279/6779 [1:24:29<2:41:10,  2.15s/it]                                                       {'loss': 1.5029, 'learning_rate': 0.00030383115646345874, 'epoch': 0.34}
+ 34%|███▎      | 2279/6779 [1:24:29<2:41:10,  2.15s/it] 34%|███▎      | 2280/6779 [1:24:31<2:51:56,  2.29s/it]                                                       {'loss': 1.637, 'learning_rate': 0.00030375074206804935, 'epoch': 0.34}
+ 34%|███▎      | 2280/6779 [1:24:31<2:51:56,  2.29s/it] 34%|███▎      | 2281/6779 [1:24:34<2:52:07,  2.30s/it]                                                       {'loss': 1.6749, 'learning_rate': 0.00030367030471812814, 'epoch': 0.34}
+ 34%|███▎      | 2281/6779 [1:24:34<2:52:07,  2.30s/it] 34%|███▎      | 2282/6779 [1:24:36<2:47:48,  2.24s/it]                                                       {'loss': 1.6641, 'learning_rate': 0.00030358984443149147, 'epoch': 0.34}
+ 34%|███▎      | 2282/6779 [1:24:36<2:47:48,  2.24s/it] 34%|███▎      | 2283/6779 [1:24:38<2:48:59,  2.26s/it]                                                       {'loss': 1.7489, 'learning_rate': 0.00030350936122594096, 'epoch': 0.34}
+ 34%|███▎      | 2283/6779 [1:24:38<2:48:59,  2.26s/it] 34%|███▎      | 2284/6779 [1:24:40<2:53:04,  2.31s/it]                                                       {'loss': 1.8625, 'learning_rate': 0.0003034288551192834, 'epoch': 0.34}
+ 34%|███▎      | 2284/6779 [1:24:40<2:53:04,  2.31s/it] 34%|███▎      | 2285/6779 [1:24:43<2:53:19,  2.31s/it]                                                       {'loss': 1.7366, 'learning_rate': 0.0003033483261293303, 'epoch': 0.34}
+ 34%|███▎      | 2285/6779 [1:24:43<2:53:19,  2.31s/it] 34%|███▎      | 2286/6779 [1:24:45<2:50:22,  2.28s/it]                                                       {'loss': 1.7835, 'learning_rate': 0.00030326777427389854, 'epoch': 0.34}
+ 34%|███▎      | 2286/6779 [1:24:45<2:50:22,  2.28s/it] 34%|███▎      | 2287/6779 [1:24:47<2:48:19,  2.25s/it]                                                       {'loss': 1.785, 'learning_rate': 0.00030318719957081, 'epoch': 0.34}
+ 34%|███▎      | 2287/6779 [1:24:47<2:48:19,  2.25s/it] 34%|███▍      | 2288/6779 [1:24:49<2:43:30,  2.18s/it]                                                       {'loss': 1.7538, 'learning_rate': 0.0003031066020378914, 'epoch': 0.34}
+ 34%|███▍      | 2288/6779 [1:24:49<2:43:30,  2.18s/it] 34%|███▍      | 2289/6779 [1:24:52<2:51:03,  2.29s/it]                                                       {'loss': 1.7797, 'learning_rate': 0.0003030259816929749, 'epoch': 0.34}
+ 34%|███▍      | 2289/6779 [1:24:52<2:51:03,  2.29s/it] 34%|███▍      | 2290/6779 [1:24:54<2:54:50,  2.34s/it]                                                       {'loss': 1.7425, 'learning_rate': 0.00030294533855389737, 'epoch': 0.34}
+ 34%|███▍      | 2290/6779 [1:24:54<2:54:50,  2.34s/it] 34%|███▍      | 2291/6779 [1:24:56<2:48:28,  2.25s/it]                                                       {'loss': 1.8594, 'learning_rate': 0.0003028646726385008, 'epoch': 0.34}
+ 34%|███▍      | 2291/6779 [1:24:56<2:48:28,  2.25s/it] 34%|███▍      | 2292/6779 [1:24:58<2:48:17,  2.25s/it]                                                       {'loss': 1.7566, 'learning_rate': 0.00030278398396463237, 'epoch': 0.34}
+ 34%|███▍      | 2292/6779 [1:24:58<2:48:17,  2.25s/it] 34%|███▍      | 2293/6779 [1:25:00<2:44:43,  2.20s/it]                                                       {'loss': 1.7785, 'learning_rate': 0.000302703272550144, 'epoch': 0.34}
+ 34%|███▍      | 2293/6779 [1:25:00<2:44:43,  2.20s/it] 34%|███▍      | 2294/6779 [1:25:03<2:42:41,  2.18s/it]                                                       {'loss': 1.8956, 'learning_rate': 0.00030262253841289305, 'epoch': 0.34}
+ 34%|███▍      | 2294/6779 [1:25:03<2:42:41,  2.18s/it] 34%|███▍      | 2295/6779 [1:25:05<2:42:33,  2.18s/it]                                                       {'loss': 1.9331, 'learning_rate': 0.00030254178157074153, 'epoch': 0.34}
+ 34%|███▍      | 2295/6779 [1:25:05<2:42:33,  2.18s/it] 34%|███▍      | 2296/6779 [1:25:07<2:41:16,  2.16s/it]                                                       {'loss': 1.7571, 'learning_rate': 0.0003024610020415567, 'epoch': 0.34}
+ 34%|███▍      | 2296/6779 [1:25:07<2:41:16,  2.16s/it] 34%|███▍      | 2297/6779 [1:25:09<2:41:58,  2.17s/it]                                                       {'loss': 1.6222, 'learning_rate': 0.0003024610020415567, 'epoch': 0.34}
+ 34%|███��      | 2297/6779 [1:25:09<2:41:58,  2.17s/it] 34%|███▍      | 2298/6779 [1:25:11<2:39:50,  2.14s/it]                                                       {'loss': 1.7898, 'learning_rate': 0.0003023801998432108, 'epoch': 0.34}
+ 34%|███▍      | 2298/6779 [1:25:11<2:39:50,  2.14s/it] 34%|███▍      | 2299/6779 [1:25:13<2:38:50,  2.13s/it]                                                       {'loss': 1.6553, 'learning_rate': 0.00030229937499358096, 'epoch': 0.34}
+ 34%|███▍      | 2299/6779 [1:25:13<2:38:50,  2.13s/it] 34%|███▍      | 2300/6779 [1:25:15<2:39:38,  2.14s/it]                                                       {'loss': 1.826, 'learning_rate': 0.00030221852751054944, 'epoch': 0.34}
+ 34%|███▍      | 2300/6779 [1:25:15<2:39:38,  2.14s/it] 34%|███▍      | 2301/6779 [1:25:18<2:39:01,  2.13s/it]                                                       {'loss': 1.7846, 'learning_rate': 0.0003021376574120035, 'epoch': 0.34}
+ 34%|███▍      | 2301/6779 [1:25:18<2:39:01,  2.13s/it] 34%|███▍      | 2302/6779 [1:25:19<2:35:28,  2.08s/it]                                                       {'loss': 1.7511, 'learning_rate': 0.00030205676471583534, 'epoch': 0.34}
+ 34%|███▍      | 2302/6779 [1:25:19<2:35:28,  2.08s/it] 34%|███▍      | 2303/6779 [1:25:22<2:37:14,  2.11s/it]                                                       {'loss': 1.8142, 'learning_rate': 0.0003019758494399423, 'epoch': 0.34}
+ 34%|███▍      | 2303/6779 [1:25:22<2:37:14,  2.11s/it] 34%|███▍      | 2304/6779 [1:25:24<2:39:44,  2.14s/it]                                                       {'loss': 1.6221, 'learning_rate': 0.0003018949116022265, 'epoch': 0.34}
+ 34%|███▍      | 2304/6779 [1:25:24<2:39:44,  2.14s/it] 34%|███▍      | 2305/6779 [1:25:26<2:46:53,  2.24s/it]                                                       {'loss': 1.5109, 'learning_rate': 0.0003018139512205953, 'epoch': 0.34}
+ 34%|███▍      | 2305/6779 [1:25:26<2:46:53,  2.24s/it] 34%|███▍      | 2306/6779 [1:25:29<2:45:15,  2.22s/it]                                                       {'loss': 1.7615, 'learning_rate': 0.00030173296831296077, 'epoch': 0.34}
+ 34%|███▍      | 2306/6779 [1:25:29<2:45:15,  2.22s/it] 34%|███▍      | 2307/6779 [1:25:31<2:43:35,  2.19s/it]                                                       {'loss': 1.6906, 'learning_rate': 0.0003016519628972403, 'epoch': 0.34}
+ 34%|███▍      | 2307/6779 [1:25:31<2:43:35,  2.19s/it] 34%|███▍      | 2308/6779 [1:25:33<2:41:41,  2.17s/it]                                                       {'loss': 1.7006, 'learning_rate': 0.0003015709349913558, 'epoch': 0.34}
+ 34%|███▍      | 2308/6779 [1:25:33<2:41:41,  2.17s/it] 34%|███▍      | 2309/6779 [1:25:35<2:45:51,  2.23s/it]                                                       {'loss': 1.773, 'learning_rate': 0.0003014898846132347, 'epoch': 0.34}
+ 34%|███▍      | 2309/6779 [1:25:35<2:45:51,  2.23s/it] 34%|███▍      | 2310/6779 [1:25:37<2:47:00,  2.24s/it]                                                       {'loss': 1.618, 'learning_rate': 0.00030140881178080905, 'epoch': 0.34}
+ 34%|███▍      | 2310/6779 [1:25:37<2:47:00,  2.24s/it] 34%|███▍      | 2311/6779 [1:25:39<2:43:01,  2.19s/it]                                                       {'loss': 1.7345, 'learning_rate': 0.0003013277165120159, 'epoch': 0.34}
+ 34%|███▍      | 2311/6779 [1:25:39<2:43:01,  2.19s/it] 34%|███▍      | 2312/6779 [1:25:42<2:44:13,  2.21s/it]                                                       {'loss': 1.8366, 'learning_rate': 0.00030124659882479733, 'epoch': 0.34}
+ 34%|███▍      | 2312/6779 [1:25:42<2:44:13,  2.21s/it] 34%|███▍      | 2313/6779 [1:25:44<2:42:24,  2.18s/it]                                                       {'loss': 1.6014, 'learning_rate': 0.0003011654587371004, 'epoch': 0.34}
+ 34%|███▍      | 2313/6779 [1:25:44<2:42:24,  2.18s/it] 34%|███▍      | 2314/6779 [1:25:46<2:40:49,  2.16s/it]                                                       {'loss': 1.6743, 'learning_rate': 0.000301084296266877, 'epoch': 0.34}
+ 34%|███▍      | 2314/6779 [1:25:46<2:40:49,  2.16s/it] 34%|███▍      | 2315/6779 [1:25:48<2:39:25,  2.14s/it]                                                       {'loss': 1.7666, 'learning_rate': 0.00030100311143208415, 'epoch': 0.34}
+ 34%|███▍      | 2315/6779 [1:25:48<2:39:25,  2.14s/it] 34%|███▍      | 2316/6779 [1:25:50<2:40:26,  2.16s/it]                                                       {'loss': 1.7231, 'learning_rate': 0.0003009219042506837, 'epoch': 0.34}
+ 34%|███▍      | 2316/6779 [1:25:50<2:40:26,  2.16s/it] 34%|███▍      | 2317/6779 [1:25:52<2:39:40,  2.15s/it]                                                       {'loss': 1.8799, 'learning_rate': 0.00030084067474064245, 'epoch': 0.34}
+ 34%|███▍      | 2317/6779 [1:25:52<2:39:40,  2.15s/it] 34%|███▍      | 2318/6779 [1:25:55<2:41:34,  2.17s/it]                                                       {'loss': 1.6812, 'learning_rate': 0.0003007594229199322, 'epoch': 0.34}
+ 34%|███▍      | 2318/6779 [1:25:55<2:41:34,  2.17s/it] 34%|███▍      | 2319/6779 [1:25:57<2:41:19,  2.17s/it]                                                       {'loss': 1.7505, 'learning_rate': 0.0003006781488065296, 'epoch': 0.34}
+ 34%|███▍      | 2319/6779 [1:25:57<2:41:19,  2.17s/it] 34%|███▍      | 2320/6779 [1:25:59<2:38:10,  2.13s/it]                                                       {'loss': 1.7822, 'learning_rate': 0.0003005968524184164, 'epoch': 0.34}
+ 34%|███▍      | 2320/6779 [1:25:59<2:38:10,  2.13s/it] 34%|███▍      | 2321/6779 [1:26:01<2:37:39,  2.12s/it]                                                       {'loss': 1.6462, 'learning_rate': 0.000300515533773579, 'epoch': 0.34}
+ 34%|███▍      | 2321/6779 [1:26:01<2:37:39,  2.12s/it] 34%|███▍      | 2322/6779 [1:26:03<2:35:17,  2.09s/it]                                                       {'loss': 1.7105, 'learning_rate': 0.00030043419289000906, 'epoch': 0.34}
+ 34%|███▍      | 2322/6779 [1:26:03<2:35:17,  2.09s/it] 34%|███▍      | 2323/6779 [1:26:05<2:37:31,  2.12s/it]                                                       {'loss': 1.8376, 'learning_rate': 0.00030035282978570276, 'epoch': 0.34}
+ 34%|███▍      | 2323/6779 [1:26:05<2:37:31,  2.12s/it] 34%|███▍      | 2324/6779 [1:26:07<2:42:44,  2.19s/it]                                                       {'loss': 1.6605, 'learning_rate': 0.00030027144447866157, 'epoch': 0.34}
+ 34%|███▍      | 2324/6779 [1:26:07<2:42:44,  2.19s/it] 34%|███▍      | 2325/6779 [1:26:10<2:43:14,  2.20s/it]                                                       {'loss': 1.6142, 'learning_rate': 0.0003001900369868917, 'epoch': 0.34}
+ 34%|███▍      | 2325/6779 [1:26:10<2:43:14,  2.20s/it] 34%|███▍      | 2326/6779 [1:26:12<2:41:18,  2.17s/it]                                                       {'loss': 1.7499, 'learning_rate': 0.0003001086073284043, 'epoch': 0.34}
+ 34%|███▍      | 2326/6779 [1:26:12<2:41:18,  2.17s/it] 34%|███▍      | 2327/6779 [1:26:14<2:48:33,  2.27s/it]                                                       {'loss': 1.8937, 'learning_rate': 0.0003000271555212154, 'epoch': 0.34}
+ 34%|███▍      | 2327/6779 [1:26:14<2:48:33,  2.27s/it] 34%|███▍      | 2328/6779 [1:26:16<2:45:15,  2.23s/it]                                                       {'loss': 1.794, 'learning_rate': 0.00029994568158334594, 'epoch': 0.34}
+ 34%|███▍      | 2328/6779 [1:26:16<2:45:15,  2.23s/it] 34%|███▍      | 2329/6779 [1:26:18<2:40:30,  2.16s/it]                                                       {'loss': 1.7652, 'learning_rate': 0.0002998641855328218, 'epoch': 0.34}
+ 34%|███▍      | 2329/6779 [1:26:18<2:40:30,  2.16s/it] 34%|███▍      | 2330/6779 [1:26:21<2:38:36,  2.14s/it]                                                       {'loss': 1.6811, 'learning_rate': 0.0002997826673876736, 'epoch': 0.34}
+ 34%|███▍      | 2330/6779 [1:26:21<2:38:36,  2.14s/it] 34%|███▍      | 2331/6779 [1:26:23<2:35:43,  2.10s/it]                                                       {'loss': 1.6801, 'learning_rate': 0.0002997011271659371, 'epoch': 0.34}
+ 34%|███▍      | 2331/6779 [1:26:23<2:35:43,  2.10s/it] 34%|███▍      | 2332/6779 [1:26:25<2:35:43,  2.10s/it]                                                       {'loss': 1.7425, 'learning_rate': 0.0002996195648856528, 'epoch': 0.34}
+ 34%|███▍      | 2332/6779 [1:26:25<2:35:43,  2.10s/it] 34%|███▍      | 2333/6779 [1:26:27<2:38:19,  2.14s/it]                                                       {'loss': 1.843, 'learning_rate': 0.00029953798056486596, 'epoch': 0.34}
+ 34%|███▍      | 2333/6779 [1:26:27<2:38:19,  2.14s/it] 34%|███▍      | 2334/6779 [1:26:29<2:40:03,  2.16s/it]                                                       {'loss': 1.7017, 'learning_rate': 0.0002994563742216269, 'epoch': 0.34}
+ 34%|███▍      | 2334/6779 [1:26:29<2:40:03,  2.16s/it] 34%|███▍      | 2335/6779 [1:26:31<2:40:35,  2.17s/it]                                                       {'loss': 1.676, 'learning_rate': 0.0002993747458739909, 'epoch': 0.34}
+ 34%|███▍      | 2335/6779 [1:26:31<2:40:35,  2.17s/it] 34%|███▍      | 2336/6779 [1:26:33<2:39:33,  2.15s/it]                                                       {'loss': 1.6387, 'learning_rate': 0.0002992930955400178, 'epoch': 0.34}
+ 34%|███▍      | 2336/6779 [1:26:33<2:39:33,  2.15s/it] 34%|███▍      | 2337/6779 [1:26:35<2:38:05,  2.14s/it]                                                       {'loss': 1.8372, 'learning_rate': 0.00029921142323777254, 'epoch': 0.34}
+ 34%|███▍      | 2337/6779 [1:26:35<2:38:05,  2.14s/it] 34%|███▍      | 2338/6779 [1:26:38<2:41:36,  2.18s/it]                                                       {'loss': 1.8247, 'learning_rate': 0.0002991297289853247, 'epoch': 0.34}
+ 34%|███▍      | 2338/6779 [1:26:38<2:41:36,  2.18s/it] 35%|███▍      | 2339/6779 [1:26:40<2:39:36,  2.16s/it]                                                       {'loss': 1.9391, 'learning_rate': 0.0002990480128007491, 'epoch': 0.35}
+ 35%|███▍      | 2339/6779 [1:26:40<2:39:36,  2.16s/it] 35%|███▍      | 2340/6779 [1:26:42<2:48:28,  2.28s/it]                                                       {'loss': 1.7478, 'learning_rate': 0.000298966274702125, 'epoch': 0.35}
+ 35%|███▍      | 2340/6779 [1:26:42<2:48:28,  2.28s/it] 35%|███▍      | 2341/6779 [1:26:45<2:45:59,  2.24s/it]                                                       {'loss': 1.8239, 'learning_rate': 0.0002988845147075368, 'epoch': 0.35}
+ 35%|███▍      | 2341/6779 [1:26:45<2:45:59,  2.24s/it] 35%|███▍      | 2342/6779 [1:26:47<2:47:17,  2.26s/it]                                                       {'loss': 1.9829, 'learning_rate': 0.0002988027328350736, 'epoch': 0.35}
+ 35%|███▍      | 2342/6779 [1:26:47<2:47:17,  2.26s/it] 35%|███▍      | 2343/6779 [1:26:49<2:47:16,  2.26s/it]                                                       {'loss': 1.6645, 'learning_rate': 0.0002987209291028293, 'epoch': 0.35}
+ 35%|███▍      | 2343/6779 [1:26:49<2:47:16,  2.26s/it] 35%|███▍      | 2344/6779 [1:26:51<2:43:56,  2.22s/it]                                                       {'loss': 1.8642, 'learning_rate': 0.0002986391035289028, 'epoch': 0.35}
+ 35%|███▍      | 2344/6779 [1:26:51<2:43:56,  2.22s/it] 35%|███▍      | 2345/6779 [1:26:53<2:42:36,  2.20s/it]                                                       {'loss': 1.7456, 'learning_rate': 0.0002985572561313977, 'epoch': 0.35}
+ 35%|███▍      | 2345/6779 [1:26:53<2:42:36,  2.20s/it] 35%|███▍      | 2346/6779 [1:26:55<2:37:43,  2.13s/it]                                                       {'loss': 1.6965, 'learning_rate': 0.0002984753869284225, 'epoch': 0.35}
+ 35%|███▍      | 2346/6779 [1:26:55<2:37:43,  2.13s/it] 35%|███▍      | 2347/6779 [1:26:58<2:44:44,  2.23s/it]                                                       {'loss': 1.8397, 'learning_rate': 0.0002983934959380904, 'epoch': 0.35}
+ 35%|███▍      | 2347/6779 [1:26:58<2:44:44,  2.23s/it] 35%|███▍      | 2348/6779 [1:27:00<2:49:05,  2.29s/it]                                                       {'loss': 1.8373, 'learning_rate': 0.00029831158317851963, 'epoch': 0.35}
+ 35%|███▍      | 2348/6779 [1:27:00<2:49:05,  2.29s/it] 35%|███▍      | 2349/6779 [1:27:02<2:44:32,  2.23s/it]                                                       {'loss': 1.7215, 'learning_rate': 0.000298229648667833, 'epoch': 0.35}
+ 35%|███▍      | 2349/6779 [1:27:02<2:44:32,  2.23s/it] 35%|███▍      | 2350/6779 [1:27:04<2:42:01,  2.19s/it]                                                       {'loss': 1.9098, 'learning_rate': 0.00029814769242415834, 'epoch': 0.35}
+ 35%|███▍      | 2350/6779 [1:27:04<2:42:01,  2.19s/it] 35%|███▍      | 2351/6779 [1:27:07<2:43:59,  2.22s/it]                                                       {'loss': 1.681, 'learning_rate': 0.00029806571446562823, 'epoch': 0.35}
+ 35%|███▍      | 2351/6779 [1:27:07<2:43:59,  2.22s/it] 35%|███▍      | 2352/6779 [1:27:09<2:42:24,  2.20s/it]                                                       {'loss': 1.7317, 'learning_rate': 0.0002979837148103799, 'epoch': 0.35}
+ 35%|███▍      | 2352/6779 [1:27:09<2:42:24,  2.20s/it] 35%|███▍      | 2353/6779 [1:27:11<2:45:31,  2.24s/it]                                                       {'loss': 1.7801, 'learning_rate': 0.00029790169347655574, 'epoch': 0.35}
+ 35%|███▍      | 2353/6779 [1:27:11<2:45:31,  2.24s/it] 35%|███▍      | 2354/6779 [1:27:14<2:55:23,  2.38s/it]                                                       {'loss': 1.8464, 'learning_rate': 0.0002978196504823024, 'epoch': 0.35}
+ 35%|███▍      | 2354/6779 [1:27:14<2:55:23,  2.38s/it] 35%|███▍      | 2355/6779 [1:27:16<2:50:19,  2.31s/it]                                                       {'loss': 1.7806, 'learning_rate': 0.0002977375858457718, 'epoch': 0.35}
+ 35%|███▍      | 2355/6779 [1:27:16<2:50:19,  2.31s/it] 35%|███▍      | 2356/6779 [1:27:18<2:49:31,  2.30s/it]                                                       {'loss': 1.6938, 'learning_rate': 0.0002976554995851205, 'epoch': 0.35}
+ 35%|███▍      | 2356/6779 [1:27:18<2:49:31,  2.30s/it] 35%|███▍      | 2357/6779 [1:27:20<2:43:28,  2.22s/it]                                                       {'loss': 1.707, 'learning_rate': 0.0002975733917185097, 'epoch': 0.35}
+ 35%|███▍      | 2357/6779 [1:27:20<2:43:28,  2.22s/it] 35%|███▍      | 2358/6779 [1:27:23<2:41:29,  2.19s/it]                                                       {'loss': 1.7436, 'learning_rate': 0.0002974912622641055, 'epoch': 0.35}
+ 35%|███▍      | 2358/6779 [1:27:23<2:41:29,  2.19s/it] 35%|███▍      | 2359/6779 [1:27:25<2:38:55,  2.16s/it]                                                       {'loss': 1.6292, 'learning_rate': 0.0002974091112400789, 'epoch': 0.35}
+ 35%|███▍      | 2359/6779 [1:27:25<2:38:55,  2.16s/it] 35%|███▍      | 2360/6779 [1:27:27<2:40:06,  2.17s/it]                                                       {'loss': 1.7448, 'learning_rate': 0.00029732693866460545, 'epoch': 0.35}
+ 35%|███▍      | 2360/6779 [1:27:27<2:40:06,  2.17s/it] 35%|███▍      | 2361/6779 [1:27:29<2:44:00,  2.23s/it]                                                       {'loss': 1.7517, 'learning_rate': 0.0002972447445558656, 'epoch': 0.35}
+ 35%|███▍      | 2361/6779 [1:27:29<2:44:00,  2.23s/it] 35%|███▍      | 2362/6779 [1:27:31<2:40:37,  2.18s/it]                                                       {'loss': 1.74, 'learning_rate': 0.0002971625289320445, 'epoch': 0.35}
+ 35%|███▍      | 2362/6779 [1:27:31<2:40:37,  2.18s/it] 35%|███▍      | 2363/6779 [1:27:33<2:37:33,  2.14s/it]                                                       {'loss': 1.8153, 'learning_rate': 0.0002970802918113321, 'epoch': 0.35}
+ 35%|███▍      | 2363/6779 [1:27:33<2:37:33,  2.14s/it] 35%|███▍      | 2364/6779 [1:27:37<3:04:17,  2.50s/it]                                                       {'loss': 1.5963, 'learning_rate': 0.00029699803321192304, 'epoch': 0.35}
+ 35%|███▍      | 2364/6779 [1:27:37<3:04:17,  2.50s/it] 35%|███▍      | 2365/6779 [1:27:39<2:57:29,  2.41s/it]                                                       {'loss': 1.6281, 'learning_rate': 0.00029691575315201685, 'epoch': 0.35}
+ 35%|███▍      | 2365/6779 [1:27:39<2:57:29,  2.41s/it] 35%|███▍      | 2366/6779 [1:27:42<3:10:09,  2.59s/it]                                                       {'loss': 1.7254, 'learning_rate': 0.00029683345164981773, 'epoch': 0.35}
+ 35%|███▍      | 2366/6779 [1:27:42<3:10:09,  2.59s/it] 35%|███▍      | 2367/6779 [1:27:44<3:11:23,  2.60s/it]                                                       {'loss': 1.6897, 'learning_rate': 0.0002967511287235345, 'epoch': 0.35}
+ 35%|███▍      | 2367/6779 [1:27:44<3:11:23,  2.60s/it] 35%|███▍      | 2368/6779 [1:27:47<3:03:23,  2.49s/it]                                                       {'loss': 1.7403, 'learning_rate': 0.000296668784391381, 'epoch': 0.35}
+ 35%|███▍      | 2368/6779 [1:27:47<3:03:23,  2.49s/it] 35%|███▍      | 2369/6779 [1:27:49<2:55:36,  2.39s/it]                                                       {'loss': 1.8458, 'learning_rate': 0.00029658641867157554, 'epoch': 0.35}
+ 35%|███▍      | 2369/6779 [1:27:49<2:55:36,  2.39s/it] 35%|███▍      | 2370/6779 [1:27:51<2:51:43,  2.34s/it]                                                       {'loss': 1.6575, 'learning_rate': 0.00029650403158234124, 'epoch': 0.35}
+ 35%|███▍      | 2370/6779 [1:27:51<2:51:43,  2.34s/it] 35%|███▍      | 2371/6779 [1:27:53<2:47:07,  2.27s/it]                                                       {'loss': 1.6983, 'learning_rate': 0.000296421623141906, 'epoch': 0.35}
+ 35%|███▍      | 2371/6779 [1:27:53<2:47:07,  2.27s/it] 35%|███▍      | 2372/6779 [1:27:55<2:44:18,  2.24s/it]                                                       {'loss': 1.7076, 'learning_rate': 0.00029633919336850254, 'epoch': 0.35}
+ 35%|███▍      | 2372/6779 [1:27:55<2:44:18,  2.24s/it] 35%|███▌      | 2373/6779 [1:27:58<2:48:53,  2.30s/it]                                                       {'loss': 1.7919, 'learning_rate': 0.00029625674228036803, 'epoch': 0.35}
+ 35%|███▌      | 2373/6779 [1:27:58<2:48:53,  2.30s/it] 35%|███▌      | 2374/6779 [1:28:00<2:45:36,  2.26s/it]                                                       {'loss': 1.7098, 'learning_rate': 0.0002961742698957445, 'epoch': 0.35}
+ 35%|███▌      | 2374/6779 [1:28:00<2:45:36,  2.26s/it] 35%|███▌      | 2375/6779 [1:28:02<2:43:01,  2.22s/it]                                                       {'loss': 1.6209, 'learning_rate': 0.0002960917762328788, 'epoch': 0.35}
+ 35%|███▌      | 2375/6779 [1:28:02<2:43:01,  2.22s/it] 35%|███▌      | 2376/6779 [1:28:04<2:42:24,  2.21s/it]                                                       {'loss': 1.6519, 'learning_rate': 0.0002960092613100223, 'epoch': 0.35}
+ 35%|███▌      | 2376/6779 [1:28:04<2:42:24,  2.21s/it] 35%|███▌      | 2377/6779 [1:28:07<2:42:31,  2.22s/it]                                                       {'loss': 1.8932, 'learning_rate': 0.0002959267251454312, 'epoch': 0.35}
+ 35%|███▌      | 2377/6779 [1:28:07<2:42:31,  2.22s/it] 35%|███▌      | 2378/6779 [1:28:09<2:41:50,  2.21s/it]                                                       {'loss': 1.6064, 'learning_rate': 0.00029584416775736634, 'epoch': 0.35}
+ 35%|███▌      | 2378/6779 [1:28:09<2:41:50,  2.21s/it] 35%|███▌      | 2379/6779 [1:28:11<2:35:02,  2.11s/it]                                                       {'loss': 1.6869, 'learning_rate': 0.0002957615891640932, 'epoch': 0.35}
+ 35%|███▌      | 2379/6779 [1:28:11<2:35:02,  2.11s/it] 35%|███▌      | 2380/6779 [1:28:13<2:42:19,  2.21s/it]                                                       {'loss': 1.859, 'learning_rate': 0.0002956789893838821, 'epoch': 0.35}
+ 35%|███▌      | 2380/6779 [1:28:13<2:42:19,  2.21s/it] 35%|███▌      | 2381/6779 [1:28:15<2:41:56,  2.21s/it]                                                       {'loss': 1.8283, 'learning_rate': 0.00029559636843500805, 'epoch': 0.35}
+ 35%|███▌      | 2381/6779 [1:28:15<2:41:56,  2.21s/it] 35%|███▌      | 2382/6779 [1:28:17<2:37:55,  2.16s/it]                                                       {'loss': 1.8691, 'learning_rate': 0.00029551372633575057, 'epoch': 0.35}
+ 35%|███▌      | 2382/6779 [1:28:17<2:37:55,  2.16s/it] 35%|███▌      | 2383/6779 [1:28:19<2:37:28,  2.15s/it]                                                       {'loss': 1.8261, 'learning_rate': 0.00029543106310439386, 'epoch': 0.35}
+ 35%|███▌      | 2383/6779 [1:28:19<2:37:28,  2.15s/it] 35%|███▌      | 2384/6779 [1:28:22<2:37:03,  2.14s/it]                                                       {'loss': 1.8267, 'learning_rate': 0.00029534837875922707, 'epoch': 0.35}
+ 35%|███▌      | 2384/6779 [1:28:22<2:37:03,  2.14s/it] 35%|███▌      | 2385/6779 [1:28:24<2:37:02,  2.14s/it]                                                       {'loss': 1.6479, 'learning_rate': 0.0002952656733185438, 'epoch': 0.35}
+ 35%|███▌      | 2385/6779 [1:28:24<2:37:02,  2.14s/it] 35%|███▌      | 2386/6779 [1:28:26<2:34:19,  2.11s/it]                                                       {'loss': 1.502, 'learning_rate': 0.00029518294680064224, 'epoch': 0.35}
+ 35%|███▌      | 2386/6779 [1:28:26<2:34:19,  2.11s/it] 35%|███▌      | 2387/6779 [1:28:28<2:35:13,  2.12s/it]                                                       {'loss': 1.8225, 'learning_rate': 0.0002951001992238255, 'epoch': 0.35}
+ 35%|███▌      | 2387/6779 [1:28:28<2:35:13,  2.12s/it] 35%|███▌      | 2388/6779 [1:28:30<2:37:32,  2.15s/it]                                                       {'loss': 1.6595, 'learning_rate': 0.00029501743060640113, 'epoch': 0.35}
+ 35%|███▌      | 2388/6779 [1:28:30<2:37:32,  2.15s/it] 35%|███▌      | 2389/6779 [1:28:32<2:40:18,  2.19s/it]                                                       {'loss': 1.5535, 'learning_rate': 0.00029493464096668143, 'epoch': 0.35}
+ 35%|███▌      | 2389/6779 [1:28:32<2:40:18,  2.19s/it] 35%|███▌      | 2390/6779 [1:28:35<2:40:29,  2.19s/it]                                                       {'loss': 1.6986, 'learning_rate': 0.0002948518303229833, 'epoch': 0.35}
+ 35%|███▌      | 2390/6779 [1:28:35<2:40:29,  2.19s/it] 35%|███▌      | 2391/6779 [1:28:37<2:37:09,  2.15s/it]                                                       {'loss': 1.8524, 'learning_rate': 0.0002947689986936284, 'epoch': 0.35}
+ 35%|███▌      | 2391/6779 [1:28:37<2:37:09,  2.15s/it] 35%|███▌      | 2392/6779 [1:28:39<2:38:43,  2.17s/it]                                                       {'loss': 1.742, 'learning_rate': 0.0002946861460969429, 'epoch': 0.35}
+ 35%|███▌      | 2392/6779 [1:28:39<2:38:43,  2.17s/it] 35%|███▌      | 2393/6779 [1:28:41<2:39:40,  2.18s/it]                                                       {'loss': 1.6215, 'learning_rate': 0.00029460327255125777, 'epoch': 0.35}
+ 35%|███▌      | 2393/6779 [1:28:41<2:39:40,  2.18s/it] 35%|███▌      | 2394/6779 [1:28:43<2:40:16,  2.19s/it]                                                       {'loss': 1.8717, 'learning_rate': 0.00029452037807490834, 'epoch': 0.35}
+ 35%|███▌      | 2394/6779 [1:28:43<2:40:16,  2.19s/it] 35%|███▌      | 2395/6779 [1:28:46<2:46:39,  2.28s/it]                                                       {'loss': 1.7523, 'learning_rate': 0.0002944374626862349, 'epoch': 0.35}
+ 35%|███▌      | 2395/6779 [1:28:46<2:46:39,  2.28s/it] 35%|███▌      | 2396/6779 [1:28:48<2:44:29,  2.25s/it]                                                       {'loss': 1.8094, 'learning_rate': 0.0002943545264035821, 'epoch': 0.35}
+ 35%|███▌      | 2396/6779 [1:28:48<2:44:29,  2.25s/it] 35%|███▌      | 2397/6779 [1:28:50<2:45:14,  2.26s/it]                                                       {'loss': 1.6575, 'learning_rate': 0.00029427156924529936, 'epoch': 0.35}
+ 35%|███▌      | 2397/6779 [1:28:50<2:45:14,  2.26s/it] 35%|███▌      | 2398/6779 [1:28:52<2:42:31,  2.23s/it]                                                       {'loss': 1.706, 'learning_rate': 0.0002941885912297407, 'epoch': 0.35}
+ 35%|███▌      | 2398/6779 [1:28:52<2:42:31,  2.23s/it] 35%|███▌      | 2399/6779 [1:28:55<2:45:05,  2.26s/it]                                                       {'loss': 1.7351, 'learning_rate': 0.00029410559237526474, 'epoch': 0.35}
+ 35%|███▌      | 2399/6779 [1:28:55<2:45:05,  2.26s/it] 35%|███▌      | 2400/6779 [1:28:57<2:41:50,  2.22s/it]                                                       {'loss': 1.6914, 'learning_rate': 0.00029402257270023463, 'epoch': 0.35}
+ 35%|███▌      | 2400/6779 [1:28:57<2:41:50,  2.22s/it] 35%|███▌      | 2401/6779 [1:28:59<2:42:34,  2.23s/it]                                                       {'loss': 1.5955, 'learning_rate': 0.00029393953222301827, 'epoch': 0.35}
+ 35%|███▌      | 2401/6779 [1:28:59<2:42:34,  2.23s/it] 35%|███▌      | 2402/6779 [1:29:01<2:41:58,  2.22s/it]                                                       {'loss': 1.7433, 'learning_rate': 0.00029385647096198805, 'epoch': 0.35}
+ 35%|███▌      | 2402/6779 [1:29:01<2:41:58,  2.22s/it] 35%|███▌      | 2403/6779 [1:29:04<2:42:41,  2.23s/it]                                                       {'loss': 1.649, 'learning_rate': 0.00029377338893552105, 'epoch': 0.35}
+ 35%|███▌      | 2403/6779 [1:29:04<2:42:41,  2.23s/it] 35%|███▌      | 2404/6779 [1:29:06<2:39:15,  2.18s/it]                                                       {'loss': 1.8089, 'learning_rate': 0.0002936902861619988, 'epoch': 0.35}
+ 35%|███▌      | 2404/6779 [1:29:06<2:39:15,  2.18s/it] 35%|███▌      | 2405/6779 [1:29:08<2:43:09,  2.24s/it]                                                       {'loss': 1.8165, 'learning_rate': 0.0002936071626598077, 'epoch': 0.35}
+ 35%|███▌      | 2405/6779 [1:29:08<2:43:09,  2.24s/it] 35%|███▌      | 2406/6779 [1:29:10<2:41:51,  2.22s/it]                                                       {'loss': 1.734, 'learning_rate': 0.0002935240184473384, 'epoch': 0.35}
+ 35%|███▌      | 2406/6779 [1:29:10<2:41:51,  2.22s/it] 36%|███▌      | 2407/6779 [1:29:12<2:42:43,  2.23s/it]                                                       {'loss': 1.8245, 'learning_rate': 0.0002934408535429863, 'epoch': 0.36}
+ 36%|███▌      | 2407/6779 [1:29:12<2:42:43,  2.23s/it] 36%|███▌      | 2408/6779 [1:29:15<2:41:05,  2.21s/it]                                                       {'loss': 1.8506, 'learning_rate': 0.0002933576679651514, 'epoch': 0.36}
+ 36%|███▌      | 2408/6779 [1:29:15<2:41:05,  2.21s/it] 36%|███▌      | 2409/6779 [1:29:17<2:39:55,  2.20s/it]                                                       {'loss': 1.6976, 'learning_rate': 0.00029327446173223827, 'epoch': 0.36}
+ 36%|███▌      | 2409/6779 [1:29:17<2:39:55,  2.20s/it] 36%|███▌      | 2410/6779 [1:29:19<2:39:36,  2.19s/it]                                                       {'loss': 1.6506, 'learning_rate': 0.00029319123486265595, 'epoch': 0.36}
+ 36%|███▌      | 2410/6779 [1:29:19<2:39:36,  2.19s/it] 36%|███▌      | 2411/6779 [1:29:21<2:40:04,  2.20s/it]                                                       {'loss': 1.8129, 'learning_rate': 0.00029310798737481805, 'epoch': 0.36}
+ 36%|███▌      | 2411/6779 [1:29:21<2:40:04,  2.20s/it] 36%|███▌      | 2412/6779 [1:29:24<2:44:37,  2.26s/it]                                                       {'loss': 1.5705, 'learning_rate': 0.00029302471928714294, 'epoch': 0.36}
+ 36%|███▌      | 2412/6779 [1:29:24<2:44:37,  2.26s/it] 36%|███▌      | 2413/6779 [1:29:25<2:37:45,  2.17s/it]                                                       {'loss': 1.606, 'learning_rate': 0.0002929414306180534, 'epoch': 0.36}
+ 36%|███▌      | 2413/6779 [1:29:26<2:37:45,  2.17s/it] 36%|███▌      | 2414/6779 [1:29:28<2:36:18,  2.15s/it]                                                       {'loss': 1.7254, 'learning_rate': 0.00029285812138597674, 'epoch': 0.36}
+ 36%|███▌      | 2414/6779 [1:29:28<2:36:18,  2.15s/it] 36%|███▌      | 2415/6779 [1:29:30<2:37:31,  2.17s/it]                                                       {'loss': 1.8198, 'learning_rate': 0.0002927747916093448, 'epoch': 0.36}
+ 36%|███▌      | 2415/6779 [1:29:30<2:37:31,  2.17s/it] 36%|███▌      | 2416/6779 [1:29:32<2:37:30,  2.17s/it]                                                       {'loss': 1.9041, 'learning_rate': 0.0002926914413065941, 'epoch': 0.36}
+ 36%|█��█▌      | 2416/6779 [1:29:32<2:37:30,  2.17s/it] 36%|███▌      | 2417/6779 [1:29:34<2:36:06,  2.15s/it]                                                       {'loss': 1.764, 'learning_rate': 0.00029260807049616563, 'epoch': 0.36}
+ 36%|███▌      | 2417/6779 [1:29:34<2:36:06,  2.15s/it] 36%|███▌      | 2418/6779 [1:29:36<2:36:19,  2.15s/it]                                                       {'loss': 1.866, 'learning_rate': 0.00029252467919650476, 'epoch': 0.36}
+ 36%|███▌      | 2418/6779 [1:29:36<2:36:19,  2.15s/it] 36%|███▌      | 2419/6779 [1:29:38<2:34:48,  2.13s/it]                                                       {'loss': 1.5901, 'learning_rate': 0.0002924412674260617, 'epoch': 0.36}
+ 36%|███▌      | 2419/6779 [1:29:38<2:34:48,  2.13s/it] 36%|███▌      | 2420/6779 [1:29:40<2:35:06,  2.13s/it]                                                       {'loss': 1.5519, 'learning_rate': 0.00029235783520329095, 'epoch': 0.36}
+ 36%|███▌      | 2420/6779 [1:29:40<2:35:06,  2.13s/it] 36%|███▌      | 2421/6779 [1:29:43<2:37:57,  2.17s/it]                                                       {'loss': 1.7261, 'learning_rate': 0.0002922743825466517, 'epoch': 0.36}
+ 36%|███▌      | 2421/6779 [1:29:43<2:37:57,  2.17s/it] 36%|███▌      | 2422/6779 [1:29:45<2:42:15,  2.23s/it]                                                       {'loss': 1.8539, 'learning_rate': 0.00029219090947460756, 'epoch': 0.36}
+ 36%|███▌      | 2422/6779 [1:29:45<2:42:15,  2.23s/it] 36%|███▌      | 2423/6779 [1:29:47<2:38:27,  2.18s/it]                                                       {'loss': 1.9267, 'learning_rate': 0.00029210741600562654, 'epoch': 0.36}
+ 36%|███▌      | 2423/6779 [1:29:47<2:38:27,  2.18s/it] 36%|███▌      | 2424/6779 [1:29:49<2:38:05,  2.18s/it]                                                       {'loss': 1.5395, 'learning_rate': 0.0002920239021581815, 'epoch': 0.36}
+ 36%|███▌      | 2424/6779 [1:29:49<2:38:05,  2.18s/it] 36%|███▌      | 2425/6779 [1:29:51<2:37:08,  2.17s/it]                                                       {'loss': 1.7556, 'learning_rate': 0.00029194036795074943, 'epoch': 0.36}
+ 36%|███▌      | 2425/6779 [1:29:51<2:37:08,  2.17s/it] 36%|███▌      | 2426/6779 [1:29:54<2:37:23,  2.17s/it]                                                       {'loss': 1.6988, 'learning_rate': 0.00029185681340181206, 'epoch': 0.36}
+ 36%|███▌      | 2426/6779 [1:29:54<2:37:23,  2.17s/it] 36%|███▌      | 2427/6779 [1:29:56<2:37:21,  2.17s/it]                                                       {'loss': 1.8104, 'learning_rate': 0.0002917732385298557, 'epoch': 0.36}
+ 36%|███▌      | 2427/6779 [1:29:56<2:37:21,  2.17s/it] 36%|███▌      | 2428/6779 [1:29:58<2:37:09,  2.17s/it]                                                       {'loss': 1.6062, 'learning_rate': 0.00029168964335337077, 'epoch': 0.36}
+ 36%|███▌      | 2428/6779 [1:29:58<2:37:09,  2.17s/it] 36%|███▌      | 2429/6779 [1:30:00<2:42:15,  2.24s/it]                                                       {'loss': 1.5787, 'learning_rate': 0.0002916060278908525, 'epoch': 0.36}
+ 36%|███▌      | 2429/6779 [1:30:00<2:42:15,  2.24s/it] 36%|███▌      | 2430/6779 [1:30:03<2:41:27,  2.23s/it]                                                       {'loss': 1.7371, 'learning_rate': 0.0002915223921608007, 'epoch': 0.36}
+ 36%|███▌      | 2430/6779 [1:30:03<2:41:27,  2.23s/it] 36%|███▌      | 2431/6779 [1:30:05<2:46:30,  2.30s/it]                                                       {'loss': 1.6513, 'learning_rate': 0.00029143873618171936, 'epoch': 0.36}
+ 36%|███▌      | 2431/6779 [1:30:05<2:46:30,  2.30s/it] 36%|███▌      | 2432/6779 [1:30:08<2:57:36,  2.45s/it]                                                       {'loss': 1.6997, 'learning_rate': 0.00029135505997211704, 'epoch': 0.36}
+ 36%|███▌      | 2432/6779 [1:30:08<2:57:36,  2.45s/it] 36%|███▌      | 2433/6779 [1:30:10<2:52:22,  2.38s/it]                                                       {'loss': 1.6701, 'learning_rate': 0.00029127136355050704, 'epoch': 0.36}
+ 36%|███▌      | 2433/6779 [1:30:10<2:52:22,  2.38s/it] 36%|███▌      | 2434/6779 [1:30:12<2:45:46,  2.29s/it]                                                       {'loss': 1.7482, 'learning_rate': 0.00029118764693540666, 'epoch': 0.36}
+ 36%|███▌      | 2434/6779 [1:30:12<2:45:46,  2.29s/it] 36%|███▌      | 2435/6779 [1:30:14<2:42:46,  2.25s/it]                                                       {'loss': 1.7327, 'learning_rate': 0.00029110391014533813, 'epoch': 0.36}
+ 36%|███▌      | 2435/6779 [1:30:14<2:42:46,  2.25s/it] 36%|███▌      | 2436/6779 [1:30:16<2:40:37,  2.22s/it]                                                       {'loss': 1.7508, 'learning_rate': 0.00029102015319882777, 'epoch': 0.36}
+ 36%|███▌      | 2436/6779 [1:30:16<2:40:37,  2.22s/it] 36%|███▌      | 2437/6779 [1:30:19<2:49:49,  2.35s/it]                                                       {'loss': 1.7604, 'learning_rate': 0.0002909363761144067, 'epoch': 0.36}
+ 36%|███▌      | 2437/6779 [1:30:19<2:49:49,  2.35s/it] 36%|███▌      | 2438/6779 [1:30:21<2:45:03,  2.28s/it]                                                       {'loss': 1.6601, 'learning_rate': 0.00029085257891061023, 'epoch': 0.36}
+ 36%|███▌      | 2438/6779 [1:30:21<2:45:03,  2.28s/it] 36%|███▌      | 2439/6779 [1:30:24<2:48:10,  2.33s/it]                                                       {'loss': 1.8266, 'learning_rate': 0.0002907687616059782, 'epoch': 0.36}
+ 36%|███▌      | 2439/6779 [1:30:24<2:48:10,  2.33s/it] 36%|███▌      | 2440/6779 [1:30:26<2:40:37,  2.22s/it]                                                       {'loss': 1.7184, 'learning_rate': 0.000290684924219055, 'epoch': 0.36}
+ 36%|███▌      | 2440/6779 [1:30:26<2:40:37,  2.22s/it] 36%|███▌      | 2441/6779 [1:30:28<2:44:34,  2.28s/it]                                                       {'loss': 1.7782, 'learning_rate': 0.0002906010667683893, 'epoch': 0.36}
+ 36%|███▌      | 2441/6779 [1:30:28<2:44:34,  2.28s/it] 36%|███▌      | 2442/6779 [1:30:30<2:47:00,  2.31s/it]                                                       {'loss': 1.7202, 'learning_rate': 0.00029051718927253434, 'epoch': 0.36}
+ 36%|███▌      | 2442/6779 [1:30:30<2:47:00,  2.31s/it] 36%|███▌      | 2443/6779 [1:30:33<2:50:36,  2.36s/it]                                                       {'loss': 1.7985, 'learning_rate': 0.0002904332917500476, 'epoch': 0.36}
+ 36%|███▌      | 2443/6779 [1:30:33<2:50:36,  2.36s/it] 36%|███▌      | 2444/6779 [1:30:35<2:43:48,  2.27s/it]                                                       {'loss': 1.8575, 'learning_rate': 0.00029034937421949135, 'epoch': 0.36}
+ 36%|███▌      | 2444/6779 [1:30:35<2:43:48,  2.27s/it] 36%|███▌      | 2445/6779 [1:30:38<2:51:11,  2.37s/it]                                                       {'loss': 1.8512, 'learning_rate': 0.00029026543669943193, 'epoch': 0.36}
+ 36%|███▌      | 2445/6779 [1:30:38<2:51:11,  2.37s/it] 36%|███▌      | 2446/6779 [1:30:40<2:56:01,  2.44s/it]                                                       {'loss': 1.6356, 'learning_rate': 0.0002901814792084403, 'epoch': 0.36}
+ 36%|███▌      | 2446/6779 [1:30:40<2:56:01,  2.44s/it] 36%|███▌      | 2447/6779 [1:30:42<2:53:08,  2.40s/it]                                                       {'loss': 1.739, 'learning_rate': 0.0002900975017650918, 'epoch': 0.36}
+ 36%|███▌      | 2447/6779 [1:30:42<2:53:08,  2.40s/it] 36%|███▌      | 2448/6779 [1:30:45<2:50:34,  2.36s/it]                                                       {'loss': 1.6639, 'learning_rate': 0.00029001350438796606, 'epoch': 0.36}
+ 36%|███▌      | 2448/6779 [1:30:45<2:50:34,  2.36s/it] 36%|███▌      | 2449/6779 [1:30:47<2:50:16,  2.36s/it]                                                       {'loss': 1.9028, 'learning_rate': 0.00028992948709564726, 'epoch': 0.36}
+ 36%|███▌      | 2449/6779 [1:30:47<2:50:16,  2.36s/it] 36%|███▌      | 2450/6779 [1:30:49<2:45:54,  2.30s/it]                                                       {'loss': 1.8404, 'learning_rate': 0.00028984544990672396, 'epoch': 0.36}
+ 36%|███▌      | 2450/6779 [1:30:49<2:45:54,  2.30s/it] 36%|███▌      | 2451/6779 [1:30:52<2:45:13,  2.29s/it]                                                       {'loss': 1.7267, 'learning_rate': 0.00028976139283978916, 'epoch': 0.36}
+ 36%|███▌      | 2451/6779 [1:30:52<2:45:13,  2.29s/it] 36%|███▌      | 2452/6779 [1:30:54<2:51:33,  2.38s/it]                                                       {'loss': 1.8926, 'learning_rate': 0.0002896773159134402, 'epoch': 0.36}
+ 36%|███▌      | 2452/6779 [1:30:54<2:51:33,  2.38s/it] 36%|███▌      | 2453/6779 [1:30:56<2:48:05,  2.33s/it]                                                       {'loss': 1.7985, 'learning_rate': 0.0002895932191462788, 'epoch': 0.36}
+ 36%|███▌      | 2453/6779 [1:30:56<2:48:05,  2.33s/it] 36%|███▌      | 2454/6779 [1:30:58<2:44:01,  2.28s/it]                                                       {'loss': 1.8033, 'learning_rate': 0.00028950910255691107, 'epoch': 0.36}
+ 36%|███▌      | 2454/6779 [1:30:58<2:44:01,  2.28s/it] 36%|███▌      | 2455/6779 [1:31:01<2:44:58,  2.29s/it]                                                       {'loss': 1.7912, 'learning_rate': 0.0002894249661639476, 'epoch': 0.36}
+ 36%|███▌      | 2455/6779 [1:31:01<2:44:58,  2.29s/it] 36%|███▌      | 2456/6779 [1:31:03<2:42:03,  2.25s/it]                                                       {'loss': 2.0232, 'learning_rate': 0.00028934080998600326, 'epoch': 0.36}
+ 36%|███▌      | 2456/6779 [1:31:03<2:42:03,  2.25s/it] 36%|███▌      | 2457/6779 [1:31:05<2:40:48,  2.23s/it]                                                       {'loss': 1.6735, 'learning_rate': 0.0002892566340416972, 'epoch': 0.36}
+ 36%|███▌      | 2457/6779 [1:31:05<2:40:48,  2.23s/it] 36%|███▋      | 2458/6779 [1:31:07<2:40:28,  2.23s/it]                                                       {'loss': 1.7066, 'learning_rate': 0.00028917243834965326, 'epoch': 0.36}
+ 36%|███▋      | 2458/6779 [1:31:07<2:40:28,  2.23s/it] 36%|███▋      | 2459/6779 [1:31:10<2:40:26,  2.23s/it]                                                       {'loss': 1.5722, 'learning_rate': 0.0002890882229284994, 'epoch': 0.36}
+ 36%|███▋      | 2459/6779 [1:31:10<2:40:26,  2.23s/it] 36%|███▋      | 2460/6779 [1:31:12<2:37:09,  2.18s/it]                                                       {'loss': 1.7343, 'learning_rate': 0.000289003987796868, 'epoch': 0.36}
+ 36%|███▋      | 2460/6779 [1:31:12<2:37:09,  2.18s/it] 36%|███▋      | 2461/6779 [1:31:14<2:37:47,  2.19s/it]                                                       {'loss': 1.6352, 'learning_rate': 0.0002889197329733958, 'epoch': 0.36}
+ 36%|███▋      | 2461/6779 [1:31:14<2:37:47,  2.19s/it] 36%|███▋      | 2462/6779 [1:31:16<2:40:03,  2.22s/it]                                                       {'loss': 1.6335, 'learning_rate': 0.0002888354584767239, 'epoch': 0.36}
+ 36%|███▋      | 2462/6779 [1:31:16<2:40:03,  2.22s/it] 36%|███▋      | 2463/6779 [1:31:19<2:42:53,  2.26s/it]                                                       {'loss': 1.8765, 'learning_rate': 0.0002887511643254977, 'epoch': 0.36}
+ 36%|███▋      | 2463/6779 [1:31:19<2:42:53,  2.26s/it] 36%|███▋      | 2464/6779 [1:31:21<2:49:08,  2.35s/it]                                                       {'loss': 1.7541, 'learning_rate': 0.0002886668505383672, 'epoch': 0.36}
+ 36%|███▋      | 2464/6779 [1:31:21<2:49:08,  2.35s/it] 36%|███▋      | 2465/6779 [1:31:23<2:46:42,  2.32s/it]                                                       {'loss': 1.7712, 'learning_rate': 0.00028858251713398636, 'epoch': 0.36}
+ 36%|███▋      | 2465/6779 [1:31:23<2:46:42,  2.32s/it] 36%|███▋      | 2466/6779 [1:31:26<2:43:30,  2.27s/it]                                                       {'loss': 1.8574, 'learning_rate': 0.00028849816413101367, 'epoch': 0.36}
+ 36%|███▋      | 2466/6779 [1:31:26<2:43:30,  2.27s/it] 36%|███▋      | 2467/6779 [1:31:28<2:40:41,  2.24s/it]                                                       {'loss': 1.7498, 'learning_rate': 0.00028841379154811205, 'epoch': 0.36}
+ 36%|███▋      | 2467/6779 [1:31:28<2:40:41,  2.24s/it] 36%|███▋      | 2468/6779 [1:31:30<2:39:03,  2.21s/it]                                                       {'loss': 1.6536, 'learning_rate': 0.00028832939940394865, 'epoch': 0.36}
+ 36%|███▋      | 2468/6779 [1:31:30<2:39:03,  2.21s/it] 36%|███▋      | 2469/6779 [1:31:32<2:40:39,  2.24s/it]                                                       {'loss': 1.8075, 'learning_rate': 0.00028824498771719487, 'epoch': 0.36}
+ 36%|███▋      | 2469/6779 [1:31:32<2:40:39,  2.24s/it] 36%|███▋      | 2470/6779 [1:31:35<2:47:02,  2.33s/it]                                                       {'loss': 1.8558, 'learning_rate': 0.0002881605565065266, 'epoch': 0.36}
+ 36%|███▋      | 2470/6779 [1:31:35<2:47:02,  2.33s/it] 36%|███▋      | 2471/6779 [1:31:37<2:41:39,  2.25s/it]                                                       {'loss': 1.6706, 'learning_rate': 0.000288076105790624, 'epoch': 0.36}
+ 36%|███▋      | 2471/6779 [1:31:37<2:41:39,  2.25s/it] 36%|███▋      | 2472/6779 [1:31:39<2:39:52,  2.23s/it]                                                       {'loss': 1.7126, 'learning_rate': 0.0002879916355881714, 'epoch': 0.36}
+ 36%|███▋      | 2472/6779 [1:31:39<2:39:52,  2.23s/it] 36%|███▋      | 2473/6779 [1:31:41<2:38:52,  2.21s/it]                                                       {'loss': 1.753, 'learning_rate': 0.0002879071459178576, 'epoch': 0.36}
+ 36%|███▋      | 2473/6779 [1:31:41<2:38:52,  2.21s/it] 36%|███▋      | 2474/6779 [1:31:44<2:44:19,  2.29s/it]                                                       {'loss': 1.6629, 'learning_rate': 0.0002878226367983757, 'epoch': 0.36}
+ 36%|███▋      | 2474/6779 [1:31:44<2:44:19,  2.29s/it] 37%|███▋      | 2475/6779 [1:31:46<2:40:39,  2.24s/it]                                                       {'loss': 1.8175, 'learning_rate': 0.00028773810824842303, 'epoch': 0.37}
+ 37%|███▋      | 2475/6779 [1:31:46<2:40:39,  2.24s/it] 37%|███▋      | 2476/6779 [1:31:48<2:42:33,  2.27s/it]                                                       {'loss': 1.9046, 'learning_rate': 0.0002876535602867013, 'epoch': 0.37}
+ 37%|███▋      | 2476/6779 [1:31:48<2:42:33,  2.27s/it] 37%|███▋      | 2477/6779 [1:31:50<2:39:18,  2.22s/it]                                                       {'loss': 1.7261, 'learning_rate': 0.0002875689929319164, 'epoch': 0.37}
+ 37%|███▋      | 2477/6779 [1:31:50<2:39:18,  2.22s/it] 37%|███▋      | 2478/6779 [1:31:52<2:42:44,  2.27s/it]                                                       {'loss': 1.5536, 'learning_rate': 0.0002874844062027787, 'epoch': 0.37}
+ 37%|███▋      | 2478/6779 [1:31:52<2:42:44,  2.27s/it] 37%|███▋      | 2479/6779 [1:31:55<2:39:08,  2.22s/it]                                                       {'loss': 1.8208, 'learning_rate': 0.00028739980011800254, 'epoch': 0.37}
+ 37%|███▋      | 2479/6779 [1:31:55<2:39:08,  2.22s/it] 37%|███▋      | 2480/6779 [1:31:57<2:37:07,  2.19s/it]                                                       {'loss': 1.5895, 'learning_rate': 0.0002873151746963069, 'epoch': 0.37}
+ 37%|███▋      | 2480/6779 [1:31:57<2:37:07,  2.19s/it] 37%|███▋      | 2481/6779 [1:31:59<2:36:24,  2.18s/it]                                                       {'loss': 1.773, 'learning_rate': 0.0002872305299564149, 'epoch': 0.37}
+ 37%|███▋      | 2481/6779 [1:31:59<2:36:24,  2.18s/it] 37%|███▋      | 2482/6779 [1:32:01<2:38:29,  2.21s/it]                                                       {'loss': 1.6983, 'learning_rate': 0.00028714586591705365, 'epoch': 0.37}
+ 37%|███▋      | 2482/6779 [1:32:01<2:38:29,  2.21s/it] 37%|███▋      | 2483/6779 [1:32:03<2:39:43,  2.23s/it]                                                       {'loss': 1.6899, 'learning_rate': 0.00028706118259695516, 'epoch': 0.37}
+ 37%|███▋      | 2483/6779 [1:32:03<2:39:43,  2.23s/it] 37%|███▋      | 2484/6779 [1:32:06<2:39:49,  2.23s/it]                                                       {'loss': 1.7006, 'learning_rate': 0.0002869764800148551, 'epoch': 0.37}
+ 37%|███▋      | 2484/6779 [1:32:06<2:39:49,  2.23s/it] 37%|███▋      | 2485/6779 [1:32:08<2:41:27,  2.26s/it]                                                       {'loss': 1.7316, 'learning_rate': 0.0002868917581894937, 'epoch': 0.37}
+ 37%|███▋      | 2485/6779 [1:32:08<2:41:27,  2.26s/it] 37%|███▋      | 2486/6779 [1:32:10<2:38:47,  2.22s/it]                                                       {'loss': 1.6349, 'learning_rate': 0.0002868070171396154, 'epoch': 0.37}
+ 37%|███▋      | 2486/6779 [1:32:10<2:38:47,  2.22s/it] 37%|███▋      | 2487/6779 [1:32:12<2:39:03,  2.22s/it]                                                       {'loss': 1.7366, 'learning_rate': 0.00028672225688396885, 'epoch': 0.37}
+ 37%|███▋      | 2487/6779 [1:32:12<2:39:03,  2.22s/it] 37%|███▋      | 2488/6779 [1:32:15<2:42:17,  2.27s/it]                                                       {'loss': 1.7095, 'learning_rate': 0.00028663747744130704, 'epoch': 0.37}
+ 37%|███▋      | 2488/6779 [1:32:15<2:42:17,  2.27s/it] 37%|███▋      | 2489/6779 [1:32:17<2:38:20,  2.21s/it]                                                       {'loss': 1.7306, 'learning_rate': 0.000286552678830387, 'epoch': 0.37}
+ 37%|███▋      | 2489/6779 [1:32:17<2:38:20,  2.21s/it] 37%|███▋      | 2490/6779 [1:32:19<2:39:13,  2.23s/it]                                                       {'loss': 1.7638, 'learning_rate': 0.0002864678610699703, 'epoch': 0.37}
+ 37%|███▋      | 2490/6779 [1:32:19<2:39:13,  2.23s/it] 37%|███▋      | 2491/6779 [1:32:21<2:38:09,  2.21s/it]                                                       {'loss': 1.6404, 'learning_rate': 0.00028638302417882254, 'epoch': 0.37}
+ 37%|███▋      | 2491/6779 [1:32:21<2:38:09,  2.21s/it] 37%|███▋      | 2492/6779 [1:32:24<2:41:20,  2.26s/it]                                                       {'loss': 1.787, 'learning_rate': 0.00028629816817571363, 'epoch': 0.37}
+ 37%|███▋      | 2492/6779 [1:32:24<2:41:20,  2.26s/it] 37%|███▋      | 2493/6779 [1:32:26<2:41:33,  2.26s/it]                                                       {'loss': 1.7448, 'learning_rate': 0.00028621329307941757, 'epoch': 0.37}
+ 37%|███▋      | 2493/6779 [1:32:26<2:41:33,  2.26s/it] 37%|███▋      | 2494/6779 [1:32:28<2:45:13,  2.31s/it]                                                       {'loss': 1.6568, 'learning_rate': 0.00028612839890871283, 'epoch': 0.37}
+ 37%|███▋      | 2494/6779 [1:32:28<2:45:13,  2.31s/it] 37%|███▋      | 2495/6779 [1:32:30<2:41:40,  2.26s/it]                                                       {'loss': 1.8065, 'learning_rate': 0.000286043485682382, 'epoch': 0.37}
+ 37%|███▋      | 2495/6779 [1:32:30<2:41:40,  2.26s/it] 37%|███���      | 2496/6779 [1:32:33<2:38:27,  2.22s/it]                                                       {'loss': 1.5996, 'learning_rate': 0.0002859585534192116, 'epoch': 0.37}
+ 37%|███▋      | 2496/6779 [1:32:33<2:38:27,  2.22s/it] 37%|███▋      | 2497/6779 [1:32:35<2:35:55,  2.18s/it]                                                       {'loss': 1.8257, 'learning_rate': 0.00028587360213799286, 'epoch': 0.37}
+ 37%|███▋      | 2497/6779 [1:32:35<2:35:55,  2.18s/it] 37%|███▋      | 2498/6779 [1:32:37<2:37:17,  2.20s/it]                                                       {'loss': 1.6561, 'learning_rate': 0.00028578863185752093, 'epoch': 0.37}
+ 37%|███▋      | 2498/6779 [1:32:37<2:37:17,  2.20s/it] 37%|███▋      | 2499/6779 [1:32:39<2:37:11,  2.20s/it]                                                       {'loss': 1.753, 'learning_rate': 0.00028570364259659513, 'epoch': 0.37}
+ 37%|███▋      | 2499/6779 [1:32:39<2:37:11,  2.20s/it] 37%|███▋      | 2500/6779 [1:32:41<2:33:43,  2.16s/it]                                                       {'loss': 1.723, 'learning_rate': 0.0002856186343740191, 'epoch': 0.37}
+ 37%|███▋      | 2500/6779 [1:32:41<2:33:43,  2.16s/it] 37%|███▋      | 2501/6779 [1:32:43<2:30:25,  2.11s/it]                                                       {'loss': 1.7068, 'learning_rate': 0.00028553360720860065, 'epoch': 0.37}
+ 37%|███▋      | 2501/6779 [1:32:43<2:30:25,  2.11s/it] 37%|███▋      | 2502/6779 [1:32:46<2:36:07,  2.19s/it]                                                       {'loss': 1.5513, 'learning_rate': 0.00028544856111915173, 'epoch': 0.37}
+ 37%|███▋      | 2502/6779 [1:32:46<2:36:07,  2.19s/it] 37%|███▋      | 2503/6779 [1:32:48<2:32:07,  2.13s/it]                                                       {'loss': 1.6565, 'learning_rate': 0.00028536349612448856, 'epoch': 0.37}
+ 37%|███▋      | 2503/6779 [1:32:48<2:32:07,  2.13s/it] 37%|███▋      | 2504/6779 [1:32:50<2:36:15,  2.19s/it]                                                       {'loss': 1.8035, 'learning_rate': 0.0002852784122434314, 'epoch': 0.37}
+ 37%|███▋      | 2504/6779 [1:32:50<2:36:15,  2.19s/it] 37%|███▋      | 2505/6779 [1:32:52<2:41:44,  2.27s/it]                                                       {'loss': 1.6123, 'learning_rate': 0.0002851933094948049, 'epoch': 0.37}
+ 37%|███▋      | 2505/6779 [1:32:52<2:41:44,  2.27s/it] 37%|███▋      | 2506/6779 [1:32:55<2:41:51,  2.27s/it]                                                       {'loss': 1.6604, 'learning_rate': 0.0002851081878974377, 'epoch': 0.37}
+ 37%|███▋      | 2506/6779 [1:32:55<2:41:51,  2.27s/it] 37%|███▋      | 2507/6779 [1:32:57<2:37:13,  2.21s/it]                                                       {'loss': 1.6892, 'learning_rate': 0.00028502304747016254, 'epoch': 0.37}
+ 37%|███▋      | 2507/6779 [1:32:57<2:37:13,  2.21s/it] 37%|███▋      | 2508/6779 [1:32:59<2:36:53,  2.20s/it]                                                       {'loss': 1.7229, 'learning_rate': 0.0002849378882318167, 'epoch': 0.37}
+ 37%|███▋      | 2508/6779 [1:32:59<2:36:53,  2.20s/it] 37%|███▋      | 2509/6779 [1:33:01<2:34:11,  2.17s/it]                                                       {'loss': 1.7638, 'learning_rate': 0.0002848527102012413, 'epoch': 0.37}
+ 37%|███▋      | 2509/6779 [1:33:01<2:34:11,  2.17s/it] 37%|███▋      | 2510/6779 [1:33:03<2:36:06,  2.19s/it]                                                       {'loss': 1.6329, 'learning_rate': 0.00028476751339728156, 'epoch': 0.37}
+ 37%|███▋      | 2510/6779 [1:33:03<2:36:06,  2.19s/it] 37%|███▋      | 2511/6779 [1:33:06<2:40:25,  2.26s/it]                                                       {'loss': 1.7142, 'learning_rate': 0.00028468229783878724, 'epoch': 0.37}
+ 37%|███▋      | 2511/6779 [1:33:06<2:40:25,  2.26s/it] 37%|███▋      | 2512/6779 [1:33:08<2:45:22,  2.33s/it]                                                       {'loss': 1.7309, 'learning_rate': 0.0002845970635446118, 'epoch': 0.37}
+ 37%|███▋      | 2512/6779 [1:33:08<2:45:22,  2.33s/it] 37%|███▋      | 2513/6779 [1:33:10<2:38:44,  2.23s/it]                                                       {'loss': 1.6896, 'learning_rate': 0.00028451181053361314, 'epoch': 0.37}
+ 37%|███▋      | 2513/6779 [1:33:10<2:38:44,  2.23s/it] 37%|███▋      | 2514/6779 [1:33:12<2:36:51,  2.21s/it]                                                       {'loss': 1.5717, 'learning_rate': 0.0002844265388246531, 'epoch': 0.37}
+ 37%|███▋      | 2514/6779 [1:33:12<2:36:51,  2.21s/it] 37%|███▋      | 2515/6779 [1:33:15<2:39:09,  2.24s/it]                                                       {'loss': 1.9137, 'learning_rate': 0.0002843412484365979, 'epoch': 0.37}
+ 37%|███▋      | 2515/6779 [1:33:15<2:39:09,  2.24s/it] 37%|███▋      | 2516/6779 [1:33:17<2:38:21,  2.23s/it]                                                       {'loss': 1.8714, 'learning_rate': 0.0002842559393883178, 'epoch': 0.37}
+ 37%|███▋      | 2516/6779 [1:33:17<2:38:21,  2.23s/it] 37%|███▋      | 2517/6779 [1:33:19<2:40:45,  2.26s/it]                                                       {'loss': 1.8185, 'learning_rate': 0.000284170611698687, 'epoch': 0.37}
+ 37%|███▋      | 2517/6779 [1:33:19<2:40:45,  2.26s/it] 37%|███▋      | 2518/6779 [1:33:21<2:39:03,  2.24s/it]                                                       {'loss': 1.666, 'learning_rate': 0.0002840852653865841, 'epoch': 0.37}
+ 37%|███▋      | 2518/6779 [1:33:21<2:39:03,  2.24s/it] 37%|███▋      | 2519/6779 [1:33:23<2:36:49,  2.21s/it]                                                       {'loss': 1.6868, 'learning_rate': 0.0002839999004708916, 'epoch': 0.37}
+ 37%|███▋      | 2519/6779 [1:33:23<2:36:49,  2.21s/it] 37%|███▋      | 2520/6779 [1:33:26<2:33:40,  2.16s/it]                                                       {'loss': 1.8502, 'learning_rate': 0.00028391451697049616, 'epoch': 0.37}
+ 37%|███▋      | 2520/6779 [1:33:26<2:33:40,  2.16s/it] 37%|███▋      | 2521/6779 [1:33:28<2:38:27,  2.23s/it]                                                       {'loss': 1.786, 'learning_rate': 0.0002838291149042887, 'epoch': 0.37}
+ 37%|███▋      | 2521/6779 [1:33:28<2:38:27,  2.23s/it] 37%|███▋      | 2522/6779 [1:33:30<2:42:15,  2.29s/it]                                                       {'loss': 1.7068, 'learning_rate': 0.00028374369429116415, 'epoch': 0.37}
+ 37%|███▋      | 2522/6779 [1:33:30<2:42:15,  2.29s/it] 37%|███▋      | 2523/6779 [1:33:33<2:41:02,  2.27s/it]                                                       {'loss': 1.7699, 'learning_rate': 0.0002836582551500215, 'epoch': 0.37}
+ 37%|███▋      | 2523/6779 [1:33:33<2:41:02,  2.27s/it] 37%|███▋      | 2524/6779 [1:33:35<2:38:22,  2.23s/it]                                                       {'loss': 1.7207, 'learning_rate': 0.00028357279749976393, 'epoch': 0.37}
+ 37%|███▋      | 2524/6779 [1:33:35<2:38:22,  2.23s/it] 37%|███▋      | 2525/6779 [1:33:37<2:36:23,  2.21s/it]                                                       {'loss': 1.7193, 'learning_rate': 0.0002834873213592985, 'epoch': 0.37}
+ 37%|███▋      | 2525/6779 [1:33:37<2:36:23,  2.21s/it] 37%|███▋      | 2526/6779 [1:33:39<2:34:15,  2.18s/it]                                                       {'loss': 1.7483, 'learning_rate': 0.0002834018267475369, 'epoch': 0.37}
+ 37%|███▋      | 2526/6779 [1:33:39<2:34:15,  2.18s/it] 37%|███▋      | 2527/6779 [1:33:41<2:34:16,  2.18s/it]                                                       {'loss': 1.6955, 'learning_rate': 0.0002833163136833941, 'epoch': 0.37}
+ 37%|███▋      | 2527/6779 [1:33:41<2:34:16,  2.18s/it] 37%|███▋      | 2528/6779 [1:33:43<2:32:20,  2.15s/it]                                                       {'loss': 1.7485, 'learning_rate': 0.00028323078218578975, 'epoch': 0.37}
+ 37%|███▋      | 2528/6779 [1:33:43<2:32:20,  2.15s/it] 37%|███▋      | 2529/6779 [1:33:45<2:30:15,  2.12s/it]                                                       {'loss': 1.905, 'learning_rate': 0.00028314523227364753, 'epoch': 0.37}
+ 37%|███▋      | 2529/6779 [1:33:45<2:30:15,  2.12s/it] 37%|███▋      | 2530/6779 [1:33:47<2:29:08,  2.11s/it]                                                       {'loss': 1.7684, 'learning_rate': 0.00028305966396589496, 'epoch': 0.37}
+ 37%|███▋      | 2530/6779 [1:33:47<2:29:08,  2.11s/it] 37%|███▋      | 2531/6779 [1:33:49<2:29:50,  2.12s/it]                                                       {'loss': 1.8091, 'learning_rate': 0.00028297407728146374, 'epoch': 0.37}
+ 37%|███▋      | 2531/6779 [1:33:49<2:29:50,  2.12s/it] 37%|███▋      | 2532/6779 [1:33:52<2:34:00,  2.18s/it]                                                       {'loss': 1.6072, 'learning_rate': 0.0002828884722392897, 'epoch': 0.37}
+ 37%|███▋      | 2532/6779 [1:33:52<2:34:00,  2.18s/it] 37%|███▋      | 2533/6779 [1:33:54<2:41:38,  2.28s/it]                                                       {'loss': 1.8229, 'learning_rate': 0.00028280284885831265, 'epoch': 0.37}
+ 37%|███▋      | 2533/6779 [1:33:54<2:41:38,  2.28s/it] 37%|███▋      | 2534/6779 [1:33:56<2:37:55,  2.23s/it]                                                       {'loss': 1.7388, 'learning_rate': 0.0002827172071574765, 'epoch': 0.37}
+ 37%|███▋      | 2534/6779 [1:33:56<2:37:55,  2.23s/it] 37%|███▋      | 2535/6779 [1:33:59<2:35:08,  2.19s/it]                                                       {'loss': 1.7707, 'learning_rate': 0.00028263154715572913, 'epoch': 0.37}
+ 37%|███▋      | 2535/6779 [1:33:59<2:35:08,  2.19s/it] 37%|███▋      | 2536/6779 [1:34:01<2:41:01,  2.28s/it]                                                       {'loss': 1.5601, 'learning_rate': 0.0002825458688720226, 'epoch': 0.37}
+ 37%|███▋      | 2536/6779 [1:34:01<2:41:01,  2.28s/it] 37%|███▋      | 2537/6779 [1:34:03<2:35:21,  2.20s/it]                                                       {'loss': 1.69, 'learning_rate': 0.000282460172325313, 'epoch': 0.37}
+ 37%|███▋      | 2537/6779 [1:34:03<2:35:21,  2.20s/it] 37%|███▋      | 2538/6779 [1:34:05<2:33:17,  2.17s/it]                                                       {'loss': 1.7986, 'learning_rate': 0.00028237445753456026, 'epoch': 0.37}
+ 37%|███▋      | 2538/6779 [1:34:05<2:33:17,  2.17s/it] 37%|███▋      | 2539/6779 [1:34:07<2:31:35,  2.15s/it]                                                       {'loss': 1.6734, 'learning_rate': 0.00028228872451872865, 'epoch': 0.37}
+ 37%|███▋      | 2539/6779 [1:34:07<2:31:35,  2.15s/it] 37%|███▋      | 2540/6779 [1:34:09<2:32:15,  2.16s/it]                                                       {'loss': 1.7279, 'learning_rate': 0.00028220297329678616, 'epoch': 0.37}
+ 37%|███▋      | 2540/6779 [1:34:09<2:32:15,  2.16s/it] 37%|███▋      | 2541/6779 [1:34:12<2:33:08,  2.17s/it]                                                       {'loss': 1.5336, 'learning_rate': 0.00028211720388770514, 'epoch': 0.37}
+ 37%|███▋      | 2541/6779 [1:34:12<2:33:08,  2.17s/it] 37%|███▋      | 2542/6779 [1:34:14<2:32:29,  2.16s/it]                                                       {'loss': 1.7906, 'learning_rate': 0.00028203141631046166, 'epoch': 0.37}
+ 37%|███▋      | 2542/6779 [1:34:14<2:32:29,  2.16s/it] 38%|███▊      | 2543/6779 [1:34:17<2:45:20,  2.34s/it]                                                       {'loss': 1.6486, 'learning_rate': 0.00028194561058403605, 'epoch': 0.38}
+ 38%|███▊      | 2543/6779 [1:34:17<2:45:20,  2.34s/it] 38%|███▊      | 2544/6779 [1:34:20<3:00:09,  2.55s/it]                                                       {'loss': 1.5579, 'learning_rate': 0.0002818597867274124, 'epoch': 0.38}
+ 38%|███▊      | 2544/6779 [1:34:20<3:00:09,  2.55s/it] 38%|███▊      | 2545/6779 [1:34:22<2:52:08,  2.44s/it]                                                       {'loss': 1.4407, 'learning_rate': 0.00028177394475957914, 'epoch': 0.38}
+ 38%|███▊      | 2545/6779 [1:34:22<2:52:08,  2.44s/it] 38%|███▊      | 2546/6779 [1:34:24<2:46:15,  2.36s/it]                                                       {'loss': 1.662, 'learning_rate': 0.0002816880846995283, 'epoch': 0.38}
+ 38%|███▊      | 2546/6779 [1:34:24<2:46:15,  2.36s/it] 38%|███▊      | 2547/6779 [1:34:26<2:42:11,  2.30s/it]                                                       {'loss': 1.6238, 'learning_rate': 0.00028160220656625633, 'epoch': 0.38}
+ 38%|███▊      | 2547/6779 [1:34:26<2:42:11,  2.30s/it] 38%|███▊      | 2548/6779 [1:34:28<2:38:07,  2.24s/it]                                                       {'loss': 1.7286, 'learning_rate': 0.00028151631037876343, 'epoch': 0.38}
+ 38%|███▊      | 2548/6779 [1:34:28<2:38:07,  2.24s/it] 38%|███▊      | 2549/6779 [1:34:30<2:38:49,  2.25s/it]                                                       {'loss': 1.8448, 'learning_rate': 0.00028143039615605386, 'epoch': 0.38}
+ 38%|███▊      | 2549/6779 [1:34:30<2:38:49,  2.25s/it] 38%|███▊      | 2550/6779 [1:34:33<2:39:21,  2.26s/it]                                                       {'loss': 1.8141, 'learning_rate': 0.00028134446391713577, 'epoch': 0.38}
+ 38%|███▊      | 2550/6779 [1:34:33<2:39:21,  2.26s/it] 38%|███▊      | 2551/6779 [1:34:35<2:36:44,  2.22s/it]                                                       {'loss': 1.5945, 'learning_rate': 0.00028125851368102154, 'epoch': 0.38}
+ 38%|███▊      | 2551/6779 [1:34:35<2:36:44,  2.22s/it] 38%|███▊      | 2552/6779 [1:34:37<2:33:50,  2.18s/it]                                                       {'loss': 1.5204, 'learning_rate': 0.00028117254546672723, 'epoch': 0.38}
+ 38%|███▊      | 2552/6779 [1:34:37<2:33:50,  2.18s/it] 38%|███▊      | 2553/6779 [1:34:39<2:34:27,  2.19s/it]                                                       {'loss': 1.6669, 'learning_rate': 0.0002810865592932731, 'epoch': 0.38}
+ 38%|███▊      | 2553/6779 [1:34:39<2:34:27,  2.19s/it] 38%|███▊      | 2554/6779 [1:34:41<2:34:03,  2.19s/it]                                                       {'loss': 1.7075, 'learning_rate': 0.00028100055517968326, 'epoch': 0.38}
+ 38%|███▊      | 2554/6779 [1:34:41<2:34:03,  2.19s/it] 38%|███▊      | 2555/6779 [1:34:44<2:33:57,  2.19s/it]                                                       {'loss': 1.4518, 'learning_rate': 0.00028091453314498595, 'epoch': 0.38}
+ 38%|███▊      | 2555/6779 [1:34:44<2:33:57,  2.19s/it] 38%|███▊      | 2556/6779 [1:34:45<2:29:16,  2.12s/it]                                                       {'loss': 1.5898, 'learning_rate': 0.0002808284932082131, 'epoch': 0.38}
+ 38%|███▊      | 2556/6779 [1:34:45<2:29:16,  2.12s/it] 38%|███▊      | 2557/6779 [1:34:48<2:35:08,  2.20s/it]                                                       {'loss': 1.8477, 'learning_rate': 0.00028074243538840095, 'epoch': 0.38}
+ 38%|███▊      | 2557/6779 [1:34:48<2:35:08,  2.20s/it] 38%|███▊      | 2558/6779 [1:34:50<2:37:04,  2.23s/it]                                                       {'loss': 1.6021, 'learning_rate': 0.0002806563597045894, 'epoch': 0.38}
+ 38%|███▊      | 2558/6779 [1:34:50<2:37:04,  2.23s/it] 38%|███▊      | 2559/6779 [1:34:52<2:36:20,  2.22s/it]                                                       {'loss': 1.6761, 'learning_rate': 0.0002805702661758224, 'epoch': 0.38}
+ 38%|███▊      | 2559/6779 [1:34:52<2:36:20,  2.22s/it] 38%|███▊      | 2560/6779 [1:34:55<2:40:03,  2.28s/it]                                                       {'loss': 1.8218, 'learning_rate': 0.0002804841548211479, 'epoch': 0.38}
+ 38%|███▊      | 2560/6779 [1:34:55<2:40:03,  2.28s/it] 38%|███▊      | 2561/6779 [1:34:57<2:38:00,  2.25s/it]                                                       {'loss': 1.7572, 'learning_rate': 0.0002803980256596177, 'epoch': 0.38}
+ 38%|███▊      | 2561/6779 [1:34:57<2:38:00,  2.25s/it] 38%|███▊      | 2562/6779 [1:34:59<2:41:21,  2.30s/it]                                                       {'loss': 1.7098, 'learning_rate': 0.00028031187871028774, 'epoch': 0.38}
+ 38%|███▊      | 2562/6779 [1:34:59<2:41:21,  2.30s/it] 38%|███▊      | 2563/6779 [1:35:02<2:37:49,  2.25s/it]                                                       {'loss': 1.7678, 'learning_rate': 0.00028022571399221756, 'epoch': 0.38}
+ 38%|███▊      | 2563/6779 [1:35:02<2:37:49,  2.25s/it] 38%|███▊      | 2564/6779 [1:35:04<2:37:04,  2.24s/it]                                                       {'loss': 1.7517, 'learning_rate': 0.0002801395315244709, 'epoch': 0.38}
+ 38%|███▊      | 2564/6779 [1:35:04<2:37:04,  2.24s/it] 38%|███▊      | 2565/6779 [1:35:06<2:35:17,  2.21s/it]                                                       {'loss': 1.6863, 'learning_rate': 0.00028005333132611547, 'epoch': 0.38}
+ 38%|███▊      | 2565/6779 [1:35:06<2:35:17,  2.21s/it] 38%|███▊      | 2566/6779 [1:35:08<2:39:20,  2.27s/it]                                                       {'loss': 1.642, 'learning_rate': 0.00027996711341622265, 'epoch': 0.38}
+ 38%|███▊      | 2566/6779 [1:35:08<2:39:20,  2.27s/it] 38%|███▊      | 2567/6779 [1:35:10<2:36:45,  2.23s/it]                                                       {'loss': 1.7347, 'learning_rate': 0.0002798808778138678, 'epoch': 0.38}
+ 38%|███▊      | 2567/6779 [1:35:10<2:36:45,  2.23s/it] 38%|███▊      | 2568/6779 [1:35:13<2:38:24,  2.26s/it]                                                       {'loss': 1.6845, 'learning_rate': 0.0002797946245381304, 'epoch': 0.38}
+ 38%|███▊      | 2568/6779 [1:35:13<2:38:24,  2.26s/it] 38%|███▊      | 2569/6779 [1:35:15<2:31:44,  2.16s/it]                                                       {'loss': 1.6079, 'learning_rate': 0.0002797083536080937, 'epoch': 0.38}
+ 38%|███▊      | 2569/6779 [1:35:15<2:31:44,  2.16s/it] 38%|███▊      | 2570/6779 [1:35:17<2:28:44,  2.12s/it]                                                       {'loss': 1.5428, 'learning_rate': 0.00027962206504284474, 'epoch': 0.38}
+ 38%|███▊      | 2570/6779 [1:35:17<2:28:44,  2.12s/it] 38%|███▊      | 2571/6779 [1:35:19<2:30:15,  2.14s/it]                                                       {'loss': 1.6619, 'learning_rate': 0.0002795357588614747, 'epoch': 0.38}
+ 38%|███▊      | 2571/6779 [1:35:19<2:30:15,  2.14s/it] 38%|███▊      | 2572/6779 [1:35:21<2:28:20,  2.12s/it]                                                       {'loss': 1.668, 'learning_rate': 0.00027944943508307853, 'epoch': 0.38}
+ 38%|███▊      | 2572/6779 [1:35:21<2:28:20,  2.12s/it] 38%|███▊      | 2573/6779 [1:35:23<2:30:13,  2.14s/it]                                                       {'loss': 1.7797, 'learning_rate': 0.00027936309372675506, 'epoch': 0.38}
+ 38%|███▊      | 2573/6779 [1:35:23<2:30:13,  2.14s/it] 38%|███▊      | 2574/6779 [1:35:25<2:28:01,  2.11s/it]                                                       {'loss': 1.5836, 'learning_rate': 0.00027927673481160703, 'epoch': 0.38}
+ 38%|███▊      | 2574/6779 [1:35:25<2:28:01,  2.11s/it] 38%|███▊      | 2575/6779 [1:35:27<2:27:41,  2.11s/it]                                                       {'loss': 1.6621, 'learning_rate': 0.00027919035835674105, 'epoch': 0.38}
+ 38%|███▊      | 2575/6779 [1:35:27<2:27:41,  2.11s/it] 38%|███▊      | 2576/6779 [1:35:29<2:28:32,  2.12s/it]                                                       {'loss': 1.6441, 'learning_rate': 0.00027910396438126766, 'epoch': 0.38}
+ 38%|███▊      | 2576/6779 [1:35:29<2:28:32,  2.12s/it] 38%|███▊      | 2577/6779 [1:35:32<2:28:31,  2.12s/it]                                                       {'loss': 1.7637, 'learning_rate': 0.00027901755290430123, 'epoch': 0.38}
+ 38%|███▊      | 2577/6779 [1:35:32<2:28:31,  2.12s/it] 38%|███▊      | 2578/6779 [1:35:34<2:28:18,  2.12s/it]                                                       {'loss': 1.6007, 'learning_rate': 0.00027893112394496, 'epoch': 0.38}
+ 38%|███▊      | 2578/6779 [1:35:34<2:28:18,  2.12s/it] 38%|███▊      | 2579/6779 [1:35:36<2:33:21,  2.19s/it]                                                       {'loss': 1.8098, 'learning_rate': 0.0002788446775223661, 'epoch': 0.38}
+ 38%|███▊      | 2579/6779 [1:35:36<2:33:21,  2.19s/it] 38%|███▊      | 2580/6779 [1:35:38<2:33:40,  2.20s/it]                                                       {'loss': 1.6559, 'learning_rate': 0.0002787582136556456, 'epoch': 0.38}
+ 38%|███▊      | 2580/6779 [1:35:38<2:33:40,  2.20s/it] 38%|███▊      | 2581/6779 [1:35:40<2:33:47,  2.20s/it]                                                       {'loss': 1.6926, 'learning_rate': 0.0002786717323639282, 'epoch': 0.38}
+ 38%|███▊      | 2581/6779 [1:35:40<2:33:47,  2.20s/it] 38%|███▊      | 2582/6779 [1:35:43<2:36:02,  2.23s/it]                                                       {'loss': 1.6371, 'learning_rate': 0.0002785852336663477, 'epoch': 0.38}
+ 38%|███▊      | 2582/6779 [1:35:43<2:36:02,  2.23s/it] 38%|███▊      | 2583/6779 [1:35:45<2:31:17,  2.16s/it]                                                       {'loss': 1.7901, 'learning_rate': 0.0002784987175820416, 'epoch': 0.38}
+ 38%|███▊      | 2583/6779 [1:35:45<2:31:17,  2.16s/it] 38%|███▊      | 2584/6779 [1:35:47<2:32:16,  2.18s/it]                                                       {'loss': 1.823, 'learning_rate': 0.00027841218413015136, 'epoch': 0.38}
+ 38%|███▊      | 2584/6779 [1:35:47<2:32:16,  2.18s/it] 38%|███▊      | 2585/6779 [1:35:49<2:31:36,  2.17s/it]                                                       {'loss': 1.7698, 'learning_rate': 0.0002783256333298222, 'epoch': 0.38}
+ 38%|███▊      | 2585/6779 [1:35:49<2:31:36,  2.17s/it] 38%|███▊      | 2586/6779 [1:35:51<2:32:27,  2.18s/it]                                                       {'loss': 1.9785, 'learning_rate': 0.0002782390652002032, 'epoch': 0.38}
+ 38%|███▊      | 2586/6779 [1:35:51<2:32:27,  2.18s/it] 38%|███▊      | 2587/6779 [1:35:53<2:28:17,  2.12s/it]                                                       {'loss': 1.72, 'learning_rate': 0.00027815247976044723, 'epoch': 0.38}
+ 38%|███▊      | 2587/6779 [1:35:53<2:28:17,  2.12s/it] 38%|███▊      | 2588/6779 [1:35:55<2:27:35,  2.11s/it]                                                       {'loss': 1.6537, 'learning_rate': 0.0002780658770297111, 'epoch': 0.38}
+ 38%|███▊      | 2588/6779 [1:35:55<2:27:35,  2.11s/it] 38%|███▊      | 2589/6779 [1:35:58<2:31:35,  2.17s/it]                                                       {'loss': 1.8153, 'learning_rate': 0.0002779792570271554, 'epoch': 0.38}
+ 38%|███▊      | 2589/6779 [1:35:58<2:31:35,  2.17s/it] 38%|███▊      | 2590/6779 [1:36:00<2:31:55,  2.18s/it]                                                       {'loss': 1.7977, 'learning_rate': 0.00027789261977194445, 'epoch': 0.38}
+ 38%|███▊      | 2590/6779 [1:36:00<2:31:55,  2.18s/it] 38%|███▊      | 2591/6779 [1:36:02<2:30:20,  2.15s/it]                                                       {'loss': 1.7976, 'learning_rate': 0.0002778059652832465, 'epoch': 0.38}
+ 38%|███▊      | 2591/6779 [1:36:02<2:30:20,  2.15s/it] 38%|███▊      | 2592/6779 [1:36:04<2:33:30,  2.20s/it]                                                       {'loss': 1.7463, 'learning_rate': 0.0002777192935802335, 'epoch': 0.38}
+ 38%|███▊      | 2592/6779 [1:36:04<2:33:30,  2.20s/it] 38%|███▊      | 2593/6779 [1:36:06<2:32:12,  2.18s/it]                                                       {'loss': 1.8497, 'learning_rate': 0.00027763260468208136, 'epoch': 0.38}
+ 38%|███▊      | 2593/6779 [1:36:06<2:32:12,  2.18s/it] 38%|███▊      | 2594/6779 [1:36:09<2:30:14,  2.15s/it]                                                       {'loss': 1.6784, 'learning_rate': 0.0002775458986079697, 'epoch': 0.38}
+ 38%|███▊      | 2594/6779 [1:36:09<2:30:14,  2.15s/it] 38%|███▊      | 2595/6779 [1:36:11<2:38:51,  2.28s/it]                                                       {'loss': 1.726, 'learning_rate': 0.0002774591753770819, 'epoch': 0.38}
+ 38%|███▊      | 2595/6779 [1:36:11<2:38:51,  2.28s/it] 38%|███▊      | 2596/6779 [1:36:13<2:33:05,  2.20s/it]                                                       {'loss': 1.7032, 'learning_rate': 0.0002773724350086054, 'epoch': 0.38}
+ 38%|███▊      | 2596/6779 [1:36:13<2:33:05,  2.20s/it] 38%|███▊      | 2597/6779 [1:36:15<2:32:15,  2.18s/it]                                                       {'loss': 1.6552, 'learning_rate': 0.00027728567752173094, 'epoch': 0.38}
+ 38%|███▊      | 2597/6779 [1:36:15<2:32:15,  2.18s/it] 38%|███▊      | 2598/6779 [1:36:17<2:32:25,  2.19s/it]                                                       {'loss': 1.7063, 'learning_rate': 0.00027719890293565353, 'epoch': 0.38}
+ 38%|███▊      | 2598/6779 [1:36:17<2:32:25,  2.19s/it] 38%|███▊      | 2599/6779 [1:36:20<2:34:34,  2.22s/it]                                                       {'loss': 1.6855, 'learning_rate': 0.00027711211126957156, 'epoch': 0.38}
+ 38%|███▊      | 2599/6779 [1:36:20<2:34:34,  2.22s/it] 38%|███▊      | 2600/6779 [1:36:22<2:34:40,  2.22s/it]                                                       {'loss': 1.776, 'learning_rate': 0.0002770253025426876, 'epoch': 0.38}
+ 38%|███▊      | 2600/6779 [1:36:22<2:34:40,  2.22s/it] 38%|███▊      | 2601/6779 [1:36:25<2:43:11,  2.34s/it]                                                       {'loss': 1.8495, 'learning_rate': 0.00027693847677420774, 'epoch': 0.38}
+ 38%|███▊      | 2601/6779 [1:36:25<2:43:11,  2.34s/it] 38%|███▊      | 2602/6779 [1:36:27<2:37:40,  2.26s/it]                                                       {'loss': 1.9084, 'learning_rate': 0.00027685163398334184, 'epoch': 0.38}
+ 38%|███▊      | 2602/6779 [1:36:27<2:37:40,  2.26s/it] 38%|███▊      | 2603/6779 [1:36:29<2:44:57,  2.37s/it]                                                       {'loss': 1.6917, 'learning_rate': 0.00027676477418930363, 'epoch': 0.38}
+ 38%|███▊      | 2603/6779 [1:36:29<2:44:57,  2.37s/it] 38%|███▊      | 2604/6779 [1:36:31<2:40:14,  2.30s/it]                                                       {'loss': 1.6001, 'learning_rate': 0.00027667789741131054, 'epoch': 0.38}
+ 38%|███▊      | 2604/6779 [1:36:31<2:40:14,  2.30s/it] 38%|███▊      | 2605/6779 [1:36:34<2:37:41,  2.27s/it]                                                       {'loss': 1.646, 'learning_rate': 0.00027659100366858385, 'epoch': 0.38}
+ 38%|███▊      | 2605/6779 [1:36:34<2:37:41,  2.27s/it] 38%|███▊      | 2606/6779 [1:36:36<2:36:38,  2.25s/it]                                                       {'loss': 1.7231, 'learning_rate': 0.00027650409298034836, 'epoch': 0.38}
+ 38%|███▊      | 2606/6779 [1:36:36<2:36:38,  2.25s/it] 38%|███▊      | 2607/6779 [1:36:38<2:32:17,  2.19s/it]                                                       {'loss': 1.7175, 'learning_rate': 0.0002764171653658329, 'epoch': 0.38}
+ 38%|███▊      | 2607/6779 [1:36:38<2:32:17,  2.19s/it] 38%|███▊      | 2608/6779 [1:36:40<2:32:53,  2.20s/it]                                                       {'loss': 1.6527, 'learning_rate': 0.00027633022084426993, 'epoch': 0.38}
+ 38%|███▊      | 2608/6779 [1:36:40<2:32:53,  2.20s/it] 38%|███▊      | 2609/6779 [1:36:42<2:29:50,  2.16s/it]                                                       {'loss': 1.721, 'learning_rate': 0.0002762432594348955, 'epoch': 0.38}
+ 38%|███▊      | 2609/6779 [1:36:42<2:29:50,  2.16s/it] 39%|███▊      | 2610/6779 [1:36:45<2:43:55,  2.36s/it]                                                       {'loss': 1.6283, 'learning_rate': 0.00027615628115694967, 'epoch': 0.39}
+ 39%|███▊      | 2610/6779 [1:36:45<2:43:55,  2.36s/it] 39%|███▊      | 2611/6779 [1:36:47<2:38:56,  2.29s/it]                                                       {'loss': 1.6781, 'learning_rate': 0.000276069286029676, 'epoch': 0.39}
+ 39%|███▊      | 2611/6779 [1:36:47<2:38:56,  2.29s/it] 39%|███▊      | 2612/6779 [1:36:49<2:36:38,  2.26s/it]                                                       {'loss': 1.7965, 'learning_rate': 0.00027598227407232205, 'epoch': 0.39}
+ 39%|███▊      | 2612/6779 [1:36:49<2:36:38,  2.26s/it] 39%|███▊      | 2613/6779 [1:36:51<2:33:58,  2.22s/it]                                                       {'loss': 1.6885, 'learning_rate': 0.0002758952453041387, 'epoch': 0.39}
+ 39%|███▊      | 2613/6779 [1:36:51<2:33:58,  2.22s/it] 39%|███▊      | 2614/6779 [1:36:54<2:38:32,  2.28s/it]                                                       {'loss': 1.6641, 'learning_rate': 0.00027580819974438103, 'epoch': 0.39}
+ 39%|███▊      | 2614/6779 [1:36:54<2:38:32,  2.28s/it] 39%|███▊      | 2615/6779 [1:36:56<2:34:53,  2.23s/it]                                                       {'loss': 1.7767, 'learning_rate': 0.0002757211374123074, 'epoch': 0.39}
+ 39%|███▊      | 2615/6779 [1:36:56<2:34:53,  2.23s/it] 39%|███▊      | 2616/6779 [1:36:58<2:32:24,  2.20s/it]                                                       {'loss': 1.5704, 'learning_rate': 0.0002756340583271801, 'epoch': 0.39}
+ 39%|███▊      | 2616/6779 [1:36:58<2:32:24,  2.20s/it] 39%|███▊      | 2617/6779 [1:37:01<2:37:09,  2.27s/it]                                                       {'loss': 1.7948, 'learning_rate': 0.0002755469625082651, 'epoch': 0.39}
+ 39%|███▊      | 2617/6779 [1:37:01<2:37:09,  2.27s/it] 39%|███▊      | 2618/6779 [1:37:03<2:36:37,  2.26s/it]                                                       {'loss': 1.7461, 'learning_rate': 0.0002754598499748321, 'epoch': 0.39}
+ 39%|███▊      | 2618/6779 [1:37:03<2:36:37,  2.26s/it] 39%|███▊      | 2619/6779 [1:37:05<2:31:34,  2.19s/it]                                                       {'loss': 1.7024, 'learning_rate': 0.00027537272074615435, 'epoch': 0.39}
+ 39%|███▊      | 2619/6779 [1:37:05<2:31:34,  2.19s/it] 39%|███▊      | 2620/6779 [1:37:07<2:32:13,  2.20s/it]                                                       {'loss': 1.6648, 'learning_rate': 0.00027528557484150914, 'epoch': 0.39}
+ 39%|███▊      | 2620/6779 [1:37:07<2:32:13,  2.20s/it] 39%|███▊      | 2621/6779 [1:37:09<2:34:28,  2.23s/it]                                                       {'loss': 1.8016, 'learning_rate': 0.00027519841228017695, 'epoch': 0.39}
+ 39%|███▊      | 2621/6779 [1:37:09<2:34:28,  2.23s/it] 39%|███▊      | 2622/6779 [1:37:11<2:29:36,  2.16s/it]                                                       {'loss': 1.697, 'learning_rate': 0.0002751112330814424, 'epoch': 0.39}
+ 39%|███▊      | 2622/6779 [1:37:11<2:29:36,  2.16s/it] 39%|███▊      | 2623/6779 [1:37:13<2:29:18,  2.16s/it]                                                       {'loss': 1.8619, 'learning_rate': 0.0002750240372645935, 'epoch': 0.39}
+ 39%|███▊      | 2623/6779 [1:37:13<2:29:18,  2.16s/it] 39%|███▊      | 2624/6779 [1:37:16<2:31:14,  2.18s/it]                                                       {'loss': 1.742, 'learning_rate': 0.000274936824848922, 'epoch': 0.39}
+ 39%|███▊      | 2624/6779 [1:37:16<2:31:14,  2.18s/it] 39%|███▊      | 2625/6779 [1:37:18<2:30:04,  2.17s/it]                                                       {'loss': 1.7514, 'learning_rate': 0.00027484959585372354, 'epoch': 0.39}
+ 39%|███▊      | 2625/6779 [1:37:18<2:30:04,  2.17s/it] 39%|███▊      | 2626/6779 [1:37:20<2:28:02,  2.14s/it]                                                       {'loss': 1.7154, 'learning_rate': 0.0002747623502982971, 'epoch': 0.39}
+ 39%|███▊      | 2626/6779 [1:37:20<2:28:02,  2.14s/it] 39%|███▉      | 2627/6779 [1:37:22<2:26:46,  2.12s/it]                                                       {'loss': 1.618, 'learning_rate': 0.00027467508820194547, 'epoch': 0.39}
+ 39%|███▉      | 2627/6779 [1:37:22<2:26:46,  2.12s/it] 39%|███▉      | 2628/6779 [1:37:24<2:29:22,  2.16s/it]                                                       {'loss': 1.8276, 'learning_rate': 0.0002745878095839753, 'epoch': 0.39}
+ 39%|███▉      | 2628/6779 [1:37:24<2:29:22,  2.16s/it] 39%|███▉      | 2629/6779 [1:37:27<2:32:57,  2.21s/it]                                                       {'loss': 1.8154, 'learning_rate': 0.0002745005144636965, 'epoch': 0.39}
+ 39%|███▉      | 2629/6779 [1:37:27<2:32:57,  2.21s/it] 39%|███▉      | 2630/6779 [1:37:29<2:30:20,  2.17s/it]                                                       {'loss': 1.6208, 'learning_rate': 0.0002744132028604228, 'epoch': 0.39}
+ 39%|███▉      | 2630/6779 [1:37:29<2:30:20,  2.17s/it] 39%|███▉      | 2631/6779 [1:37:31<2:33:33,  2.22s/it]                                                       {'loss': 1.5041, 'learning_rate': 0.00027432587479347167, 'epoch': 0.39}
+ 39%|███▉      | 2631/6779 [1:37:31<2:33:33,  2.22s/it] 39%|███▉      | 2632/6779 [1:37:33<2:29:14,  2.16s/it]                                                       {'loss': 1.6559, 'learning_rate': 0.0002742385302821642, 'epoch': 0.39}
+ 39%|███▉      | 2632/6779 [1:37:33<2:29:14,  2.16s/it] 39%|███▉      | 2633/6779 [1:37:35<2:24:55,  2.10s/it]                                                       {'loss': 1.525, 'learning_rate': 0.0002741511693458251, 'epoch': 0.39}
+ 39%|███▉      | 2633/6779 [1:37:35<2:24:55,  2.10s/it] 39%|███▉      | 2634/6779 [1:37:37<2:31:53,  2.20s/it]                                                       {'loss': 1.796, 'learning_rate': 0.0002740637920037825, 'epoch': 0.39}
+ 39%|███��      | 2634/6779 [1:37:37<2:31:53,  2.20s/it] 39%|███▉      | 2635/6779 [1:37:40<2:33:21,  2.22s/it]                                                       {'loss': 1.8255, 'learning_rate': 0.0002739763982753686, 'epoch': 0.39}
+ 39%|███▉      | 2635/6779 [1:37:40<2:33:21,  2.22s/it] 39%|███▉      | 2636/6779 [1:37:42<2:31:27,  2.19s/it]                                                       {'loss': 1.8178, 'learning_rate': 0.0002738889881799189, 'epoch': 0.39}
+ 39%|███▉      | 2636/6779 [1:37:42<2:31:27,  2.19s/it] 39%|███▉      | 2637/6779 [1:37:44<2:32:44,  2.21s/it]                                                       {'loss': 1.6307, 'learning_rate': 0.0002738015617367726, 'epoch': 0.39}
+ 39%|███▉      | 2637/6779 [1:37:44<2:32:44,  2.21s/it] 39%|███▉      | 2638/6779 [1:37:46<2:32:52,  2.21s/it]                                                       {'loss': 1.804, 'learning_rate': 0.0002737141189652723, 'epoch': 0.39}
+ 39%|███▉      | 2638/6779 [1:37:46<2:32:52,  2.21s/it] 39%|███▉      | 2639/6779 [1:37:48<2:30:31,  2.18s/it]                                                       {'loss': 1.6878, 'learning_rate': 0.0002736266598847648, 'epoch': 0.39}
+ 39%|███▉      | 2639/6779 [1:37:48<2:30:31,  2.18s/it] 39%|███▉      | 2640/6779 [1:37:51<2:29:53,  2.17s/it]                                                       {'loss': 1.736, 'learning_rate': 0.00027353918451459983, 'epoch': 0.39}
+ 39%|███▉      | 2640/6779 [1:37:51<2:29:53,  2.17s/it] 39%|███▉      | 2641/6779 [1:37:53<2:30:16,  2.18s/it]                                                       {'loss': 1.6643, 'learning_rate': 0.00027345169287413114, 'epoch': 0.39}
+ 39%|███▉      | 2641/6779 [1:37:53<2:30:16,  2.18s/it] 39%|███▉      | 2642/6779 [1:37:55<2:30:52,  2.19s/it]                                                       {'loss': 1.74, 'learning_rate': 0.00027336418498271595, 'epoch': 0.39}
+ 39%|███▉      | 2642/6779 [1:37:55<2:30:52,  2.19s/it] 39%|███▉      | 2643/6779 [1:37:57<2:29:15,  2.17s/it]                                                       {'loss': 1.8239, 'learning_rate': 0.0002732766608597151, 'epoch': 0.39}
+ 39%|███▉      | 2643/6779 [1:37:57<2:29:15,  2.17s/it] 39%|███▉      | 2644/6779 [1:37:59<2:27:24,  2.14s/it]                                                       {'loss': 1.5428, 'learning_rate': 0.0002731891205244931, 'epoch': 0.39}
+ 39%|███▉      | 2644/6779 [1:37:59<2:27:24,  2.14s/it] 39%|███▉      | 2645/6779 [1:38:02<2:36:48,  2.28s/it]                                                       {'loss': 1.713, 'learning_rate': 0.00027310156399641786, 'epoch': 0.39}
+ 39%|███▉      | 2645/6779 [1:38:02<2:36:48,  2.28s/it] 39%|███▉      | 2646/6779 [1:38:04<2:36:21,  2.27s/it]                                                       {'loss': 1.6413, 'learning_rate': 0.00027301399129486104, 'epoch': 0.39}
+ 39%|███▉      | 2646/6779 [1:38:04<2:36:21,  2.27s/it] 39%|███▉      | 2647/6779 [1:38:06<2:33:14,  2.23s/it]                                                       {'loss': 1.959, 'learning_rate': 0.0002729264024391978, 'epoch': 0.39}
+ 39%|███▉      | 2647/6779 [1:38:06<2:33:14,  2.23s/it] 39%|███▉      | 2648/6779 [1:38:08<2:29:27,  2.17s/it]                                                       {'loss': 1.7505, 'learning_rate': 0.00027283879744880677, 'epoch': 0.39}
+ 39%|███▉      | 2648/6779 [1:38:08<2:29:27,  2.17s/it] 39%|███▉      | 2649/6779 [1:38:10<2:31:30,  2.20s/it]                                                       {'loss': 1.6374, 'learning_rate': 0.0002727511763430704, 'epoch': 0.39}
+ 39%|███▉      | 2649/6779 [1:38:10<2:31:30,  2.20s/it] 39%|███▉      | 2650/6779 [1:38:13<2:35:57,  2.27s/it]                                                       {'loss': 1.7819, 'learning_rate': 0.00027266353914137453, 'epoch': 0.39}
+ 39%|███▉      | 2650/6779 [1:38:13<2:35:57,  2.27s/it] 39%|███▉      | 2651/6779 [1:38:15<2:41:09,  2.34s/it]                                                       {'loss': 1.7186, 'learning_rate': 0.00027257588586310867, 'epoch': 0.39}
+ 39%|███▉      | 2651/6779 [1:38:15<2:41:09,  2.34s/it] 39%|███▉      | 2652/6779 [1:38:18<2:43:53,  2.38s/it]                                                       {'loss': 1.7185, 'learning_rate': 0.00027248821652766574, 'epoch': 0.39}
+ 39%|███▉      | 2652/6779 [1:38:18<2:43:53,  2.38s/it] 39%|███▉      | 2653/6779 [1:38:20<2:39:10,  2.31s/it]                                                       {'loss': 1.6255, 'learning_rate': 0.00027240053115444227, 'epoch': 0.39}
+ 39%|███▉      | 2653/6779 [1:38:20<2:39:10,  2.31s/it] 39%|███▉      | 2654/6779 [1:38:23<2:43:55,  2.38s/it]                                                       {'loss': 1.7271, 'learning_rate': 0.00027231282976283844, 'epoch': 0.39}
+ 39%|███▉      | 2654/6779 [1:38:23<2:43:55,  2.38s/it] 39%|███▉      | 2655/6779 [1:38:25<2:37:15,  2.29s/it]                                                       {'loss': 1.7704, 'learning_rate': 0.00027222511237225784, 'epoch': 0.39}
+ 39%|███▉      | 2655/6779 [1:38:25<2:37:15,  2.29s/it] 39%|███▉      | 2656/6779 [1:38:27<2:40:25,  2.33s/it]                                                       {'loss': 1.685, 'learning_rate': 0.0002721373790021077, 'epoch': 0.39}
+ 39%|███▉      | 2656/6779 [1:38:27<2:40:25,  2.33s/it] 39%|███▉      | 2657/6779 [1:38:29<2:33:48,  2.24s/it]                                                       {'loss': 1.7239, 'learning_rate': 0.0002720496296717987, 'epoch': 0.39}
+ 39%|███▉      | 2657/6779 [1:38:29<2:33:48,  2.24s/it] 39%|███▉      | 2658/6779 [1:38:31<2:30:14,  2.19s/it]                                                       {'loss': 1.8237, 'learning_rate': 0.00027196186440074514, 'epoch': 0.39}
+ 39%|███▉      | 2658/6779 [1:38:31<2:30:14,  2.19s/it] 39%|███▉      | 2659/6779 [1:38:33<2:30:38,  2.19s/it]                                                       {'loss': 1.8255, 'learning_rate': 0.0002718740832083647, 'epoch': 0.39}
+ 39%|███▉      | 2659/6779 [1:38:33<2:30:38,  2.19s/it] 39%|███▉      | 2660/6779 [1:38:35<2:29:34,  2.18s/it]                                                       {'loss': 1.8527, 'learning_rate': 0.0002717862861140788, 'epoch': 0.39}
+ 39%|███▉      | 2660/6779 [1:38:35<2:29:34,  2.18s/it] 39%|███▉      | 2661/6779 [1:38:38<2:29:35,  2.18s/it]                                                       {'loss': 1.7609, 'learning_rate': 0.0002716984731373122, 'epoch': 0.39}
+ 39%|███▉      | 2661/6779 [1:38:38<2:29:35,  2.18s/it] 39%|███▉      | 2662/6779 [1:38:40<2:29:00,  2.17s/it]                                                       {'loss': 1.5658, 'learning_rate': 0.00027161064429749327, 'epoch': 0.39}
+ 39%|███▉      | 2662/6779 [1:38:40<2:29:00,  2.17s/it] 39%|███▉      | 2663/6779 [1:38:42<2:28:38,  2.17s/it]                                                       {'loss': 1.7491, 'learning_rate': 0.0002715227996140538, 'epoch': 0.39}
+ 39%|███▉      | 2663/6779 [1:38:42<2:28:38,  2.17s/it] 39%|███▉      | 2664/6779 [1:38:44<2:28:49,  2.17s/it]                                                       {'loss': 1.6562, 'learning_rate': 0.00027143493910642915, 'epoch': 0.39}
+ 39%|███▉      | 2664/6779 [1:38:44<2:28:49,  2.17s/it] 39%|███▉      | 2665/6779 [1:38:46<2:28:18,  2.16s/it]                                                       {'loss': 1.7336, 'learning_rate': 0.0002713470627940582, 'epoch': 0.39}
+ 39%|███▉      | 2665/6779 [1:38:46<2:28:18,  2.16s/it] 39%|███▉      | 2666/6779 [1:38:48<2:27:41,  2.15s/it]                                                       {'loss': 1.7158, 'learning_rate': 0.0002712591706963833, 'epoch': 0.39}
+ 39%|███▉      | 2666/6779 [1:38:48<2:27:41,  2.15s/it] 39%|███▉      | 2667/6779 [1:38:50<2:22:49,  2.08s/it]                                                       {'loss': 1.7406, 'learning_rate': 0.0002711712628328502, 'epoch': 0.39}
+ 39%|███▉      | 2667/6779 [1:38:50<2:22:49,  2.08s/it] 39%|███▉      | 2668/6779 [1:38:52<2:23:34,  2.10s/it]                                                       {'loss': 1.6897, 'learning_rate': 0.0002710833392229084, 'epoch': 0.39}
+ 39%|███▉      | 2668/6779 [1:38:52<2:23:34,  2.10s/it] 39%|███▉      | 2669/6779 [1:38:55<2:23:37,  2.10s/it]                                                       {'loss': 1.6325, 'learning_rate': 0.00027099539988601054, 'epoch': 0.39}
+ 39%|███▉      | 2669/6779 [1:38:55<2:23:37,  2.10s/it] 39%|███▉      | 2670/6779 [1:38:57<2:27:40,  2.16s/it]                                                       {'loss': 1.7679, 'learning_rate': 0.000270907444841613, 'epoch': 0.39}
+ 39%|███▉      | 2670/6779 [1:38:57<2:27:40,  2.16s/it] 39%|███▉      | 2671/6779 [1:38:59<2:30:31,  2.20s/it]                                                       {'loss': 1.7516, 'learning_rate': 0.00027081947410917547, 'epoch': 0.39}
+ 39%|███▉      | 2671/6779 [1:38:59<2:30:31,  2.20s/it] 39%|███▉      | 2672/6779 [1:39:01<2:31:29,  2.21s/it]                                                       {'loss': 1.6961, 'learning_rate': 0.0002707314877081613, 'epoch': 0.39}
+ 39%|███▉      | 2672/6779 [1:39:01<2:31:29,  2.21s/it] 39%|███▉      | 2673/6779 [1:39:04<2:34:05,  2.25s/it]                                                       {'loss': 1.747, 'learning_rate': 0.0002706434856580371, 'epoch': 0.39}
+ 39%|███▉      | 2673/6779 [1:39:04<2:34:05,  2.25s/it] 39%|███▉      | 2674/6779 [1:39:06<2:27:58,  2.16s/it]                                                       {'loss': 1.497, 'learning_rate': 0.0002705554679782731, 'epoch': 0.39}
+ 39%|███▉      | 2674/6779 [1:39:06<2:27:58,  2.16s/it] 39%|███▉      | 2675/6779 [1:39:08<2:29:44,  2.19s/it]                                                       {'loss': 1.8615, 'learning_rate': 0.00027046743468834287, 'epoch': 0.39}
+ 39%|███▉      | 2675/6779 [1:39:08<2:29:44,  2.19s/it] 39%|███▉      | 2676/6779 [1:39:10<2:29:27,  2.19s/it]                                                       {'loss': 1.8812, 'learning_rate': 0.0002703793858077235, 'epoch': 0.39}
+ 39%|███▉      | 2676/6779 [1:39:10<2:29:27,  2.19s/it] 39%|███▉      | 2677/6779 [1:39:12<2:27:08,  2.15s/it]                                                       {'loss': 1.7588, 'learning_rate': 0.00027029132135589554, 'epoch': 0.39}
+ 39%|███▉      | 2677/6779 [1:39:12<2:27:08,  2.15s/it] 40%|███▉      | 2678/6779 [1:39:15<2:30:10,  2.20s/it]                                                       {'loss': 1.7745, 'learning_rate': 0.000270203241352343, 'epoch': 0.4}
+ 40%|███▉      | 2678/6779 [1:39:15<2:30:10,  2.20s/it] 40%|███▉      | 2679/6779 [1:39:17<2:27:44,  2.16s/it]                                                       {'loss': 1.7685, 'learning_rate': 0.0002701151458165532, 'epoch': 0.4}
+ 40%|███▉      | 2679/6779 [1:39:17<2:27:44,  2.16s/it] 40%|███▉      | 2680/6779 [1:39:19<2:27:46,  2.16s/it]                                                       {'loss': 1.7491, 'learning_rate': 0.00027002703476801697, 'epoch': 0.4}
+ 40%|███▉      | 2680/6779 [1:39:19<2:27:46,  2.16s/it] 40%|███▉      | 2681/6779 [1:39:21<2:35:02,  2.27s/it]                                                       {'loss': 1.5923, 'learning_rate': 0.00026993890822622866, 'epoch': 0.4}
+ 40%|███▉      | 2681/6779 [1:39:21<2:35:02,  2.27s/it] 40%|███▉      | 2682/6779 [1:39:24<2:34:50,  2.27s/it]                                                       {'loss': 1.7924, 'learning_rate': 0.000269850766210686, 'epoch': 0.4}
+ 40%|███▉      | 2682/6779 [1:39:24<2:34:50,  2.27s/it] 40%|███▉      | 2683/6779 [1:39:26<2:43:09,  2.39s/it]                                                       {'loss': 1.6684, 'learning_rate': 0.0002697626087408901, 'epoch': 0.4}
+ 40%|███▉      | 2683/6779 [1:39:26<2:43:09,  2.39s/it] 40%|███▉      | 2684/6779 [1:39:28<2:40:58,  2.36s/it]                                                       {'loss': 1.7404, 'learning_rate': 0.00026967443583634544, 'epoch': 0.4}
+ 40%|███▉      | 2684/6779 [1:39:28<2:40:58,  2.36s/it] 40%|███▉      | 2685/6779 [1:39:31<2:38:16,  2.32s/it]                                                       {'loss': 1.6271, 'learning_rate': 0.00026958624751656014, 'epoch': 0.4}
+ 40%|███▉      | 2685/6779 [1:39:31<2:38:16,  2.32s/it] 40%|███▉      | 2686/6779 [1:39:33<2:33:58,  2.26s/it]                                                       {'loss': 1.7385, 'learning_rate': 0.0002694980438010454, 'epoch': 0.4}
+ 40%|███▉      | 2686/6779 [1:39:33<2:33:58,  2.26s/it] 40%|███▉      | 2687/6779 [1:39:35<2:31:57,  2.23s/it]                                                       {'loss': 1.7497, 'learning_rate': 0.00026940982470931616, 'epoch': 0.4}
+ 40%|███▉      | 2687/6779 [1:39:35<2:31:57,  2.23s/it] 40%|███▉      | 2688/6779 [1:39:37<2:31:14,  2.22s/it]                                                       {'loss': 1.6816, 'learning_rate': 0.00026932159026089045, 'epoch': 0.4}
+ 40%|███▉      | 2688/6779 [1:39:37<2:31:14,  2.22s/it] 40%|███▉      | 2689/6779 [1:39:39<2:28:18,  2.18s/it]                                                       {'loss': 1.7837, 'learning_rate': 0.00026923334047528996, 'epoch': 0.4}
+ 40%|███▉      | 2689/6779 [1:39:39<2:28:18,  2.18s/it] 40%|███▉      | 2690/6779 [1:39:41<2:26:57,  2.16s/it]                                                       {'loss': 1.7908, 'learning_rate': 0.00026914507537203965, 'epoch': 0.4}
+ 40%|███▉      | 2690/6779 [1:39:41<2:26:57,  2.16s/it] 40%|███▉      | 2691/6779 [1:39:43<2:22:22,  2.09s/it]                                                       {'loss': 1.7243, 'learning_rate': 0.0002690567949706679, 'epoch': 0.4}
+ 40%|███▉      | 2691/6779 [1:39:43<2:22:22,  2.09s/it] 40%|███▉      | 2692/6779 [1:39:46<2:27:19,  2.16s/it]                                                       {'loss': 1.9287, 'learning_rate': 0.0002689684992907064, 'epoch': 0.4}
+ 40%|███▉      | 2692/6779 [1:39:46<2:27:19,  2.16s/it] 40%|███▉      | 2693/6779 [1:39:48<2:29:17,  2.19s/it]                                                       {'loss': 1.7443, 'learning_rate': 0.00026888018835169035, 'epoch': 0.4}
+ 40%|███▉      | 2693/6779 [1:39:48<2:29:17,  2.19s/it] 40%|███▉      | 2694/6779 [1:39:50<2:27:10,  2.16s/it]                                                       {'loss': 1.8558, 'learning_rate': 0.0002687918621731582, 'epoch': 0.4}
+ 40%|███▉      | 2694/6779 [1:39:50<2:27:10,  2.16s/it] 40%|███▉      | 2695/6779 [1:39:52<2:26:00,  2.15s/it]                                                       {'loss': 1.6454, 'learning_rate': 0.0002687035207746519, 'epoch': 0.4}
+ 40%|███▉      | 2695/6779 [1:39:52<2:26:00,  2.15s/it] 40%|███▉      | 2696/6779 [1:39:54<2:25:37,  2.14s/it]                                                       {'loss': 1.8683, 'learning_rate': 0.0002686151641757166, 'epoch': 0.4}
+ 40%|███▉      | 2696/6779 [1:39:54<2:25:37,  2.14s/it] 40%|███▉      | 2697/6779 [1:39:57<2:33:33,  2.26s/it]                                                       {'loss': 1.7637, 'learning_rate': 0.0002685267923959009, 'epoch': 0.4}
+ 40%|███▉      | 2697/6779 [1:39:57<2:33:33,  2.26s/it] 40%|███▉      | 2698/6779 [1:39:59<2:31:35,  2.23s/it]                                                       {'loss': 1.8187, 'learning_rate': 0.0002684384054547568, 'epoch': 0.4}
+ 40%|███▉      | 2698/6779 [1:39:59<2:31:35,  2.23s/it] 40%|███▉      | 2699/6779 [1:40:01<2:29:29,  2.20s/it]                                                       {'loss': 1.782, 'learning_rate': 0.0002683500033718398, 'epoch': 0.4}
+ 40%|███▉      | 2699/6779 [1:40:01<2:29:29,  2.20s/it] 40%|███▉      | 2700/6779 [1:40:03<2:31:34,  2.23s/it]                                                       {'loss': 1.7728, 'learning_rate': 0.00026826158616670827, 'epoch': 0.4}
+ 40%|███▉      | 2700/6779 [1:40:03<2:31:34,  2.23s/it] 40%|███▉      | 2701/6779 [1:40:05<2:29:45,  2.20s/it]                                                       {'loss': 1.6827, 'learning_rate': 0.00026817315385892443, 'epoch': 0.4}
+ 40%|███▉      | 2701/6779 [1:40:05<2:29:45,  2.20s/it] 40%|███▉      | 2702/6779 [1:40:08<2:26:33,  2.16s/it]                                                       {'loss': 1.6407, 'learning_rate': 0.0002680847064680536, 'epoch': 0.4}
+ 40%|███▉      | 2702/6779 [1:40:08<2:26:33,  2.16s/it] 40%|███▉      | 2703/6779 [1:40:10<2:31:34,  2.23s/it]                                                       {'loss': 1.4508, 'learning_rate': 0.00026799624401366436, 'epoch': 0.4}
+ 40%|███▉      | 2703/6779 [1:40:10<2:31:34,  2.23s/it] 40%|███▉      | 2704/6779 [1:40:12<2:28:32,  2.19s/it]                                                       {'loss': 1.8062, 'learning_rate': 0.0002679077665153289, 'epoch': 0.4}
+ 40%|███▉      | 2704/6779 [1:40:12<2:28:32,  2.19s/it] 40%|███▉      | 2705/6779 [1:40:14<2:27:42,  2.18s/it]                                                       {'loss': 1.6535, 'learning_rate': 0.0002678192739926225, 'epoch': 0.4}
+ 40%|███▉      | 2705/6779 [1:40:14<2:27:42,  2.18s/it] 40%|███▉      | 2706/6779 [1:40:16<2:23:20,  2.11s/it]                                                       {'loss': 1.8651, 'learning_rate': 0.00026773076646512383, 'epoch': 0.4}
+ 40%|███▉      | 2706/6779 [1:40:16<2:23:20,  2.11s/it] 40%|███▉      | 2707/6779 [1:40:18<2:26:41,  2.16s/it]                                                       {'loss': 1.798, 'learning_rate': 0.0002676422439524149, 'epoch': 0.4}
+ 40%|███▉      | 2707/6779 [1:40:18<2:26:41,  2.16s/it] 40%|███▉      | 2708/6779 [1:40:21<2:33:42,  2.27s/it]                                                       {'loss': 1.7616, 'learning_rate': 0.00026755370647408113, 'epoch': 0.4}
+ 40%|███▉      | 2708/6779 [1:40:21<2:33:42,  2.27s/it] 40%|███▉      | 2709/6779 [1:40:23<2:27:38,  2.18s/it]                                                       {'loss': 1.5987, 'learning_rate': 0.00026746515404971096, 'epoch': 0.4}
+ 40%|███▉      | 2709/6779 [1:40:23<2:27:38,  2.18s/it] 40%|███▉      | 2710/6779 [1:40:25<2:25:55,  2.15s/it]                                                       {'loss': 1.6596, 'learning_rate': 0.0002673765866988965, 'epoch': 0.4}
+ 40%|███▉      | 2710/6779 [1:40:25<2:25:55,  2.15s/it] 40%|███▉      | 2711/6779 [1:40:28<2:35:55,  2.30s/it]                                                       {'loss': 1.7157, 'learning_rate': 0.00026728800444123283, 'epoch': 0.4}
+ 40%|███▉      | 2711/6779 [1:40:28<2:35:55,  2.30s/it] 40%|████      | 2712/6779 [1:40:30<2:45:15,  2.44s/it]                                                       {'loss': 1.6058, 'learning_rate': 0.0002671994072963185, 'epoch': 0.4}
+ 40%|████      | 2712/6779 [1:40:30<2:45:15,  2.44s/it] 40%|████      | 2713/6779 [1:40:32<2:36:47,  2.31s/it]                                                       {'loss': 1.6734, 'learning_rate': 0.0002671107952837555, 'epoch': 0.4}
+ 40%|████      | 2713/6779 [1:40:32<2:36:47,  2.31s/it] 40%|████      | 2714/6779 [1:40:35<2:37:13,  2.32s/it]                                                       {'loss': 1.5894, 'learning_rate': 0.0002670221684231488, 'epoch': 0.4}
+ 40%|████      | 2714/6779 [1:40:35<2:37:13,  2.32s/it] 40%|████      | 2715/6779 [1:40:37<2:32:14,  2.25s/it]                                                       {'loss': 1.696, 'learning_rate': 0.00026693352673410687, 'epoch': 0.4}
+ 40%|████      | 2715/6779 [1:40:37<2:32:14,  2.25s/it] 40%|████      | 2716/6779 [1:40:39<2:31:32,  2.24s/it]                                                       {'loss': 1.7432, 'learning_rate': 0.0002668448702362413, 'epoch': 0.4}
+ 40%|████      | 2716/6779 [1:40:39<2:31:32,  2.24s/it] 40%|████      | 2717/6779 [1:40:41<2:28:31,  2.19s/it]                                                       {'loss': 1.7311, 'learning_rate': 0.00026675619894916725, 'epoch': 0.4}
+ 40%|████      | 2717/6779 [1:40:41<2:28:31,  2.19s/it] 40%|████      | 2718/6779 [1:40:43<2:27:03,  2.17s/it]                                                       {'loss': 1.7749, 'learning_rate': 0.00026666751289250267, 'epoch': 0.4}
+ 40%|████      | 2718/6779 [1:40:43<2:27:03,  2.17s/it] 40%|████      | 2719/6779 [1:40:45<2:25:32,  2.15s/it]                                                       {'loss': 1.7033, 'learning_rate': 0.00026657881208586937, 'epoch': 0.4}
+ 40%|████      | 2719/6779 [1:40:45<2:25:32,  2.15s/it] 40%|████      | 2720/6779 [1:40:47<2:23:42,  2.12s/it]                                                       {'loss': 1.8257, 'learning_rate': 0.00026649009654889174, 'epoch': 0.4}
+ 40%|████      | 2720/6779 [1:40:47<2:23:42,  2.12s/it] 40%|████      | 2721/6779 [1:40:50<2:23:26,  2.12s/it]                                                       {'loss': 1.7465, 'learning_rate': 0.0002664013663011982, 'epoch': 0.4}
+ 40%|████      | 2721/6779 [1:40:50<2:23:26,  2.12s/it] 40%|████      | 2722/6779 [1:40:52<2:23:50,  2.13s/it]                                                       {'loss': 1.7345, 'learning_rate': 0.0002663126213624198, 'epoch': 0.4}
+ 40%|████      | 2722/6779 [1:40:52<2:23:50,  2.13s/it] 40%|████      | 2723/6779 [1:40:54<2:22:57,  2.11s/it]                                                       {'loss': 1.7687, 'learning_rate': 0.00026622386175219104, 'epoch': 0.4}
+ 40%|████      | 2723/6779 [1:40:54<2:22:57,  2.11s/it] 40%|████      | 2724/6779 [1:40:56<2:25:16,  2.15s/it]                                                       {'loss': 1.7618, 'learning_rate': 0.00026613508749014986, 'epoch': 0.4}
+ 40%|████      | 2724/6779 [1:40:56<2:25:16,  2.15s/it] 40%|████      | 2725/6779 [1:41:00<3:01:58,  2.69s/it]                                                       {'loss': 1.5777, 'learning_rate': 0.0002660462985959371, 'epoch': 0.4}
+ 40%|████      | 2725/6779 [1:41:00<3:01:58,  2.69s/it] 40%|████      | 2726/6779 [1:41:02<2:54:47,  2.59s/it]                                                       {'loss': 1.7501, 'learning_rate': 0.00026595749508919717, 'epoch': 0.4}
+ 40%|████      | 2726/6779 [1:41:02<2:54:47,  2.59s/it] 40%|████      | 2727/6779 [1:41:05<2:47:58,  2.49s/it]                                                       {'loss': 1.7928, 'learning_rate': 0.00026586867698957735, 'epoch': 0.4}
+ 40%|████      | 2727/6779 [1:41:05<2:47:58,  2.49s/it] 40%|████      | 2728/6779 [1:41:07<2:41:59,  2.40s/it]                                                       {'loss': 1.7208, 'learning_rate': 0.00026577984431672857, 'epoch': 0.4}
+ 40%|████      | 2728/6779 [1:41:07<2:41:59,  2.40s/it] 40%|████      | 2729/6779 [1:41:09<2:35:30,  2.30s/it]                                                       {'loss': 1.6537, 'learning_rate': 0.00026569099709030465, 'epoch': 0.4}
+ 40%|████      | 2729/6779 [1:41:09<2:35:30,  2.30s/it] 40%|████      | 2730/6779 [1:41:11<2:35:01,  2.30s/it]                                                       {'loss': 1.6549, 'learning_rate': 0.00026560213532996277, 'epoch': 0.4}
+ 40%|████      | 2730/6779 [1:41:11<2:35:01,  2.30s/it] 40%|████      | 2731/6779 [1:41:13<2:33:10,  2.27s/it]                                                       {'loss': 1.6018, 'learning_rate': 0.0002655132590553633, 'epoch': 0.4}
+ 40%|████      | 2731/6779 [1:41:13<2:33:10,  2.27s/it] 40%|████      | 2732/6779 [1:41:15<2:27:52,  2.19s/it]                                                       {'loss': 1.7438, 'learning_rate': 0.00026542436828616984, 'epoch': 0.4}
+ 40%|████      | 2732/6779 [1:41:15<2:27:52,  2.19s/it] 40%|████      | 2733/6779 [1:41:17<2:24:57,  2.15s/it]                                                       {'loss': 1.5931, 'learning_rate': 0.0002653354630420492, 'epoch': 0.4}
+ 40%|████      | 2733/6779 [1:41:17<2:24:57,  2.15s/it] 40%|████      | 2734/6779 [1:41:20<2:25:33,  2.16s/it]                                                       {'loss': 1.6117, 'learning_rate': 0.00026524654334267127, 'epoch': 0.4}
+ 40%|████      | 2734/6779 [1:41:20<2:25:33,  2.16s/it] 40%|████      | 2735/6779 [1:41:22<2:25:27,  2.16s/it]                                                       {'loss': 1.6527, 'learning_rate': 0.0002651576092077094, 'epoch': 0.4}
+ 40%|████      | 2735/6779 [1:41:22<2:25:27,  2.16s/it] 40%|████      | 2736/6779 [1:41:24<2:35:23,  2.31s/it]                                                       {'loss': 1.6057, 'learning_rate': 0.00026506866065683987, 'epoch': 0.4}
+ 40%|████      | 2736/6779 [1:41:24<2:35:23,  2.31s/it] 40%|████      | 2737/6779 [1:41:27<2:32:35,  2.26s/it]                                                       {'loss': 1.8186, 'learning_rate': 0.0002649796977097422, 'epoch': 0.4}
+ 40%|████      | 2737/6779 [1:41:27<2:32:35,  2.26s/it] 40%|████      | 2738/6779 [1:41:29<2:33:36,  2.28s/it]                                                       {'loss': 1.5935, 'learning_rate': 0.00026489072038609934, 'epoch': 0.4}
+ 40%|████      | 2738/6779 [1:41:29<2:33:36,  2.28s/it] 40%|████      | 2739/6779 [1:41:31<2:30:03,  2.23s/it]                                                       {'loss': 1.6368, 'learning_rate': 0.00026480172870559717, 'epoch': 0.4}
+ 40%|████      | 2739/6779 [1:41:31<2:30:03,  2.23s/it] 40%|████      | 2740/6779 [1:41:33<2:28:12,  2.20s/it]                                                       {'loss': 1.6603, 'learning_rate': 0.00026471272268792465, 'epoch': 0.4}
+ 40%|████      | 2740/6779 [1:41:33<2:28:12,  2.20s/it] 40%|████      | 2741/6779 [1:41:35<2:27:20,  2.19s/it]                                                       {'loss': 1.7517, 'learning_rate': 0.00026462370235277416, 'epoch': 0.4}
+ 40%|████      | 2741/6779 [1:41:35<2:27:20,  2.19s/it] 40%|████      | 2742/6779 [1:41:38<2:29:44,  2.23s/it]                                                       {'loss': 1.6315, 'learning_rate': 0.0002645346677198412, 'epoch': 0.4}
+ 40%|████      | 2742/6779 [1:41:38<2:29:44,  2.23s/it] 40%|████      | 2743/6779 [1:41:40<2:29:33,  2.22s/it]                                                       {'loss': 1.6733, 'learning_rate': 0.0002644456188088245, 'epoch': 0.4}
+ 40%|████      | 2743/6779 [1:41:40<2:29:33,  2.22s/it] 40%|████      | 2744/6779 [1:41:42<2:29:20,  2.22s/it]                                                       {'loss': 1.7682, 'learning_rate': 0.0002643565556394255, 'epoch': 0.4}
+ 40%|████      | 2744/6779 [1:41:42<2:29:20,  2.22s/it] 40%|████      | 2745/6779 [1:41:44<2:27:50,  2.20s/it]                                                       {'loss': 1.6624, 'learning_rate': 0.00026426747823134943, 'epoch': 0.4}
+ 40%|████      | 2745/6779 [1:41:44<2:27:50,  2.20s/it] 41%|████      | 2746/6779 [1:41:46<2:28:43,  2.21s/it]                                                       {'loss': 1.7533, 'learning_rate': 0.00026417838660430435, 'epoch': 0.41}
+ 41%|████      | 2746/6779 [1:41:46<2:28:43,  2.21s/it] 41%|████      | 2747/6779 [1:41:49<2:27:26,  2.19s/it]                                                       {'loss': 1.7082, 'learning_rate': 0.0002640892807780014, 'epoch': 0.41}
+ 41%|████      | 2747/6779 [1:41:49<2:27:26,  2.19s/it] 41%|████      | 2748/6779 [1:41:51<2:25:05,  2.16s/it]                                                       {'loss': 1.7352, 'learning_rate': 0.00026400016077215494, 'epoch': 0.41}
+ 41%|████      | 2748/6779 [1:41:51<2:25:05,  2.16s/it] 41%|████      | 2749/6779 [1:41:53<2:29:51,  2.23s/it]                                                       {'loss': 1.7287, 'learning_rate': 0.00026391102660648256, 'epoch': 0.41}
+ 41%|████      | 2749/6779 [1:41:53<2:29:51,  2.23s/it] 41%|████      | 2750/6779 [1:41:55<2:33:42,  2.29s/it]                                                       {'loss': 1.6574, 'learning_rate': 0.00026382187830070486, 'epoch': 0.41}
+ 41%|████      | 2750/6779 [1:41:55<2:33:42,  2.29s/it] 41%|████      | 2751/6779 [1:41:58<2:30:12,  2.24s/it]                                                       {'loss': 1.6886, 'learning_rate': 0.00026373271587454554, 'epoch': 0.41}
+ 41%|████      | 2751/6779 [1:41:58<2:30:12,  2.24s/it] 41%|████      | 2752/6779 [1:42:00<2:32:18,  2.27s/it]                                                       {'loss': 1.7252, 'learning_rate': 0.00026364353934773166, 'epoch': 0.41}
+ 41%|████      | 2752/6779 [1:42:00<2:32:18,  2.27s/it] 41%|████      | 2753/6779 [1:42:02<2:34:01,  2.30s/it]                                                       {'loss': 1.774, 'learning_rate': 0.00026355434873999315, 'epoch': 0.41}
+ 41%|████      | 2753/6779 [1:42:02<2:34:01,  2.30s/it] 41%|████      | 2754/6779 [1:42:04<2:32:12,  2.27s/it]                                                       {'loss': 1.761, 'learning_rate': 0.0002634651440710631, 'epoch': 0.41}
+ 41%|████      | 2754/6779 [1:42:04<2:32:12,  2.27s/it] 41%|████      | 2755/6779 [1:42:07<2:32:45,  2.28s/it]                                                       {'loss': 1.7877, 'learning_rate': 0.0002633759253606777, 'epoch': 0.41}
+ 41%|████      | 2755/6779 [1:42:07<2:32:45,  2.28s/it] 41%|████      | 2756/6779 [1:42:09<2:33:27,  2.29s/it]                                                       {'loss': 1.8776, 'learning_rate': 0.0002632866926285765, 'epoch': 0.41}
+ 41%|████      | 2756/6779 [1:42:09<2:33:27,  2.29s/it] 41%|████      | 2757/6779 [1:42:11<2:31:55,  2.27s/it]                                                       {'loss': 1.7353, 'learning_rate': 0.00026319744589450183, 'epoch': 0.41}
+ 41%|████      | 2757/6779 [1:42:11<2:31:55,  2.27s/it] 41%|████      | 2758/6779 [1:42:14<2:35:08,  2.32s/it]                                                       {'loss': 1.7419, 'learning_rate': 0.0002631081851781992, 'epoch': 0.41}
+ 41%|████      | 2758/6779 [1:42:14<2:35:08,  2.32s/it] 41%|████      | 2759/6779 [1:42:16<2:31:39,  2.26s/it]                                                       {'loss': 1.8823, 'learning_rate': 0.00026301891049941724, 'epoch': 0.41}
+ 41%|████      | 2759/6779 [1:42:16<2:31:39,  2.26s/it] 41%|████      | 2760/6779 [1:42:18<2:26:48,  2.19s/it]                                                       {'loss': 1.8333, 'learning_rate': 0.00026292962187790775, 'epoch': 0.41}
+ 41%|████      | 2760/6779 [1:42:18<2:26:48,  2.19s/it] 41%|████      | 2761/6779 [1:42:20<2:24:58,  2.16s/it]                                                       {'loss': 1.8152, 'learning_rate': 0.0002628403193334256, 'epoch': 0.41}
+ 41%|████      | 2761/6779 [1:42:20<2:24:58,  2.16s/it] 41%|████      | 2762/6779 [1:42:22<2:27:01,  2.20s/it]                                                       {'loss': 1.8574, 'learning_rate': 0.0002627510028857286, 'epoch': 0.41}
+ 41%|████      | 2762/6779 [1:42:22<2:27:01,  2.20s/it] 41%|████      | 2763/6779 [1:42:24<2:26:43,  2.19s/it]                                                       {'loss': 1.6431, 'learning_rate': 0.0002626616725545777, 'epoch': 0.41}
+ 41%|████      | 2763/6779 [1:42:24<2:26:43,  2.19s/it] 41%|████      | 2764/6779 [1:42:27<2:26:03,  2.18s/it]                                                       {'loss': 1.5844, 'learning_rate': 0.00026257232835973695, 'epoch': 0.41}
+ 41%|████      | 2764/6779 [1:42:27<2:26:03,  2.18s/it] 41%|████      | 2765/6779 [1:42:29<2:26:04,  2.18s/it]                                                       {'loss': 1.9168, 'learning_rate': 0.0002624829703209735, 'epoch': 0.41}
+ 41%|████      | 2765/6779 [1:42:29<2:26:04,  2.18s/it] 41%|████      | 2766/6779 [1:42:31<2:25:24,  2.17s/it]                                                       {'loss': 1.7528, 'learning_rate': 0.0002623935984580575, 'epoch': 0.41}
+ 41%|████      | 2766/6779 [1:42:31<2:25:24,  2.17s/it] 41%|████      | 2767/6779 [1:42:33<2:23:09,  2.14s/it]                                                       {'loss': 1.6731, 'learning_rate': 0.00026230421279076216, 'epoch': 0.41}
+ 41%|████      | 2767/6779 [1:42:33<2:23:09,  2.14s/it] 41%|████      | 2768/6779 [1:42:35<2:20:50,  2.11s/it]                                                       {'loss': 1.6648, 'learning_rate': 0.00026221481333886385, 'epoch': 0.41}
+ 41%|████      | 2768/6779 [1:42:35<2:20:50,  2.11s/it] 41%|████      | 2769/6779 [1:42:37<2:22:14,  2.13s/it]                                                       {'loss': 1.6574, 'learning_rate': 0.00026212540012214184, 'epoch': 0.41}
+ 41%|████      | 2769/6779 [1:42:37<2:22:14,  2.13s/it] 41%|████      | 2770/6779 [1:42:39<2:24:47,  2.17s/it]                                                       {'loss': 1.9155, 'learning_rate': 0.0002620359731603785, 'epoch': 0.41}
+ 41%|████      | 2770/6779 [1:42:39<2:24:47,  2.17s/it] 41%|████      | 2771/6779 [1:42:42<2:26:11,  2.19s/it]                                                       {'loss': 1.678, 'learning_rate': 0.00026194653247335934, 'epoch': 0.41}
+ 41%|████      | 2771/6779 [1:42:42<2:26:11,  2.19s/it] 41%|████      | 2772/6779 [1:42:44<2:32:44,  2.29s/it]                                                       {'loss': 1.8228, 'learning_rate': 0.0002618570780808727, 'epoch': 0.41}
+ 41%|████      | 2772/6779 [1:42:44<2:32:44,  2.29s/it] 41%|████      | 2773/6779 [1:42:46<2:29:04,  2.23s/it]                                                       {'loss': 1.7874, 'learning_rate': 0.00026176761000271017, 'epoch': 0.41}
+ 41%|█���██      | 2773/6779 [1:42:46<2:29:04,  2.23s/it] 41%|████      | 2774/6779 [1:42:49<2:29:12,  2.24s/it]                                                       {'loss': 1.6527, 'learning_rate': 0.00026167812825866616, 'epoch': 0.41}
+ 41%|████      | 2774/6779 [1:42:49<2:29:12,  2.24s/it] 41%|████      | 2775/6779 [1:42:51<2:28:36,  2.23s/it]                                                       {'loss': 1.8862, 'learning_rate': 0.0002615886328685384, 'epoch': 0.41}
+ 41%|████      | 2775/6779 [1:42:51<2:28:36,  2.23s/it] 41%|████      | 2776/6779 [1:42:53<2:28:39,  2.23s/it]                                                       {'loss': 1.8958, 'learning_rate': 0.0002614991238521272, 'epoch': 0.41}
+ 41%|████      | 2776/6779 [1:42:53<2:28:39,  2.23s/it] 41%|████      | 2777/6779 [1:42:55<2:28:26,  2.23s/it]                                                       {'loss': 1.7283, 'learning_rate': 0.00026140960122923625, 'epoch': 0.41}
+ 41%|████      | 2777/6779 [1:42:55<2:28:26,  2.23s/it] 41%|████      | 2778/6779 [1:42:57<2:27:28,  2.21s/it]                                                       {'loss': 1.9329, 'learning_rate': 0.00026132006501967226, 'epoch': 0.41}
+ 41%|████      | 2778/6779 [1:42:57<2:27:28,  2.21s/it] 41%|████      | 2779/6779 [1:43:00<2:27:33,  2.21s/it]                                                       {'loss': 1.4919, 'learning_rate': 0.0002612305152432447, 'epoch': 0.41}
+ 41%|████      | 2779/6779 [1:43:00<2:27:33,  2.21s/it] 41%|████      | 2780/6779 [1:43:02<2:28:57,  2.23s/it]                                                       {'loss': 1.6131, 'learning_rate': 0.0002611409519197662, 'epoch': 0.41}
+ 41%|████      | 2780/6779 [1:43:02<2:28:57,  2.23s/it] 41%|████      | 2781/6779 [1:43:04<2:32:09,  2.28s/it]                                                       {'loss': 1.6895, 'learning_rate': 0.0002610513750690523, 'epoch': 0.41}
+ 41%|████      | 2781/6779 [1:43:04<2:32:09,  2.28s/it] 41%|████      | 2782/6779 [1:43:06<2:27:39,  2.22s/it]                                                       {'loss': 1.7031, 'learning_rate': 0.0002609617847109216, 'epoch': 0.41}
+ 41%|████      | 2782/6779 [1:43:06<2:27:39,  2.22s/it] 41%|████      | 2783/6779 [1:43:08<2:25:36,  2.19s/it]                                                       {'loss': 1.5634, 'learning_rate': 0.0002608721808651957, 'epoch': 0.41}
+ 41%|████      | 2783/6779 [1:43:08<2:25:36,  2.19s/it] 41%|████      | 2784/6779 [1:43:11<2:25:54,  2.19s/it]                                                       {'loss': 1.8007, 'learning_rate': 0.0002607825635516991, 'epoch': 0.41}
+ 41%|████      | 2784/6779 [1:43:11<2:25:54,  2.19s/it] 41%|████      | 2785/6779 [1:43:13<2:24:41,  2.17s/it]                                                       {'loss': 1.8172, 'learning_rate': 0.0002606929327902595, 'epoch': 0.41}
+ 41%|████      | 2785/6779 [1:43:13<2:24:41,  2.17s/it] 41%|████      | 2786/6779 [1:43:15<2:21:09,  2.12s/it]                                                       {'loss': 1.6238, 'learning_rate': 0.0002606032886007073, 'epoch': 0.41}
+ 41%|████      | 2786/6779 [1:43:15<2:21:09,  2.12s/it] 41%|████      | 2787/6779 [1:43:18<2:50:43,  2.57s/it]                                                       {'loss': 1.7701, 'learning_rate': 0.0002605136310028759, 'epoch': 0.41}
+ 41%|████      | 2787/6779 [1:43:18<2:50:43,  2.57s/it] 41%|████      | 2788/6779 [1:43:21<2:43:52,  2.46s/it]                                                       {'loss': 1.7178, 'learning_rate': 0.00026042396001660183, 'epoch': 0.41}
+ 41%|████      | 2788/6779 [1:43:21<2:43:52,  2.46s/it] 41%|████      | 2789/6779 [1:43:23<2:48:02,  2.53s/it]                                                       {'loss': 1.7554, 'learning_rate': 0.0002603342756617246, 'epoch': 0.41}
+ 41%|████      | 2789/6779 [1:43:23<2:48:02,  2.53s/it] 41%|████      | 2790/6779 [1:43:25<2:38:03,  2.38s/it]                                                       {'loss': 1.6725, 'learning_rate': 0.00026024457795808636, 'epoch': 0.41}
+ 41%|████      | 2790/6779 [1:43:25<2:38:03,  2.38s/it] 41%|████      | 2791/6779 [1:43:28<2:35:49,  2.34s/it]                                                       {'loss': 1.7685, 'learning_rate': 0.0002601548669255326, 'epoch': 0.41}
+ 41%|████      | 2791/6779 [1:43:28<2:35:49,  2.34s/it] 41%|████      | 2792/6779 [1:43:30<2:33:09,  2.30s/it]                                                       {'loss': 1.6858, 'learning_rate': 0.0002600651425839116, 'epoch': 0.41}
+ 41%|████      | 2792/6779 [1:43:30<2:33:09,  2.30s/it] 41%|████      | 2793/6779 [1:43:32<2:34:06,  2.32s/it]                                                       {'loss': 1.7592, 'learning_rate': 0.0002599754049530745, 'epoch': 0.41}
+ 41%|████      | 2793/6779 [1:43:32<2:34:06,  2.32s/it] 41%|████      | 2794/6779 [1:43:34<2:30:55,  2.27s/it]                                                       {'loss': 1.7351, 'learning_rate': 0.0002598856540528755, 'epoch': 0.41}
+ 41%|████      | 2794/6779 [1:43:34<2:30:55,  2.27s/it] 41%|████      | 2795/6779 [1:43:36<2:26:32,  2.21s/it]                                                       {'loss': 1.6538, 'learning_rate': 0.0002597958899031717, 'epoch': 0.41}
+ 41%|████      | 2795/6779 [1:43:36<2:26:32,  2.21s/it] 41%|████      | 2796/6779 [1:43:39<2:28:29,  2.24s/it]                                                       {'loss': 1.8806, 'learning_rate': 0.00025970611252382306, 'epoch': 0.41}
+ 41%|████      | 2796/6779 [1:43:39<2:28:29,  2.24s/it] 41%|████▏     | 2797/6779 [1:43:41<2:26:20,  2.20s/it]                                                       {'loss': 1.7457, 'learning_rate': 0.00025961632193469256, 'epoch': 0.41}
+ 41%|████▏     | 2797/6779 [1:43:41<2:26:20,  2.20s/it] 41%|████▏     | 2798/6779 [1:43:43<2:22:07,  2.14s/it]                                                       {'loss': 1.6715, 'learning_rate': 0.00025952651815564604, 'epoch': 0.41}
+ 41%|████▏     | 2798/6779 [1:43:43<2:22:07,  2.14s/it] 41%|████▏     | 2799/6779 [1:43:47<2:58:42,  2.69s/it]                                                       {'loss': 1.8902, 'learning_rate': 0.00025943670120655245, 'epoch': 0.41}
+ 41%|████▏     | 2799/6779 [1:43:47<2:58:42,  2.69s/it] 41%|████▏     | 2800/6779 [1:43:49<2:50:02,  2.56s/it]                                                       {'loss': 1.8677, 'learning_rate': 0.00025934687110728335, 'epoch': 0.41}
+ 41%|████▏     | 2800/6779 [1:43:49<2:50:02,  2.56s/it] 41%|████▏     | 2801/6779 [1:43:51<2:41:06,  2.43s/it]                                                       {'loss': 1.7187, 'learning_rate': 0.0002592570278777133, 'epoch': 0.41}
+ 41%|████▏     | 2801/6779 [1:43:51<2:41:06,  2.43s/it] 41%|████▏     | 2802/6779 [1:43:54<2:39:28,  2.41s/it]                                                       {'loss': 1.8998, 'learning_rate': 0.00025916717153772, 'epoch': 0.41}
+ 41%|████▏     | 2802/6779 [1:43:54<2:39:28,  2.41s/it] 41%|████▏     | 2803/6779 [1:43:56<2:35:12,  2.34s/it]                                                       {'loss': 1.7381, 'learning_rate': 0.00025907730210718375, 'epoch': 0.41}
+ 41%|████▏     | 2803/6779 [1:43:56<2:35:12,  2.34s/it] 41%|████▏     | 2804/6779 [1:43:58<2:37:18,  2.37s/it]                                                       {'loss': 1.5691, 'learning_rate': 0.00025898741960598794, 'epoch': 0.41}
+ 41%|████▏     | 2804/6779 [1:43:58<2:37:18,  2.37s/it] 41%|████▏     | 2805/6779 [1:44:01<2:39:02,  2.40s/it]                                                       {'loss': 1.7073, 'learning_rate': 0.00025889752405401867, 'epoch': 0.41}
+ 41%|████▏     | 2805/6779 [1:44:01<2:39:02,  2.40s/it] 41%|████▏     | 2806/6779 [1:44:03<2:37:25,  2.38s/it]                                                       {'loss': 1.7523, 'learning_rate': 0.00025880761547116514, 'epoch': 0.41}
+ 41%|████▏     | 2806/6779 [1:44:03<2:37:25,  2.38s/it] 41%|████▏     | 2807/6779 [1:44:05<2:34:33,  2.33s/it]                                                       {'loss': 1.65, 'learning_rate': 0.0002587176938773193, 'epoch': 0.41}
+ 41%|████▏     | 2807/6779 [1:44:05<2:34:33,  2.33s/it] 41%|████▏     | 2808/6779 [1:44:08<2:33:59,  2.33s/it]                                                       {'loss': 1.767, 'learning_rate': 0.0002586277592923759, 'epoch': 0.41}
+ 41%|████▏     | 2808/6779 [1:44:08<2:33:59,  2.33s/it] 41%|████▏     | 2809/6779 [1:44:10<2:32:22,  2.30s/it]                                                       {'loss': 1.762, 'learning_rate': 0.0002585378117362329, 'epoch': 0.41}
+ 41%|████▏     | 2809/6779 [1:44:10<2:32:22,  2.30s/it] 41%|████▏     | 2810/6779 [1:44:12<2:38:42,  2.40s/it]                                                       {'loss': 1.8756, 'learning_rate': 0.00025844785122879077, 'epoch': 0.41}
+ 41%|████▏     | 2810/6779 [1:44:12<2:38:42,  2.40s/it] 41%|████▏     | 2811/6779 [1:44:15<2:35:20,  2.35s/it]                                                       {'loss': 1.965, 'learning_rate': 0.00025835787778995294, 'epoch': 0.41}
+ 41%|████▏     | 2811/6779 [1:44:15<2:35:20,  2.35s/it] 41%|████▏     | 2812/6779 [1:44:17<2:38:06,  2.39s/it]                                                       {'loss': 1.5463, 'learning_rate': 0.00025826789143962574, 'epoch': 0.41}
+ 41%|████▏     | 2812/6779 [1:44:17<2:38:06,  2.39s/it] 41%|████▏     | 2813/6779 [1:44:19<2:31:37,  2.29s/it]                                                       {'loss': 1.7306, 'learning_rate': 0.00025817789219771843, 'epoch': 0.41}
+ 41%|████▏     | 2813/6779 [1:44:19<2:31:37,  2.29s/it] 42%|████▏     | 2814/6779 [1:44:21<2:27:24,  2.23s/it]                                                       {'loss': 1.5936, 'learning_rate': 0.00025808788008414304, 'epoch': 0.42}
+ 42%|████▏     | 2814/6779 [1:44:21<2:27:24,  2.23s/it] 42%|████▏     | 2815/6779 [1:44:23<2:26:26,  2.22s/it]                                                       {'loss': 1.7248, 'learning_rate': 0.0002579978551188144, 'epoch': 0.42}
+ 42%|████▏     | 2815/6779 [1:44:23<2:26:26,  2.22s/it] 42%|████▏     | 2816/6779 [1:44:26<2:27:22,  2.23s/it]                                                       {'loss': 1.6603, 'learning_rate': 0.0002579078173216503, 'epoch': 0.42}
+ 42%|████▏     | 2816/6779 [1:44:26<2:27:22,  2.23s/it] 42%|████▏     | 2817/6779 [1:44:28<2:23:26,  2.17s/it]                                                       {'loss': 1.7554, 'learning_rate': 0.00025781776671257123, 'epoch': 0.42}
+ 42%|████▏     | 2817/6779 [1:44:28<2:23:26,  2.17s/it] 42%|████▏     | 2818/6779 [1:44:30<2:21:46,  2.15s/it]                                                       {'loss': 1.5599, 'learning_rate': 0.00025772770331150064, 'epoch': 0.42}
+ 42%|████▏     | 2818/6779 [1:44:30<2:21:46,  2.15s/it] 42%|████▏     | 2819/6779 [1:44:32<2:19:20,  2.11s/it]                                                       {'loss': 1.6374, 'learning_rate': 0.0002576376271383648, 'epoch': 0.42}
+ 42%|████▏     | 2819/6779 [1:44:32<2:19:20,  2.11s/it] 42%|████▏     | 2820/6779 [1:44:34<2:16:47,  2.07s/it]                                                       {'loss': 1.6881, 'learning_rate': 0.00025754753821309275, 'epoch': 0.42}
+ 42%|████▏     | 2820/6779 [1:44:34<2:16:47,  2.07s/it] 42%|████▏     | 2821/6779 [1:44:36<2:17:05,  2.08s/it]                                                       {'loss': 1.5793, 'learning_rate': 0.0002574574365556163, 'epoch': 0.42}
+ 42%|████▏     | 2821/6779 [1:44:36<2:17:05,  2.08s/it] 42%|████▏     | 2822/6779 [1:44:38<2:15:06,  2.05s/it]                                                       {'loss': 1.6722, 'learning_rate': 0.00025736732218587015, 'epoch': 0.42}
+ 42%|████▏     | 2822/6779 [1:44:38<2:15:06,  2.05s/it] 42%|████▏     | 2823/6779 [1:44:40<2:14:12,  2.04s/it]                                                       {'loss': 1.5405, 'learning_rate': 0.0002572771951237919, 'epoch': 0.42}
+ 42%|████▏     | 2823/6779 [1:44:40<2:14:12,  2.04s/it] 42%|████▏     | 2824/6779 [1:44:42<2:14:40,  2.04s/it]                                                       {'loss': 1.6273, 'learning_rate': 0.00025718705538932185, 'epoch': 0.42}
+ 42%|████▏     | 2824/6779 [1:44:42<2:14:40,  2.04s/it] 42%|████▏     | 2825/6779 [1:44:44<2:20:21,  2.13s/it]                                                       {'loss': 1.6482, 'learning_rate': 0.00025709690300240306, 'epoch': 0.42}
+ 42%|████▏     | 2825/6779 [1:44:44<2:20:21,  2.13s/it] 42%|████▏     | 2826/6779 [1:44:46<2:17:37,  2.09s/it]                                                       {'loss': 1.7321, 'learning_rate': 0.0002570067379829815, 'epoch': 0.42}
+ 42%|████▏     | 2826/6779 [1:44:46<2:17:37,  2.09s/it] 42%|████▏     | 2827/6779 [1:44:49<2:20:42,  2.14s/it]                                                       {'loss': 1.5337, 'learning_rate': 0.0002569165603510059, 'epoch': 0.42}
+ 42%|████▏     | 2827/6779 [1:44:49<2:20:42,  2.14s/it] 42%|████▏     | 2828/6779 [1:44:51<2:21:49,  2.15s/it]                                                       {'loss': 1.6343, 'learning_rate': 0.0002568263701264277, 'epoch': 0.42}
+ 42%|████▏     | 2828/6779 [1:44:51<2:21:49,  2.15s/it] 42%|████▏     | 2829/6779 [1:44:53<2:28:36,  2.26s/it]                                                       {'loss': 1.5772, 'learning_rate': 0.00025673616732920114, 'epoch': 0.42}
+ 42%|████▏     | 2829/6779 [1:44:53<2:28:36,  2.26s/it] 42%|████▏     | 2830/6779 [1:44:55<2:24:14,  2.19s/it]                                                       {'loss': 1.7471, 'learning_rate': 0.0002566459519792835, 'epoch': 0.42}
+ 42%|████▏     | 2830/6779 [1:44:55<2:24:14,  2.19s/it] 42%|████▏     | 2831/6779 [1:44:58<2:25:47,  2.22s/it]                                                       {'loss': 1.8353, 'learning_rate': 0.0002565557240966345, 'epoch': 0.42}
+ 42%|████▏     | 2831/6779 [1:44:58<2:25:47,  2.22s/it] 42%|████▏     | 2832/6779 [1:45:00<2:24:17,  2.19s/it]                                                       {'loss': 1.7519, 'learning_rate': 0.0002564654837012167, 'epoch': 0.42}
+ 42%|████▏     | 2832/6779 [1:45:00<2:24:17,  2.19s/it] 42%|████▏     | 2833/6779 [1:45:02<2:25:55,  2.22s/it]                                                       {'loss': 1.7236, 'learning_rate': 0.00025637523081299565, 'epoch': 0.42}
+ 42%|████▏     | 2833/6779 [1:45:02<2:25:55,  2.22s/it] 42%|████▏     | 2834/6779 [1:45:05<2:31:55,  2.31s/it]                                                       {'loss': 1.6618, 'learning_rate': 0.0002562849654519394, 'epoch': 0.42}
+ 42%|████▏     | 2834/6779 [1:45:05<2:31:55,  2.31s/it] 42%|████▏     | 2835/6779 [1:45:07<2:28:53,  2.27s/it]                                                       {'loss': 1.8958, 'learning_rate': 0.0002561946876380189, 'epoch': 0.42}
+ 42%|████▏     | 2835/6779 [1:45:07<2:28:53,  2.27s/it] 42%|████▏     | 2836/6779 [1:45:09<2:31:37,  2.31s/it]                                                       {'loss': 1.7884, 'learning_rate': 0.0002561043973912078, 'epoch': 0.42}
+ 42%|████▏     | 2836/6779 [1:45:09<2:31:37,  2.31s/it] 42%|████▏     | 2837/6779 [1:45:11<2:29:10,  2.27s/it]                                                       {'loss': 1.7489, 'learning_rate': 0.0002560140947314824, 'epoch': 0.42}
+ 42%|████▏     | 2837/6779 [1:45:11<2:29:10,  2.27s/it] 42%|████▏     | 2838/6779 [1:45:13<2:25:06,  2.21s/it]                                                       {'loss': 1.7399, 'learning_rate': 0.00025592377967882207, 'epoch': 0.42}
+ 42%|████▏     | 2838/6779 [1:45:13<2:25:06,  2.21s/it] 42%|████▏     | 2839/6779 [1:45:15<2:22:46,  2.17s/it]                                                       {'loss': 1.7451, 'learning_rate': 0.00025583345225320875, 'epoch': 0.42}
+ 42%|████▏     | 2839/6779 [1:45:15<2:22:46,  2.17s/it] 42%|████▏     | 2840/6779 [1:45:17<2:18:24,  2.11s/it]                                                       {'loss': 1.811, 'learning_rate': 0.00025574311247462684, 'epoch': 0.42}
+ 42%|████▏     | 2840/6779 [1:45:17<2:18:24,  2.11s/it] 42%|████▏     | 2841/6779 [1:45:19<2:16:47,  2.08s/it]                                                       {'loss': 1.6709, 'learning_rate': 0.00025565276036306395, 'epoch': 0.42}
+ 42%|████▏     | 2841/6779 [1:45:19<2:16:47,  2.08s/it] 42%|████▏     | 2842/6779 [1:45:22<2:17:22,  2.09s/it]                                                       {'loss': 1.7989, 'learning_rate': 0.0002555623959385101, 'epoch': 0.42}
+ 42%|████▏     | 2842/6779 [1:45:22<2:17:22,  2.09s/it] 42%|████▏     | 2843/6779 [1:45:24<2:18:36,  2.11s/it]                                                       {'loss': 1.8744, 'learning_rate': 0.00025547201922095813, 'epoch': 0.42}
+ 42%|████▏     | 2843/6779 [1:45:24<2:18:36,  2.11s/it] 42%|████▏     | 2844/6779 [1:45:26<2:19:53,  2.13s/it]                                                       {'loss': 1.6179, 'learning_rate': 0.0002553816302304035, 'epoch': 0.42}
+ 42%|████▏     | 2844/6779 [1:45:26<2:19:53,  2.13s/it] 42%|████▏     | 2845/6779 [1:45:28<2:17:52,  2.10s/it]                                                       {'loss': 1.5786, 'learning_rate': 0.00025529122898684467, 'epoch': 0.42}
+ 42%|████▏     | 2845/6779 [1:45:28<2:17:52,  2.10s/it] 42%|████▏     | 2846/6779 [1:45:30<2:27:53,  2.26s/it]                                                       {'loss': 1.638, 'learning_rate': 0.0002552008155102825, 'epoch': 0.42}
+ 42%|████▏     | 2846/6779 [1:45:31<2:27:53,  2.26s/it] 42%|████▏     | 2847/6779 [1:45:33<2:26:03,  2.23s/it]                                                       {'loss': 1.6542, 'learning_rate': 0.0002551103898207206, 'epoch': 0.42}
+ 42%|████▏     | 2847/6779 [1:45:33<2:26:03,  2.23s/it] 42%|████▏     | 2848/6779 [1:45:35<2:24:23,  2.20s/it]                                                       {'loss': 1.4549, 'learning_rate': 0.00025501995193816555, 'epoch': 0.42}
+ 42%|████▏     | 2848/6779 [1:45:35<2:24:23,  2.20s/it] 42%|████▏     | 2849/6779 [1:45:37<2:26:19,  2.23s/it]                                                       {'loss': 1.6494, 'learning_rate': 0.00025492950188262626, 'epoch': 0.42}
+ 42%|████▏     | 2849/6779 [1:45:37<2:26:19,  2.23s/it] 42%|████▏     | 2850/6779 [1:45:39<2:27:31,  2.25s/it]                                                       {'loss': 1.7239, 'learning_rate': 0.00025483903967411466, 'epoch': 0.42}
+ 42%|████▏     | 2850/6779 [1:45:39<2:27:31,  2.25s/it] 42%|████▏     | 2851/6779 [1:45:42<2:24:48,  2.21s/it]                                                       {'loss': 1.8119, 'learning_rate': 0.00025474856533264507, 'epoch': 0.42}
+ 42%|████▏     | 2851/6779 [1:45:42<2:24:48,  2.21s/it] 42%|████▏     | 2852/6779 [1:45:44<2:29:13,  2.28s/it]                                                       {'loss': 1.8313, 'learning_rate': 0.0002546580788782348, 'epoch': 0.42}
+ 42%|████▏     | 2852/6779 [1:45:44<2:29:13,  2.28s/it] 42%|████▏     | 2853/6779 [1:45:46<2:30:12,  2.30s/it]                                                       {'loss': 1.6872, 'learning_rate': 0.0002545675803309035, 'epoch': 0.42}
+ 42%|████▏     | 2853/6779 [1:45:46<2:30:12,  2.30s/it] 42%|████▏     | 2854/6779 [1:45:48<2:25:29,  2.22s/it]                                                       {'loss': 1.7396, 'learning_rate': 0.0002544770697106738, 'epoch': 0.42}
+ 42%|████▏     | 2854/6779 [1:45:48<2:25:29,  2.22s/it] 42%|████▏     | 2855/6779 [1:45:51<2:26:55,  2.25s/it]                                                       {'loss': 1.7131, 'learning_rate': 0.0002543865470375708, 'epoch': 0.42}
+ 42%|████▏     | 2855/6779 [1:45:51<2:26:55,  2.25s/it] 42%|████▏     | 2856/6779 [1:45:53<2:27:30,  2.26s/it]                                                       {'loss': 1.776, 'learning_rate': 0.0002542960123316224, 'epoch': 0.42}
+ 42%|████▏     | 2856/6779 [1:45:53<2:27:30,  2.26s/it] 42%|████▏     | 2857/6779 [1:45:55<2:24:33,  2.21s/it]                                                       {'loss': 1.6363, 'learning_rate': 0.00025420546561285916, 'epoch': 0.42}
+ 42%|████▏     | 2857/6779 [1:45:55<2:24:33,  2.21s/it] 42%|████▏     | 2858/6779 [1:45:57<2:26:01,  2.23s/it]                                                       {'loss': 1.5038, 'learning_rate': 0.0002541149069013142, 'epoch': 0.42}
+ 42%|████▏     | 2858/6779 [1:45:57<2:26:01,  2.23s/it] 42%|████▏     | 2859/6779 [1:46:00<2:26:07,  2.24s/it]                                                       {'loss': 1.7731, 'learning_rate': 0.0002540243362170233, 'epoch': 0.42}
+ 42%|████▏     | 2859/6779 [1:46:00<2:26:07,  2.24s/it] 42%|████▏     | 2860/6779 [1:46:02<2:27:36,  2.26s/it]                                                       {'loss': 1.6362, 'learning_rate': 0.00025393375358002496, 'epoch': 0.42}
+ 42%|████▏     | 2860/6779 [1:46:02<2:27:36,  2.26s/it] 42%|████▏     | 2861/6779 [1:46:04<2:27:21,  2.26s/it]                                                       {'loss': 1.7378, 'learning_rate': 0.00025384315901036023, 'epoch': 0.42}
+ 42%|████▏     | 2861/6779 [1:46:04<2:27:21,  2.26s/it] 42%|████▏     | 2862/6779 [1:46:06<2:27:01,  2.25s/it]                                                       {'loss': 1.6924, 'learning_rate': 0.00025375255252807293, 'epoch': 0.42}
+ 42%|████▏     | 2862/6779 [1:46:06<2:27:01,  2.25s/it] 42%|████▏     | 2863/6779 [1:46:09<2:27:12,  2.26s/it]                                                       {'loss': 1.8317, 'learning_rate': 0.00025366193415320945, 'epoch': 0.42}
+ 42%|████▏     | 2863/6779 [1:46:09<2:27:12,  2.26s/it] 42%|████▏     | 2864/6779 [1:46:11<2:22:37,  2.19s/it]                                                       {'loss': 1.6965, 'learning_rate': 0.0002535713039058188, 'epoch': 0.42}
+ 42%|████▏     | 2864/6779 [1:46:11<2:22:37,  2.19s/it] 42%|████▏     | 2865/6779 [1:46:13<2:25:07,  2.22s/it]                                                       {'loss': 1.6947, 'learning_rate': 0.0002534806618059526, 'epoch': 0.42}
+ 42%|████▏     | 2865/6779 [1:46:13<2:25:07,  2.22s/it] 42%|████▏     | 2866/6779 [1:46:15<2:25:02,  2.22s/it]                                                       {'loss': 1.8152, 'learning_rate': 0.00025339000787366514, 'epoch': 0.42}
+ 42%|████▏     | 2866/6779 [1:46:15<2:25:02,  2.22s/it] 42%|████▏     | 2867/6779 [1:46:17<2:24:51,  2.22s/it]                                                       {'loss': 1.6665, 'learning_rate': 0.00025329934212901334, 'epoch': 0.42}
+ 42%|████▏     | 2867/6779 [1:46:17<2:24:51,  2.22s/it] 42%|████▏     | 2868/6779 [1:46:20<2:32:25,  2.34s/it]                                                       {'loss': 1.6655, 'learning_rate': 0.00025320866459205656, 'epoch': 0.42}
+ 42%|████▏     | 2868/6779 [1:46:20<2:32:25,  2.34s/it] 42%|████▏     | 2869/6779 [1:46:22<2:27:24,  2.26s/it]                                                       {'loss': 1.7186, 'learning_rate': 0.0002531179752828571, 'epoch': 0.42}
+ 42%|████▏     | 2869/6779 [1:46:22<2:27:24,  2.26s/it] 42%|████▏     | 2870/6779 [1:46:24<2:25:00,  2.23s/it]                                                       {'loss': 1.5651, 'learning_rate': 0.0002530272742214796, 'epoch': 0.42}
+ 42%|████▏     | 2870/6779 [1:46:24<2:25:00,  2.23s/it] 42%|████▏     | 2871/6779 [1:46:27<2:25:34,  2.23s/it]                                                       {'loss': 1.7167, 'learning_rate': 0.0002529365614279912, 'epoch': 0.42}
+ 42%|████▏     | 2871/6779 [1:46:27<2:25:34,  2.23s/it] 42%|████▏     | 2872/6779 [1:46:29<2:26:15,  2.25s/it]                                                       {'loss': 1.7846, 'learning_rate': 0.000252845836922462, 'epoch': 0.42}
+ 42%|████▏     | 2872/6779 [1:46:29<2:26:15,  2.25s/it] 42%|████▏     | 2873/6779 [1:46:31<2:28:27,  2.28s/it]                                                       {'loss': 1.7632, 'learning_rate': 0.0002527551007249646, 'epoch': 0.42}
+ 42%|████▏     | 2873/6779 [1:46:31<2:28:27,  2.28s/it] 42%|████▏     | 2874/6779 [1:46:33<2:24:49,  2.23s/it]                                                       {'loss': 1.8511, 'learning_rate': 0.0002526643528555739, 'epoch': 0.42}
+ 42%|████▏     | 2874/6779 [1:46:33<2:24:49,  2.23s/it] 42%|████▏     | 2875/6779 [1:46:36<2:26:17,  2.25s/it]                                                       {'loss': 1.6872, 'learning_rate': 0.0002525735933343676, 'epoch': 0.42}
+ 42%|████▏     | 2875/6779 [1:46:36<2:26:17,  2.25s/it] 42%|████▏     | 2876/6779 [1:46:38<2:27:26,  2.27s/it]                                                       {'loss': 1.7025, 'learning_rate': 0.0002524828221814259, 'epoch': 0.42}
+ 42%|████▏     | 2876/6779 [1:46:38<2:27:26,  2.27s/it] 42%|████▏     | 2877/6779 [1:46:40<2:27:05,  2.26s/it]                                                       {'loss': 1.7357, 'learning_rate': 0.0002523920394168317, 'epoch': 0.42}
+ 42%|████▏     | 2877/6779 [1:46:40<2:27:05,  2.26s/it] 42%|████▏     | 2878/6779 [1:46:42<2:27:01,  2.26s/it]                                                       {'loss': 1.7015, 'learning_rate': 0.0002523012450606704, 'epoch': 0.42}
+ 42%|████▏     | 2878/6779 [1:46:42<2:27:01,  2.26s/it] 42%|████▏     | 2879/6779 [1:46:44<2:21:46,  2.18s/it]                                                       {'loss': 1.7853, 'learning_rate': 0.00025221043913302985, 'epoch': 0.42}
+ 42%|████▏     | 2879/6779 [1:46:44<2:21:46,  2.18s/it] 42%|████▏     | 2880/6779 [1:46:47<2:21:37,  2.18s/it]                                                       {'loss': 1.7233, 'learning_rate': 0.00025211962165400077, 'epoch': 0.42}
+ 42%|████▏     | 2880/6779 [1:46:47<2:21:37,  2.18s/it] 42%|████▏     | 2881/6779 [1:46:49<2:25:27,  2.24s/it]                                                       {'loss': 1.7998, 'learning_rate': 0.00025202879264367607, 'epoch': 0.42}
+ 42%|████▏     | 2881/6779 [1:46:49<2:25:27,  2.24s/it] 43%|████▎     | 2882/6779 [1:46:51<2:24:48,  2.23s/it]                                                       {'loss': 1.8673, 'learning_rate': 0.0002519379521221514, 'epoch': 0.43}
+ 43%|████▎     | 2882/6779 [1:46:51<2:24:48,  2.23s/it] 43%|████▎     | 2883/6779 [1:46:53<2:23:12,  2.21s/it]                                                       {'loss': 1.5587, 'learning_rate': 0.0002518471001095248, 'epoch': 0.43}
+ 43%|████▎     | 2883/6779 [1:46:53<2:23:12,  2.21s/it] 43%|████▎     | 2884/6779 [1:46:56<2:29:36,  2.30s/it]                                                       {'loss': 1.7911, 'learning_rate': 0.00025175623662589727, 'epoch': 0.43}
+ 43%|████▎     | 2884/6779 [1:46:56<2:29:36,  2.30s/it] 43%|████▎     | 2885/6779 [1:46:58<2:24:24,  2.23s/it]                                                       {'loss': 1.513, 'learning_rate': 0.0002516653616913718, 'epoch': 0.43}
+ 43%|████▎     | 2885/6779 [1:46:58<2:24:24,  2.23s/it] 43%|████▎     | 2886/6779 [1:47:00<2:19:31,  2.15s/it]                                                       {'loss': 1.523, 'learning_rate': 0.00025157447532605425, 'epoch': 0.43}
+ 43%|████▎     | 2886/6779 [1:47:00<2:19:31,  2.15s/it] 43%|████▎     | 2887/6779 [1:47:02<2:26:14,  2.25s/it]                                                       {'loss': 1.75, 'learning_rate': 0.000251483577550053, 'epoch': 0.43}
+ 43%|████▎     | 2887/6779 [1:47:02<2:26:14,  2.25s/it] 43%|████▎     | 2888/6779 [1:47:05<2:30:32,  2.32s/it]                                                       {'loss': 1.6956, 'learning_rate': 0.00025139266838347885, 'epoch': 0.43}
+ 43%|████▎     | 2888/6779 [1:47:05<2:30:32,  2.32s/it] 43%|████▎     | 2889/6779 [1:47:07<2:25:36,  2.25s/it]                                                       {'loss': 1.7661, 'learning_rate': 0.0002513017478464452, 'epoch': 0.43}
+ 43%|████▎     | 2889/6779 [1:47:07<2:25:36,  2.25s/it] 43%|████▎     | 2890/6779 [1:47:09<2:23:41,  2.22s/it]                                                       {'loss': 1.6327, 'learning_rate': 0.0002512108159590677, 'epoch': 0.43}
+ 43%|████▎     | 2890/6779 [1:47:09<2:23:41,  2.22s/it] 43%|████▎     | 2891/6779 [1:47:11<2:22:35,  2.20s/it]                                                       {'loss': 1.6769, 'learning_rate': 0.00025111987274146504, 'epoch': 0.43}
+ 43%|████▎     | 2891/6779 [1:47:11<2:22:35,  2.20s/it] 43%|████▎     | 2892/6779 [1:47:14<2:27:51,  2.28s/it]                                                       {'loss': 1.7276, 'learning_rate': 0.00025102891821375794, 'epoch': 0.43}
+ 43%|████▎     | 2892/6779 [1:47:14<2:27:51,  2.28s/it] 43%|████▎     | 2893/6779 [1:47:16<2:26:51,  2.27s/it]                                                       {'loss': 1.733, 'learning_rate': 0.00025093795239606974, 'epoch': 0.43}
+ 43%|████▎     | 2893/6779 [1:47:16<2:26:51,  2.27s/it] 43%|████▎     | 2894/6779 [1:47:18<2:23:35,  2.22s/it]                                                       {'loss': 1.7649, 'learning_rate': 0.00025084697530852637, 'epoch': 0.43}
+ 43%|████▎     | 2894/6779 [1:47:18<2:23:35,  2.22s/it] 43%|████▎     | 2895/6779 [1:47:20<2:22:12,  2.20s/it]                                                       {'loss': 1.6731, 'learning_rate': 0.00025075598697125637, 'epoch': 0.43}
+ 43%|████▎     | 2895/6779 [1:47:20<2:22:12,  2.20s/it] 43%|████▎     | 2896/6779 [1:47:22<2:19:28,  2.16s/it]                                                       {'loss': 1.6947, 'learning_rate': 0.00025066498740439045, 'epoch': 0.43}
+ 43%|████▎     | 2896/6779 [1:47:22<2:19:28,  2.16s/it] 43%|████▎     | 2897/6779 [1:47:25<2:24:01,  2.23s/it]                                                       {'loss': 1.6821, 'learning_rate': 0.000250573976628062, 'epoch': 0.43}
+ 43%|████▎     | 2897/6779 [1:47:25<2:24:01,  2.23s/it] 43%|████▎     | 2898/6779 [1:47:27<2:30:46,  2.33s/it]                                                       {'loss': 1.7986, 'learning_rate': 0.0002504829546624068, 'epoch': 0.43}
+ 43%|████▎     | 2898/6779 [1:47:27<2:30:46,  2.33s/it] 43%|████▎     | 2899/6779 [1:47:29<2:23:05,  2.21s/it]                                                       {'loss': 1.6122, 'learning_rate': 0.0002503919215275633, 'epoch': 0.43}
+ 43%|████▎     | 2899/6779 [1:47:29<2:23:05,  2.21s/it] 43%|████▎     | 2900/6779 [1:47:31<2:24:11,  2.23s/it]                                                       {'loss': 1.6999, 'learning_rate': 0.00025030087724367214, 'epoch': 0.43}
+ 43%|████▎     | 2900/6779 [1:47:31<2:24:11,  2.23s/it] 43%|████▎     | 2901/6779 [1:47:34<2:22:50,  2.21s/it]                                                       {'loss': 1.5964, 'learning_rate': 0.0002502098218308766, 'epoch': 0.43}
+ 43%|████▎     | 2901/6779 [1:47:34<2:22:50,  2.21s/it] 43%|████▎     | 2902/6779 [1:47:36<2:20:39,  2.18s/it]                                                       {'loss': 1.5642, 'learning_rate': 0.00025011875530932254, 'epoch': 0.43}
+ 43%|████▎     | 2902/6779 [1:47:36<2:20:39,  2.18s/it] 43%|████▎     | 2903/6779 [1:47:38<2:24:27,  2.24s/it]                                                       {'loss': 1.9363, 'learning_rate': 0.00025002767769915796, 'epoch': 0.43}
+ 43%|████▎     | 2903/6779 [1:47:38<2:24:27,  2.24s/it] 43%|████▎     | 2904/6779 [1:47:40<2:24:36,  2.24s/it]                                                       {'loss': 1.68, 'learning_rate': 0.00024993658902053355, 'epoch': 0.43}
+ 43%|████▎     | 2904/6779 [1:47:40<2:24:36,  2.24s/it] 43%|████▎     | 2905/6779 [1:47:42<2:23:25,  2.22s/it]                                                       {'loss': 1.6517, 'learning_rate': 0.0002498454892936024, 'epoch': 0.43}
+ 43%|████▎     | 2905/6779 [1:47:42<2:23:25,  2.22s/it] 43%|████▎     | 2906/6779 [1:47:45<2:20:42,  2.18s/it]                                                       {'loss': 1.7131, 'learning_rate': 0.0002497543785385199, 'epoch': 0.43}
+ 43%|████▎     | 2906/6779 [1:47:45<2:20:42,  2.18s/it] 43%|████▎     | 2907/6779 [1:47:47<2:24:00,  2.23s/it]                                                       {'loss': 1.7478, 'learning_rate': 0.0002496632567754441, 'epoch': 0.43}
+ 43%|████▎     | 2907/6779 [1:47:47<2:24:00,  2.23s/it] 43%|████▎     | 2908/6779 [1:47:49<2:26:51,  2.28s/it]                                                       {'loss': 1.7489, 'learning_rate': 0.0002495721240245355, 'epoch': 0.43}
+ 43%|████▎     | 2908/6779 [1:47:49<2:26:51,  2.28s/it] 43%|████▎     | 2909/6779 [1:47:51<2:26:24,  2.27s/it]                                                       {'loss': 1.7124, 'learning_rate': 0.00024948098030595675, 'epoch': 0.43}
+ 43%|████▎     | 2909/6779 [1:47:51<2:26:24,  2.27s/it] 43%|████▎     | 2910/6779 [1:47:54<2:37:27,  2.44s/it]                                                       {'loss': 1.5487, 'learning_rate': 0.00024938982563987324, 'epoch': 0.43}
+ 43%|���███▎     | 2910/6779 [1:47:54<2:37:27,  2.44s/it] 43%|████▎     | 2911/6779 [1:47:56<2:30:28,  2.33s/it]                                                       {'loss': 1.8324, 'learning_rate': 0.00024929866004645246, 'epoch': 0.43}
+ 43%|████▎     | 2911/6779 [1:47:56<2:30:28,  2.33s/it] 43%|████▎     | 2912/6779 [1:47:59<2:26:43,  2.28s/it]                                                       {'loss': 1.6337, 'learning_rate': 0.00024920748354586463, 'epoch': 0.43}
+ 43%|████▎     | 2912/6779 [1:47:59<2:26:43,  2.28s/it] 43%|████▎     | 2913/6779 [1:48:01<2:24:54,  2.25s/it]                                                       {'loss': 1.8067, 'learning_rate': 0.0002491162961582823, 'epoch': 0.43}
+ 43%|████▎     | 2913/6779 [1:48:01<2:24:54,  2.25s/it] 43%|████▎     | 2914/6779 [1:48:03<2:21:15,  2.19s/it]                                                       {'loss': 1.6753, 'learning_rate': 0.0002490250979038803, 'epoch': 0.43}
+ 43%|████▎     | 2914/6779 [1:48:03<2:21:15,  2.19s/it] 43%|████▎     | 2915/6779 [1:48:05<2:22:39,  2.22s/it]                                                       {'loss': 1.6272, 'learning_rate': 0.00024893388880283586, 'epoch': 0.43}
+ 43%|████▎     | 2915/6779 [1:48:05<2:22:39,  2.22s/it] 43%|████▎     | 2916/6779 [1:48:07<2:22:08,  2.21s/it]                                                       {'loss': 1.716, 'learning_rate': 0.00024884266887532886, 'epoch': 0.43}
+ 43%|████▎     | 2916/6779 [1:48:07<2:22:08,  2.21s/it] 43%|████▎     | 2917/6779 [1:48:10<2:28:18,  2.30s/it]                                                       {'loss': 1.733, 'learning_rate': 0.00024875143814154135, 'epoch': 0.43}
+ 43%|████▎     | 2917/6779 [1:48:10<2:28:18,  2.30s/it] 43%|████▎     | 2918/6779 [1:48:12<2:32:29,  2.37s/it]                                                       {'loss': 1.6684, 'learning_rate': 0.00024866019662165775, 'epoch': 0.43}
+ 43%|████▎     | 2918/6779 [1:48:12<2:32:29,  2.37s/it] 43%|████▎     | 2919/6779 [1:48:14<2:26:55,  2.28s/it]                                                       {'loss': 1.6329, 'learning_rate': 0.0002485689443358651, 'epoch': 0.43}
+ 43%|████▎     | 2919/6779 [1:48:14<2:26:55,  2.28s/it] 43%|████▎     | 2920/6779 [1:48:17<2:26:39,  2.28s/it]                                                       {'loss': 1.6925, 'learning_rate': 0.00024847768130435255, 'epoch': 0.43}
+ 43%|████▎     | 2920/6779 [1:48:17<2:26:39,  2.28s/it] 43%|████▎     | 2921/6779 [1:48:19<2:25:21,  2.26s/it]                                                       {'loss': 1.7377, 'learning_rate': 0.00024838640754731183, 'epoch': 0.43}
+ 43%|████▎     | 2921/6779 [1:48:19<2:25:21,  2.26s/it] 43%|████▎     | 2922/6779 [1:48:21<2:28:26,  2.31s/it]                                                       {'loss': 1.5722, 'learning_rate': 0.0002482951230849369, 'epoch': 0.43}
+ 43%|████▎     | 2922/6779 [1:48:21<2:28:26,  2.31s/it] 43%|████▎     | 2923/6779 [1:48:23<2:24:01,  2.24s/it]                                                       {'loss': 1.6649, 'learning_rate': 0.00024820382793742403, 'epoch': 0.43}
+ 43%|████▎     | 2923/6779 [1:48:23<2:24:01,  2.24s/it] 43%|████▎     | 2924/6779 [1:48:26<2:27:49,  2.30s/it]                                                       {'loss': 1.5922, 'learning_rate': 0.00024811252212497226, 'epoch': 0.43}
+ 43%|████▎     | 2924/6779 [1:48:26<2:27:49,  2.30s/it] 43%|████▎     | 2925/6779 [1:48:28<2:22:43,  2.22s/it]                                                       {'loss': 1.7014, 'learning_rate': 0.00024802120566778246, 'epoch': 0.43}
+ 43%|████▎     | 2925/6779 [1:48:28<2:22:43,  2.22s/it] 43%|████▎     | 2926/6779 [1:48:30<2:25:53,  2.27s/it]                                                       {'loss': 1.7026, 'learning_rate': 0.0002479298785860582, 'epoch': 0.43}
+ 43%|████▎     | 2926/6779 [1:48:30<2:25:53,  2.27s/it] 43%|████▎     | 2927/6779 [1:48:33<2:31:45,  2.36s/it]                                                       {'loss': 1.8106, 'learning_rate': 0.00024783854090000535, 'epoch': 0.43}
+ 43%|████▎     | 2927/6779 [1:48:33<2:31:45,  2.36s/it] 43%|████▎     | 2928/6779 [1:48:35<2:26:38,  2.28s/it]                                                       {'loss': 1.6704, 'learning_rate': 0.00024774719262983194, 'epoch': 0.43}
+ 43%|████▎     | 2928/6779 [1:48:35<2:26:38,  2.28s/it] 43%|████▎     | 2929/6779 [1:48:37<2:24:44,  2.26s/it]                                                       {'loss': 1.7137, 'learning_rate': 0.00024765583379574854, 'epoch': 0.43}
+ 43%|████▎     | 2929/6779 [1:48:37<2:24:44,  2.26s/it] 43%|████▎     | 2930/6779 [1:48:39<2:20:08,  2.18s/it]                                                       {'loss': 1.6696, 'learning_rate': 0.00024756446441796803, 'epoch': 0.43}
+ 43%|████▎     | 2930/6779 [1:48:39<2:20:08,  2.18s/it] 43%|████▎     | 2931/6779 [1:48:41<2:21:10,  2.20s/it]                                                       {'loss': 1.8162, 'learning_rate': 0.00024747308451670554, 'epoch': 0.43}
+ 43%|████▎     | 2931/6779 [1:48:41<2:21:10,  2.20s/it] 43%|████▎     | 2932/6779 [1:48:44<2:21:35,  2.21s/it]                                                       {'loss': 1.7252, 'learning_rate': 0.0002473816941121785, 'epoch': 0.43}
+ 43%|████▎     | 2932/6779 [1:48:44<2:21:35,  2.21s/it] 43%|████▎     | 2933/6779 [1:48:46<2:17:26,  2.14s/it]                                                       {'loss': 1.6365, 'learning_rate': 0.0002472902932246069, 'epoch': 0.43}
+ 43%|████▎     | 2933/6779 [1:48:46<2:17:26,  2.14s/it] 43%|████▎     | 2934/6779 [1:48:48<2:15:43,  2.12s/it]                                                       {'loss': 1.6148, 'learning_rate': 0.00024719888187421283, 'epoch': 0.43}
+ 43%|████▎     | 2934/6779 [1:48:48<2:15:43,  2.12s/it] 43%|████▎     | 2935/6779 [1:48:50<2:15:16,  2.11s/it]                                                       {'loss': 1.7945, 'learning_rate': 0.0002471074600812207, 'epoch': 0.43}
+ 43%|████▎     | 2935/6779 [1:48:50<2:15:16,  2.11s/it] 43%|████▎     | 2936/6779 [1:48:52<2:14:23,  2.10s/it]                                                       {'loss': 1.795, 'learning_rate': 0.0002470160278658573, 'epoch': 0.43}
+ 43%|████▎     | 2936/6779 [1:48:52<2:14:23,  2.10s/it] 43%|████▎     | 2937/6779 [1:48:54<2:14:15,  2.10s/it]                                                       {'loss': 1.8626, 'learning_rate': 0.00024692458524835177, 'epoch': 0.43}
+ 43%|████▎     | 2937/6779 [1:48:54<2:14:15,  2.10s/it] 43%|████▎     | 2938/6779 [1:48:56<2:16:46,  2.14s/it]                                                       {'loss': 1.8273, 'learning_rate': 0.0002468331322489354, 'epoch': 0.43}
+ 43%|████▎     | 2938/6779 [1:48:56<2:16:46,  2.14s/it] 43%|████▎     | 2939/6779 [1:48:58<2:16:36,  2.13s/it]                                                       {'loss': 1.6133, 'learning_rate': 0.00024674166888784184, 'epoch': 0.43}
+ 43%|████▎     | 2939/6779 [1:48:58<2:16:36,  2.13s/it] 43%|████▎     | 2940/6779 [1:49:00<2:15:52,  2.12s/it]                                                       {'loss': 1.8218, 'learning_rate': 0.0002466501951853072, 'epoch': 0.43}
+ 43%|████▎     | 2940/6779 [1:49:00<2:15:52,  2.12s/it] 43%|████▎     | 2941/6779 [1:49:03<2:20:07,  2.19s/it]                                                       {'loss': 1.7346, 'learning_rate': 0.0002465587111615697, 'epoch': 0.43}
+ 43%|████▎     | 2941/6779 [1:49:03<2:20:07,  2.19s/it] 43%|████▎     | 2942/6779 [1:49:05<2:18:14,  2.16s/it]                                                       {'loss': 1.7414, 'learning_rate': 0.0002464672168368698, 'epoch': 0.43}
+ 43%|████▎     | 2942/6779 [1:49:05<2:18:14,  2.16s/it] 43%|████▎     | 2943/6779 [1:49:07<2:19:17,  2.18s/it]                                                       {'loss': 1.8135, 'learning_rate': 0.0002463757122314503, 'epoch': 0.43}
+ 43%|████▎     | 2943/6779 [1:49:07<2:19:17,  2.18s/it] 43%|████▎     | 2944/6779 [1:49:09<2:24:16,  2.26s/it]                                                       {'loss': 1.7967, 'learning_rate': 0.0002462841973655565, 'epoch': 0.43}
+ 43%|████▎     | 2944/6779 [1:49:09<2:24:16,  2.26s/it] 43%|████▎     | 2945/6779 [1:49:12<2:23:35,  2.25s/it]                                                       {'loss': 1.7644, 'learning_rate': 0.0002461926722594355, 'epoch': 0.43}
+ 43%|████▎     | 2945/6779 [1:49:12<2:23:35,  2.25s/it] 43%|████▎     | 2946/6779 [1:49:14<2:21:39,  2.22s/it]                                                       {'loss': 1.7167, 'learning_rate': 0.0002461011369333371, 'epoch': 0.43}
+ 43%|████▎     | 2946/6779 [1:49:14<2:21:39,  2.22s/it] 43%|████▎     | 2947/6779 [1:49:16<2:18:08,  2.16s/it]                                                       {'loss': 1.6717, 'learning_rate': 0.0002460095914075131, 'epoch': 0.43}
+ 43%|████▎     | 2947/6779 [1:49:16<2:18:08,  2.16s/it] 43%|████▎     | 2948/6779 [1:49:18<2:16:48,  2.14s/it]                                                       {'loss': 1.8146, 'learning_rate': 0.00024591803570221774, 'epoch': 0.43}
+ 43%|████▎     | 2948/6779 [1:49:18<2:16:48,  2.14s/it] 44%|████▎     | 2949/6779 [1:49:20<2:21:10,  2.21s/it]                                                       {'loss': 1.6783, 'learning_rate': 0.0002458264698377074, 'epoch': 0.44}
+ 44%|████▎     | 2949/6779 [1:49:20<2:21:10,  2.21s/it] 44%|████▎     | 2950/6779 [1:49:22<2:16:43,  2.14s/it]                                                       {'loss': 1.5078, 'learning_rate': 0.00024573489383424057, 'epoch': 0.44}
+ 44%|████▎     | 2950/6779 [1:49:22<2:16:43,  2.14s/it] 44%|████▎     | 2951/6779 [1:49:24<2:15:19,  2.12s/it]                                                       {'loss': 1.5526, 'learning_rate': 0.0002456433077120784, 'epoch': 0.44}
+ 44%|████▎     | 2951/6779 [1:49:24<2:15:19,  2.12s/it] 44%|████▎     | 2952/6779 [1:49:27<2:15:35,  2.13s/it]                                                       {'loss': 1.7676, 'learning_rate': 0.0002455517114914839, 'epoch': 0.44}
+ 44%|████▎     | 2952/6779 [1:49:27<2:15:35,  2.13s/it] 44%|████▎     | 2953/6779 [1:49:29<2:16:52,  2.15s/it]                                                       {'loss': 1.7637, 'learning_rate': 0.00024546010519272234, 'epoch': 0.44}
+ 44%|████▎     | 2953/6779 [1:49:29<2:16:52,  2.15s/it] 44%|████▎     | 2954/6779 [1:49:31<2:19:42,  2.19s/it]                                                       {'loss': 1.8066, 'learning_rate': 0.00024536848883606135, 'epoch': 0.44}
+ 44%|████▎     | 2954/6779 [1:49:31<2:19:42,  2.19s/it] 44%|████▎     | 2955/6779 [1:49:33<2:23:52,  2.26s/it]                                                       {'loss': 1.7179, 'learning_rate': 0.0002452768624417709, 'epoch': 0.44}
+ 44%|████▎     | 2955/6779 [1:49:33<2:23:52,  2.26s/it] 44%|████▎     | 2956/6779 [1:49:36<2:20:40,  2.21s/it]                                                       {'loss': 1.7265, 'learning_rate': 0.0002451852260301229, 'epoch': 0.44}
+ 44%|████▎     | 2956/6779 [1:49:36<2:20:40,  2.21s/it] 44%|████▎     | 2957/6779 [1:49:38<2:18:50,  2.18s/it]                                                       {'loss': 1.6093, 'learning_rate': 0.00024509357962139157, 'epoch': 0.44}
+ 44%|████▎     | 2957/6779 [1:49:38<2:18:50,  2.18s/it] 44%|████▎     | 2958/6779 [1:49:40<2:18:18,  2.17s/it]                                                       {'loss': 1.6126, 'learning_rate': 0.0002450019232358535, 'epoch': 0.44}
+ 44%|████▎     | 2958/6779 [1:49:40<2:18:18,  2.17s/it] 44%|████▎     | 2959/6779 [1:49:42<2:20:17,  2.20s/it]                                                       {'loss': 1.6458, 'learning_rate': 0.00024491025689378726, 'epoch': 0.44}
+ 44%|████▎     | 2959/6779 [1:49:42<2:20:17,  2.20s/it] 44%|████▎     | 2960/6779 [1:49:44<2:18:47,  2.18s/it]                                                       {'loss': 1.8268, 'learning_rate': 0.00024481858061547383, 'epoch': 0.44}
+ 44%|████▎     | 2960/6779 [1:49:44<2:18:47,  2.18s/it] 44%|████▎     | 2961/6779 [1:49:47<2:22:25,  2.24s/it]                                                       {'loss': 1.5452, 'learning_rate': 0.0002447268944211962, 'epoch': 0.44}
+ 44%|████▎     | 2961/6779 [1:49:47<2:22:25,  2.24s/it] 44%|████▎     | 2962/6779 [1:49:49<2:26:06,  2.30s/it]                                                       {'loss': 1.8225, 'learning_rate': 0.00024463519833123966, 'epoch': 0.44}
+ 44%|████▎     | 2962/6779 [1:49:49<2:26:06,  2.30s/it] 44%|████▎     | 2963/6779 [1:49:51<2:25:24,  2.29s/it]                                                       {'loss': 1.604, 'learning_rate': 0.00024454349236589166, 'epoch': 0.44}
+ 44%|████▎     | 2963/6779 [1:49:51<2:25:24,  2.29s/it] 44%|████▎     | 2964/6779 [1:49:53<2:20:45,  2.21s/it]                                                       {'loss': 1.6602, 'learning_rate': 0.00024445177654544185, 'epoch': 0.44}
+ 44%|████▎     | 2964/6779 [1:49:53<2:20:45,  2.21s/it] 44%|████▎     | 2965/6779 [1:49:55<2:19:00,  2.19s/it]                                                       {'loss': 1.6731, 'learning_rate': 0.00024436005089018215, 'epoch': 0.44}
+ 44%|████▎     | 2965/6779 [1:49:55<2:19:00,  2.19s/it] 44%|████▍     | 2966/6779 [1:49:57<2:15:05,  2.13s/it]                                                       {'loss': 1.7382, 'learning_rate': 0.0002442683154204064, 'epoch': 0.44}
+ 44%|████▍     | 2966/6779 [1:49:57<2:15:05,  2.13s/it] 44%|████▍     | 2967/6779 [1:50:00<2:18:19,  2.18s/it]                                                       {'loss': 1.6303, 'learning_rate': 0.00024417657015641083, 'epoch': 0.44}
+ 44%|████▍     | 2967/6779 [1:50:00<2:18:19,  2.18s/it] 44%|████▍     | 2968/6779 [1:50:02<2:15:24,  2.13s/it]                                                       {'loss': 1.6865, 'learning_rate': 0.00024408481511849388, 'epoch': 0.44}
+ 44%|████▍     | 2968/6779 [1:50:02<2:15:24,  2.13s/it] 44%|████▍     | 2969/6779 [1:50:04<2:18:47,  2.19s/it]                                                       {'loss': 1.7052, 'learning_rate': 0.00024399305032695595, 'epoch': 0.44}
+ 44%|████▍     | 2969/6779 [1:50:04<2:18:47,  2.19s/it] 44%|████▍     | 2970/6779 [1:50:07<2:28:16,  2.34s/it]                                                       {'loss': 1.5688, 'learning_rate': 0.00024390127580209973, 'epoch': 0.44}
+ 44%|████▍     | 2970/6779 [1:50:07<2:28:16,  2.34s/it] 44%|████▍     | 2971/6779 [1:50:09<2:23:01,  2.25s/it]                                                       {'loss': 1.8144, 'learning_rate': 0.00024380949156422994, 'epoch': 0.44}
+ 44%|████▍     | 2971/6779 [1:50:09<2:23:01,  2.25s/it] 44%|████▍     | 2972/6779 [1:50:11<2:24:56,  2.28s/it]                                                       {'loss': 1.7187, 'learning_rate': 0.00024371769763365366, 'epoch': 0.44}
+ 44%|████▍     | 2972/6779 [1:50:11<2:24:56,  2.28s/it] 44%|████▍     | 2973/6779 [1:50:14<2:31:24,  2.39s/it]                                                       {'loss': 1.7669, 'learning_rate': 0.00024362589403068003, 'epoch': 0.44}
+ 44%|████▍     | 2973/6779 [1:50:14<2:31:24,  2.39s/it] 44%|████▍     | 2974/6779 [1:50:16<2:29:01,  2.35s/it]                                                       {'loss': 1.6387, 'learning_rate': 0.00024353408077562016, 'epoch': 0.44}
+ 44%|████▍     | 2974/6779 [1:50:16<2:29:01,  2.35s/it] 44%|████▍     | 2975/6779 [1:50:18<2:23:42,  2.27s/it]                                                       {'loss': 1.5679, 'learning_rate': 0.00024344225788878752, 'epoch': 0.44}
+ 44%|████▍     | 2975/6779 [1:50:18<2:23:42,  2.27s/it] 44%|████▍     | 2976/6779 [1:50:20<2:21:43,  2.24s/it]                                                       {'loss': 1.4543, 'learning_rate': 0.0002433504253904976, 'epoch': 0.44}
+ 44%|████▍     | 2976/6779 [1:50:20<2:21:43,  2.24s/it] 44%|████▍     | 2977/6779 [1:50:22<2:20:20,  2.21s/it]                                                       {'loss': 1.7237, 'learning_rate': 0.00024325858330106806, 'epoch': 0.44}
+ 44%|████▍     | 2977/6779 [1:50:22<2:20:20,  2.21s/it] 44%|████▍     | 2978/6779 [1:50:25<2:20:41,  2.22s/it]                                                       {'loss': 1.6826, 'learning_rate': 0.0002431667316408186, 'epoch': 0.44}
+ 44%|████▍     | 2978/6779 [1:50:25<2:20:41,  2.22s/it] 44%|████▍     | 2979/6779 [1:50:27<2:19:26,  2.20s/it]                                                       {'loss': 1.7609, 'learning_rate': 0.00024307487043007114, 'epoch': 0.44}
+ 44%|████▍     | 2979/6779 [1:50:27<2:19:26,  2.20s/it] 44%|████▍     | 2980/6779 [1:50:29<2:18:53,  2.19s/it]                                                       {'loss': 1.7442, 'learning_rate': 0.00024298299968914972, 'epoch': 0.44}
+ 44%|████▍     | 2980/6779 [1:50:29<2:18:53,  2.19s/it] 44%|████▍     | 2981/6779 [1:50:31<2:23:40,  2.27s/it]                                                       {'loss': 1.867, 'learning_rate': 0.0002428911194383804, 'epoch': 0.44}
+ 44%|████▍     | 2981/6779 [1:50:31<2:23:40,  2.27s/it] 44%|████▍     | 2982/6779 [1:50:34<2:26:35,  2.32s/it]                                                       {'loss': 2.0102, 'learning_rate': 0.0002427992296980913, 'epoch': 0.44}
+ 44%|████▍     | 2982/6779 [1:50:34<2:26:35,  2.32s/it] 44%|████▍     | 2983/6779 [1:50:36<2:21:52,  2.24s/it]                                                       {'loss': 1.9693, 'learning_rate': 0.0002427073304886129, 'epoch': 0.44}
+ 44%|████▍     | 2983/6779 [1:50:36<2:21:52,  2.24s/it] 44%|████▍     | 2984/6779 [1:50:38<2:16:54,  2.16s/it]                                                       {'loss': 1.6912, 'learning_rate': 0.0002426154218302775, 'epoch': 0.44}
+ 44%|████▍     | 2984/6779 [1:50:38<2:16:54,  2.16s/it] 44%|████▍     | 2985/6779 [1:50:40<2:17:29,  2.17s/it]                                                       {'loss': 1.6105, 'learning_rate': 0.00024252350374341953, 'epoch': 0.44}
+ 44%|████▍     | 2985/6779 [1:50:40<2:17:29,  2.17s/it] 44%|████▍     | 2986/6779 [1:50:42<2:18:46,  2.20s/it]                                                       {'loss': 1.652, 'learning_rate': 0.00024243157624837566, 'epoch': 0.44}
+ 44%|████▍     | 2986/6779 [1:50:42<2:18:46,  2.20s/it] 44%|████▍     | 2987/6779 [1:50:45<2:20:08,  2.22s/it]                                                       {'loss': 1.7776, 'learning_rate': 0.00024233963936548452, 'epoch': 0.44}
+ 44%|████▍     | 2987/6779 [1:50:45<2:20:08,  2.22s/it] 44%|████▍     | 2988/6779 [1:50:47<2:17:41,  2.18s/it]                                                       {'loss': 1.8523, 'learning_rate': 0.00024233963936548452, 'epoch': 0.44}
+ 44%|█��██▍     | 2988/6779 [1:50:47<2:17:41,  2.18s/it] 44%|████▍     | 2989/6779 [1:50:49<2:13:12,  2.11s/it]                                                       {'loss': 1.4914, 'learning_rate': 0.00024224769311508682, 'epoch': 0.44}
+ 44%|████▍     | 2989/6779 [1:50:49<2:13:12,  2.11s/it] 44%|████▍     | 2990/6779 [1:50:51<2:14:28,  2.13s/it]                                                       {'loss': 1.6745, 'learning_rate': 0.00024215573751752535, 'epoch': 0.44}
+ 44%|████▍     | 2990/6779 [1:50:51<2:14:28,  2.13s/it] 44%|████▍     | 2991/6779 [1:50:53<2:12:41,  2.10s/it]                                                       {'loss': 1.5334, 'learning_rate': 0.00024206377259314513, 'epoch': 0.44}
+ 44%|████▍     | 2991/6779 [1:50:53<2:12:41,  2.10s/it] 44%|████▍     | 2992/6779 [1:50:55<2:13:47,  2.12s/it]                                                       {'loss': 1.6116, 'learning_rate': 0.00024197179836229295, 'epoch': 0.44}
+ 44%|████▍     | 2992/6779 [1:50:55<2:13:47,  2.12s/it] 44%|████▍     | 2993/6779 [1:50:57<2:15:09,  2.14s/it]                                                       {'loss': 1.7426, 'learning_rate': 0.00024187981484531784, 'epoch': 0.44}
+ 44%|████▍     | 2993/6779 [1:50:57<2:15:09,  2.14s/it] 44%|████▍     | 2994/6779 [1:50:59<2:15:34,  2.15s/it]                                                       {'loss': 1.7405, 'learning_rate': 0.0002417878220625708, 'epoch': 0.44}
+ 44%|████▍     | 2994/6779 [1:50:59<2:15:34,  2.15s/it] 44%|████▍     | 2995/6779 [1:51:01<2:13:39,  2.12s/it]                                                       {'loss': 1.8009, 'learning_rate': 0.00024169582003440504, 'epoch': 0.44}
+ 44%|████▍     | 2995/6779 [1:51:01<2:13:39,  2.12s/it] 44%|████▍     | 2996/6779 [1:51:04<2:15:37,  2.15s/it]                                                       {'loss': 1.5976, 'learning_rate': 0.0002416038087811757, 'epoch': 0.44}
+ 44%|████▍     | 2996/6779 [1:51:04<2:15:37,  2.15s/it] 44%|████▍     | 2997/6779 [1:51:06<2:14:28,  2.13s/it]                                                       {'loss': 1.7503, 'learning_rate': 0.00024151178832323983, 'epoch': 0.44}
+ 44%|████▍     | 2997/6779 [1:51:06<2:14:28,  2.13s/it] 44%|████▍     | 2998/6779 [1:51:08<2:16:58,  2.17s/it]                                                       {'loss': 1.6757, 'learning_rate': 0.00024141975868095678, 'epoch': 0.44}
+ 44%|████▍     | 2998/6779 [1:51:08<2:16:58,  2.17s/it] 44%|████▍     | 2999/6779 [1:51:10<2:14:38,  2.14s/it]                                                       {'loss': 1.7599, 'learning_rate': 0.00024132771987468786, 'epoch': 0.44}
+ 44%|████▍     | 2999/6779 [1:51:10<2:14:38,  2.14s/it] 44%|████▍     | 3000/6779 [1:51:12<2:13:57,  2.13s/it]                                                       {'loss': 1.8226, 'learning_rate': 0.0002412356719247962, 'epoch': 0.44}
+ 44%|████▍     | 3000/6779 [1:51:12<2:13:57,  2.13s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+ 44%|████▍     | 3001/6779 [1:51:15<2:28:20,  2.36s/it]                                                       {'loss': 1.6389, 'learning_rate': 0.00024114361485164722, 'epoch': 0.44}
+ 44%|████▍     | 3001/6779 [1:51:15<2:28:20,  2.36s/it] 44%|████▍     | 3002/6779 [1:51:17<2:24:45,  2.30s/it]                                                       {'loss': 1.6279, 'learning_rate': 0.0002410515486756082, 'epoch': 0.44}
+ 44%|████▍     | 3002/6779 [1:51:17<2:24:45,  2.30s/it] 44%|████▍     | 3003/6779 [1:51:20<2:24:07,  2.29s/it]                                                       {'loss': 1.6954, 'learning_rate': 0.00024095947341704844, 'epoch': 0.44}
+ 44%|████▍     | 3003/6779 [1:51:20<2:24:07,  2.29s/it] 44%|████▍     | 3004/6779 [1:51:22<2:23:34,  2.28s/it]                                                       {'loss': 1.7028, 'learning_rate': 0.00024086738909633932, 'epoch': 0.44}
+ 44%|████▍     | 3004/6779 [1:51:22<2:23:34,  2.28s/it] 44%|████▍     | 3005/6779 [1:51:24<2:25:59,  2.32s/it]                                                       {'loss': 1.7459, 'learning_rate': 0.00024077529573385427, 'epoch': 0.44}
+ 44%|████▍     | 3005/6779 [1:51:24<2:25:59,  2.32s/it] 44%|████▍     | 3006/6779 [1:51:27<2:26:58,  2.34s/it]                                                       {'loss': 1.7873, 'learning_rate': 0.0002406831933499686, 'epoch': 0.44}
+ 44%|████▍     | 3006/6779 [1:51:27<2:26:58,  2.34s/it] 44%|████▍     | 3007/6779 [1:51:29<2:24:39,  2.30s/it]                                                       {'loss': 1.7276, 'learning_rate': 0.0002405910819650596, 'epoch': 0.44}
+ 44%|████▍     | 3007/6779 [1:51:29<2:24:39,  2.30s/it] 44%|████▍     | 3008/6779 [1:51:31<2:20:35,  2.24s/it]                                                       {'loss': 1.7481, 'learning_rate': 0.00024049896159950666, 'epoch': 0.44}
+ 44%|████▍     | 3008/6779 [1:51:31<2:20:35,  2.24s/it] 44%|████▍     | 3009/6779 [1:51:33<2:19:08,  2.21s/it]                                                       {'loss': 1.7827, 'learning_rate': 0.00024040683227369116, 'epoch': 0.44}
+ 44%|████▍     | 3009/6779 [1:51:33<2:19:08,  2.21s/it] 44%|████▍     | 3010/6779 [1:51:35<2:19:29,  2.22s/it]                                                       {'loss': 1.6489, 'learning_rate': 0.00024031469400799632, 'epoch': 0.44}
+ 44%|████▍     | 3010/6779 [1:51:35<2:19:29,  2.22s/it] 44%|████▍     | 3011/6779 [1:51:37<2:18:04,  2.20s/it]                                                       {'loss': 1.7176, 'learning_rate': 0.00024022254682280742, 'epoch': 0.44}
+ 44%|████▍     | 3011/6779 [1:51:37<2:18:04,  2.20s/it] 44%|████▍     | 3012/6779 [1:51:40<2:15:51,  2.16s/it]                                                       {'loss': 1.71, 'learning_rate': 0.00024013039073851182, 'epoch': 0.44}
+ 44%|████▍     | 3012/6779 [1:51:40<2:15:51,  2.16s/it] 44%|████▍     | 3013/6779 [1:51:42<2:17:54,  2.20s/it]                                                       {'loss': 1.7907, 'learning_rate': 0.00024003822577549873, 'epoch': 0.44}
+ 44%|████▍     | 3013/6779 [1:51:42<2:17:54,  2.20s/it] 44%|████▍     | 3014/6779 [1:51:44<2:20:30,  2.24s/it]                                                       {'loss': 1.7828, 'learning_rate': 0.0002399460519541593, 'epoch': 0.44}
+ 44%|████▍     | 3014/6779 [1:51:44<2:20:30,  2.24s/it] 44%|████▍     | 3015/6779 [1:51:46<2:19:54,  2.23s/it]                                                       {'loss': 1.4706, 'learning_rate': 0.0002398538692948866, 'epoch': 0.44}
+ 44%|████▍     | 3015/6779 [1:51:46<2:19:54,  2.23s/it] 44%|████▍     | 3016/6779 [1:51:48<2:17:13,  2.19s/it]                                                       {'loss': 1.8753, 'learning_rate': 0.000239761677818076, 'epoch': 0.44}
+ 44%|████▍     | 3016/6779 [1:51:48<2:17:13,  2.19s/it] 45%|████▍     | 3017/6779 [1:51:51<2:19:19,  2.22s/it]                                                       {'loss': 1.7808, 'learning_rate': 0.0002396694775441244, 'epoch': 0.45}
+ 45%|████▍     | 3017/6779 [1:51:51<2:19:19,  2.22s/it] 45%|████▍     | 3018/6779 [1:51:53<2:19:50,  2.23s/it]                                                       {'loss': 1.5231, 'learning_rate': 0.0002395772684934307, 'epoch': 0.45}
+ 45%|████▍     | 3018/6779 [1:51:53<2:19:50,  2.23s/it] 45%|████▍     | 3019/6779 [1:51:55<2:17:40,  2.20s/it]                                                       {'loss': 1.7732, 'learning_rate': 0.00023948505068639605, 'epoch': 0.45}
+ 45%|████▍     | 3019/6779 [1:51:55<2:17:40,  2.20s/it] 45%|████▍     | 3020/6779 [1:51:57<2:18:09,  2.21s/it]                                                       {'loss': 1.7739, 'learning_rate': 0.00023939282414342327, 'epoch': 0.45}
+ 45%|████▍     | 3020/6779 [1:51:57<2:18:09,  2.21s/it] 45%|████▍     | 3021/6779 [1:52:00<2:18:13,  2.21s/it]                                                       {'loss': 1.718, 'learning_rate': 0.00023930058888491714, 'epoch': 0.45}
+ 45%|████▍     | 3021/6779 [1:52:00<2:18:13,  2.21s/it] 45%|████▍     | 3022/6779 [1:52:02<2:24:55,  2.31s/it]                                                       {'loss': 1.7884, 'learning_rate': 0.00023920834493128439, 'epoch': 0.45}
+ 45%|████▍     | 3022/6779 [1:52:02<2:24:55,  2.31s/it] 45%|████▍     | 3023/6779 [1:52:04<2:22:51,  2.28s/it]                                                       {'loss': 1.762, 'learning_rate': 0.00023911609230293376, 'epoch': 0.45}
+ 45%|████▍     | 3023/6779 [1:52:04<2:22:51,  2.28s/it] 45%|████▍     | 3024/6779 [1:52:06<2:19:25,  2.23s/it]                                                       {'loss': 1.7647, 'learning_rate': 0.00023902383102027591, 'epoch': 0.45}
+ 45%|████▍     | 3024/6779 [1:52:06<2:19:25,  2.23s/it] 45%|████▍     | 3025/6779 [1:52:09<2:23:32,  2.29s/it]                                                       {'loss': 1.6898, 'learning_rate': 0.00023893156110372314, 'epoch': 0.45}
+ 45%|████▍     | 3025/6779 [1:52:09<2:23:32,  2.29s/it] 45%|████▍     | 3026/6779 [1:52:11<2:22:19,  2.28s/it]                                                       {'loss': 1.788, 'learning_rate': 0.00023883928257369008, 'epoch': 0.45}
+ 45%|████▍     | 3026/6779 [1:52:11<2:22:19,  2.28s/it] 45%|████▍     | 3027/6779 [1:52:13<2:20:55,  2.25s/it]                                                       {'loss': 1.7465, 'learning_rate': 0.00023874699545059288, 'epoch': 0.45}
+ 45%|████▍     | 3027/6779 [1:52:13<2:20:55,  2.25s/it] 45%|████▍     | 3028/6779 [1:52:16<2:25:24,  2.33s/it]                                                       {'loss': 1.6468, 'learning_rate': 0.0002386546997548499, 'epoch': 0.45}
+ 45%|████▍     | 3028/6779 [1:52:16<2:25:24,  2.33s/it] 45%|████▍     | 3029/6779 [1:52:18<2:20:58,  2.26s/it]                                                       {'loss': 1.8166, 'learning_rate': 0.00023856239550688112, 'epoch': 0.45}
+ 45%|████▍     | 3029/6779 [1:52:18<2:20:58,  2.26s/it] 45%|████▍     | 3030/6779 [1:52:20<2:16:33,  2.19s/it]                                                       {'loss': 1.6667, 'learning_rate': 0.00023847008272710868, 'epoch': 0.45}
+ 45%|████▍     | 3030/6779 [1:52:20<2:16:33,  2.19s/it] 45%|████▍     | 3031/6779 [1:52:22<2:16:46,  2.19s/it]                                                       {'loss': 1.5991, 'learning_rate': 0.00023837776143595645, 'epoch': 0.45}
+ 45%|████▍     | 3031/6779 [1:52:22<2:16:46,  2.19s/it] 45%|████▍     | 3032/6779 [1:52:24<2:16:34,  2.19s/it]                                                       {'loss': 1.6904, 'learning_rate': 0.00023828543165385017, 'epoch': 0.45}
+ 45%|████▍     | 3032/6779 [1:52:24<2:16:34,  2.19s/it] 45%|████▍     | 3033/6779 [1:52:26<2:14:41,  2.16s/it]                                                       {'loss': 1.5948, 'learning_rate': 0.00023819309340121755, 'epoch': 0.45}
+ 45%|████▍     | 3033/6779 [1:52:26<2:14:41,  2.16s/it] 45%|████▍     | 3034/6779 [1:52:29<2:22:16,  2.28s/it]                                                       {'loss': 1.7908, 'learning_rate': 0.0002381007466984881, 'epoch': 0.45}
+ 45%|████▍     | 3034/6779 [1:52:29<2:22:16,  2.28s/it] 45%|████▍     | 3035/6779 [1:52:31<2:18:40,  2.22s/it]                                                       {'loss': 1.5006, 'learning_rate': 0.0002380083915660932, 'epoch': 0.45}
+ 45%|████▍     | 3035/6779 [1:52:31<2:18:40,  2.22s/it] 45%|████▍     | 3036/6779 [1:52:33<2:19:58,  2.24s/it]                                                       {'loss': 1.7187, 'learning_rate': 0.00023791602802446615, 'epoch': 0.45}
+ 45%|████▍     | 3036/6779 [1:52:33<2:19:58,  2.24s/it] 45%|████▍     | 3037/6779 [1:52:36<2:18:44,  2.22s/it]                                                       {'loss': 1.71, 'learning_rate': 0.00023782365609404212, 'epoch': 0.45}
+ 45%|████▍     | 3037/6779 [1:52:36<2:18:44,  2.22s/it] 45%|████▍     | 3038/6779 [1:52:38<2:19:29,  2.24s/it]                                                       {'loss': 1.6877, 'learning_rate': 0.00023773127579525803, 'epoch': 0.45}
+ 45%|████▍     | 3038/6779 [1:52:38<2:19:29,  2.24s/it] 45%|████▍     | 3039/6779 [1:52:40<2:16:15,  2.19s/it]                                                       {'loss': 1.791, 'learning_rate': 0.00023763888714855273, 'epoch': 0.45}
+ 45%|████▍     | 3039/6779 [1:52:40<2:16:15,  2.19s/it] 45%|████▍     | 3040/6779 [1:52:42<2:17:06,  2.20s/it]                                                       {'loss': 1.6768, 'learning_rate': 0.00023754649017436696, 'epoch': 0.45}
+ 45%|████▍     | 3040/6779 [1:52:42<2:17:06,  2.20s/it] 45%|████▍     | 3041/6779 [1:52:44<2:19:20,  2.24s/it]                                                       {'loss': 1.6592, 'learning_rate': 0.0002374540848931432, 'epoch': 0.45}
+ 45%|████▍     | 3041/6779 [1:52:44<2:19:20,  2.24s/it] 45%|████▍     | 3042/6779 [1:52:47<2:18:13,  2.22s/it]                                                       {'loss': 1.7232, 'learning_rate': 0.00023736167132532585, 'epoch': 0.45}
+ 45%|████▍     | 3042/6779 [1:52:47<2:18:13,  2.22s/it] 45%|████▍     | 3043/6779 [1:52:49<2:15:25,  2.18s/it]                                                       {'loss': 1.7398, 'learning_rate': 0.000237269249491361, 'epoch': 0.45}
+ 45%|████▍     | 3043/6779 [1:52:49<2:15:25,  2.18s/it] 45%|████▍     | 3044/6779 [1:52:51<2:19:56,  2.25s/it]                                                       {'loss': 1.8749, 'learning_rate': 0.00023717681941169683, 'epoch': 0.45}
+ 45%|████▍     | 3044/6779 [1:52:51<2:19:56,  2.25s/it] 45%|████▍     | 3045/6779 [1:52:53<2:18:41,  2.23s/it]                                                       {'loss': 1.6215, 'learning_rate': 0.00023708438110678316, 'epoch': 0.45}
+ 45%|████▍     | 3045/6779 [1:52:53<2:18:41,  2.23s/it] 45%|████▍     | 3046/6779 [1:52:55<2:17:29,  2.21s/it]                                                       {'loss': 1.7992, 'learning_rate': 0.00023699193459707156, 'epoch': 0.45}
+ 45%|████▍     | 3046/6779 [1:52:55<2:17:29,  2.21s/it] 45%|████▍     | 3047/6779 [1:52:57<2:13:03,  2.14s/it]                                                       {'loss': 1.5702, 'learning_rate': 0.00023689947990301562, 'epoch': 0.45}
+ 45%|████▍     | 3047/6779 [1:52:57<2:13:03,  2.14s/it] 45%|████▍     | 3048/6779 [1:53:00<2:12:42,  2.13s/it]                                                       {'loss': 1.7285, 'learning_rate': 0.0002368070170450706, 'epoch': 0.45}
+ 45%|████▍     | 3048/6779 [1:53:00<2:12:42,  2.13s/it] 45%|████▍     | 3049/6779 [1:53:02<2:14:42,  2.17s/it]                                                       {'loss': 1.8529, 'learning_rate': 0.00023671454604369362, 'epoch': 0.45}
+ 45%|████▍     | 3049/6779 [1:53:02<2:14:42,  2.17s/it] 45%|████▍     | 3050/6779 [1:53:04<2:13:12,  2.14s/it]                                                       {'loss': 1.5579, 'learning_rate': 0.00023662206691934352, 'epoch': 0.45}
+ 45%|████▍     | 3050/6779 [1:53:04<2:13:12,  2.14s/it] 45%|████▌     | 3051/6779 [1:53:07<2:23:50,  2.32s/it]                                                       {'loss': 1.6565, 'learning_rate': 0.00023652957969248108, 'epoch': 0.45}
+ 45%|████▌     | 3051/6779 [1:53:07<2:23:50,  2.32s/it] 45%|████▌     | 3052/6779 [1:53:09<2:18:22,  2.23s/it]                                                       {'loss': 1.7053, 'learning_rate': 0.00023643708438356878, 'epoch': 0.45}
+ 45%|████▌     | 3052/6779 [1:53:09<2:18:22,  2.23s/it] 45%|████▌     | 3053/6779 [1:53:11<2:14:54,  2.17s/it]                                                       {'loss': 1.5798, 'learning_rate': 0.00023634458101307092, 'epoch': 0.45}
+ 45%|████▌     | 3053/6779 [1:53:11<2:14:54,  2.17s/it] 45%|████▌     | 3054/6779 [1:53:13<2:13:14,  2.15s/it]                                                       {'loss': 1.7147, 'learning_rate': 0.0002362520696014535, 'epoch': 0.45}
+ 45%|████▌     | 3054/6779 [1:53:13<2:13:14,  2.15s/it] 45%|████▌     | 3055/6779 [1:53:15<2:14:15,  2.16s/it]                                                       {'loss': 1.7382, 'learning_rate': 0.00023615955016918446, 'epoch': 0.45}
+ 45%|████▌     | 3055/6779 [1:53:15<2:14:15,  2.16s/it] 45%|████▌     | 3056/6779 [1:53:17<2:13:16,  2.15s/it]                                                       {'loss': 1.5938, 'learning_rate': 0.00023606702273673338, 'epoch': 0.45}
+ 45%|████▌     | 3056/6779 [1:53:17<2:13:16,  2.15s/it] 45%|████▌     | 3057/6779 [1:53:19<2:14:15,  2.16s/it]                                                       {'loss': 1.8757, 'learning_rate': 0.00023597448732457158, 'epoch': 0.45}
+ 45%|████▌     | 3057/6779 [1:53:19<2:14:15,  2.16s/it] 45%|████▌     | 3058/6779 [1:53:21<2:12:07,  2.13s/it]                                                       {'loss': 1.6802, 'learning_rate': 0.00023588194395317231, 'epoch': 0.45}
+ 45%|████▌     | 3058/6779 [1:53:21<2:12:07,  2.13s/it] 45%|████▌     | 3059/6779 [1:53:23<2:13:18,  2.15s/it]                                                       {'loss': 1.8123, 'learning_rate': 0.0002357893926430105, 'epoch': 0.45}
+ 45%|████▌     | 3059/6779 [1:53:23<2:13:18,  2.15s/it] 45%|████▌     | 3060/6779 [1:53:25<2:10:41,  2.11s/it]                                                       {'loss': 1.7688, 'learning_rate': 0.00023569683341456273, 'epoch': 0.45}
+ 45%|████▌     | 3060/6779 [1:53:25<2:10:41,  2.11s/it] 45%|████▌     | 3061/6779 [1:53:28<2:11:20,  2.12s/it]                                                       {'loss': 1.5175, 'learning_rate': 0.00023560426628830753, 'epoch': 0.45}
+ 45%|████▌     | 3061/6779 [1:53:28<2:11:20,  2.12s/it] 45%|████▌     | 3062/6779 [1:53:30<2:12:04,  2.13s/it]                                                       {'loss': 1.6444, 'learning_rate': 0.00023551169128472495, 'epoch': 0.45}
+ 45%|████▌     | 3062/6779 [1:53:30<2:12:04,  2.13s/it] 45%|████▌     | 3063/6779 [1:53:32<2:11:46,  2.13s/it]                                                       {'loss': 1.6394, 'learning_rate': 0.00023541910842429705, 'epoch': 0.45}
+ 45%|████▌     | 3063/6779 [1:53:32<2:11:46,  2.13s/it] 45%|████▌     | 3064/6779 [1:53:34<2:11:40,  2.13s/it]                                                       {'loss': 1.6101, 'learning_rate': 0.00023532651772750743, 'epoch': 0.45}
+ 45%|████▌     | 3064/6779 [1:53:34<2:11:40,  2.13s/it] 45%|████▌     | 3065/6779 [1:53:36<2:11:45,  2.13s/it]                                                       {'loss': 1.6928, 'learning_rate': 0.0002352339192148414, 'epoch': 0.45}
+ 45%|████▌     | 3065/6779 [1:53:36<2:11:45,  2.13s/it] 45%|████▌     | 3066/6779 [1:53:38<2:10:35,  2.11s/it]                                                       {'loss': 1.744, 'learning_rate': 0.0002351413129067862, 'epoch': 0.45}
+ 45%|████▌     | 3066/6779 [1:53:38<2:10:35,  2.11s/it] 45%|████▌     | 3067/6779 [1:53:41<2:19:27,  2.25s/it]                                                       {'loss': 1.5983, 'learning_rate': 0.00023504869882383055, 'epoch': 0.45}
+ 45%|████▌     | 3067/6779 [1:53:41<2:19:27,  2.25s/it] 45%|████▌     | 3068/6779 [1:53:43<2:21:44,  2.29s/it]                                                       {'loss': 1.6656, 'learning_rate': 0.00023495607698646506, 'epoch': 0.45}
+ 45%|████▌     | 3068/6779 [1:53:43<2:21:44,  2.29s/it] 45%|████▌     | 3069/6779 [1:53:45<2:17:52,  2.23s/it]                                                       {'loss': 1.7096, 'learning_rate': 0.0002348634474151821, 'epoch': 0.45}
+ 45%|████▌     | 3069/6779 [1:53:45<2:17:52,  2.23s/it] 45%|████▌     | 3070/6779 [1:53:47<2:16:59,  2.22s/it]                                                       {'loss': 1.6411, 'learning_rate': 0.00023477081013047557, 'epoch': 0.45}
+ 45%|████▌     | 3070/6779 [1:53:47<2:16:59,  2.22s/it] 45%|████▌     | 3071/6779 [1:53:50<2:16:57,  2.22s/it]                                                       {'loss': 1.622, 'learning_rate': 0.00023467816515284118, 'epoch': 0.45}
+ 45%|████▌     | 3071/6779 [1:53:50<2:16:57,  2.22s/it] 45%|████▌     | 3072/6779 [1:53:52<2:19:08,  2.25s/it]                                                       {'loss': 1.6889, 'learning_rate': 0.00023458551250277632, 'epoch': 0.45}
+ 45%|████▌     | 3072/6779 [1:53:52<2:19:08,  2.25s/it] 45%|████▌     | 3073/6779 [1:53:54<2:18:46,  2.25s/it]                                                       {'loss': 1.7553, 'learning_rate': 0.00023449285220078007, 'epoch': 0.45}
+ 45%|████▌     | 3073/6779 [1:53:54<2:18:46,  2.25s/it] 45%|████▌     | 3074/6779 [1:53:56<2:14:36,  2.18s/it]                                                       {'loss': 1.7259, 'learning_rate': 0.00023440018426735325, 'epoch': 0.45}
+ 45%|████▌     | 3074/6779 [1:53:56<2:14:36,  2.18s/it] 45%|████▌     | 3075/6779 [1:53:59<2:16:16,  2.21s/it]                                                       {'loss': 1.612, 'learning_rate': 0.0002343075087229983, 'epoch': 0.45}
+ 45%|████▌     | 3075/6779 [1:53:59<2:16:16,  2.21s/it] 45%|████▌     | 3076/6779 [1:54:01<2:16:15,  2.21s/it]                                                       {'loss': 1.5533, 'learning_rate': 0.00023421482558821946, 'epoch': 0.45}
+ 45%|████▌     | 3076/6779 [1:54:01<2:16:15,  2.21s/it] 45%|████▌     | 3077/6779 [1:54:03<2:20:08,  2.27s/it]                                                       {'loss': 1.7806, 'learning_rate': 0.00023412213488352247, 'epoch': 0.45}
+ 45%|████▌     | 3077/6779 [1:54:03<2:20:08,  2.27s/it] 45%|████▌     | 3078/6779 [1:54:05<2:15:16,  2.19s/it]                                                       {'loss': 1.6191, 'learning_rate': 0.00023402943662941493, 'epoch': 0.45}
+ 45%|████▌     | 3078/6779 [1:54:05<2:15:16,  2.19s/it] 45%|████▌     | 3079/6779 [1:54:07<2:14:00,  2.17s/it]                                                       {'loss': 1.7007, 'learning_rate': 0.00023393673084640598, 'epoch': 0.45}
+ 45%|████▌     | 3079/6779 [1:54:07<2:14:00,  2.17s/it] 45%|████▌     | 3080/6779 [1:54:10<2:17:02,  2.22s/it]                                                       {'loss': 1.8288, 'learning_rate': 0.00023384401755500647, 'epoch': 0.45}
+ 45%|████▌     | 3080/6779 [1:54:10<2:17:02,  2.22s/it] 45%|████▌     | 3081/6779 [1:54:12<2:20:20,  2.28s/it]                                                       {'loss': 1.754, 'learning_rate': 0.00023375129677572894, 'epoch': 0.45}
+ 45%|████▌     | 3081/6779 [1:54:12<2:20:20,  2.28s/it] 45%|████▌     | 3082/6779 [1:54:14<2:19:10,  2.26s/it]                                                       {'loss': 1.8811, 'learning_rate': 0.00023365856852908747, 'epoch': 0.45}
+ 45%|████▌     | 3082/6779 [1:54:14<2:19:10,  2.26s/it] 45%|████▌     | 3083/6779 [1:54:17<2:20:39,  2.28s/it]                                                       {'loss': 1.7198, 'learning_rate': 0.00023356583283559804, 'epoch': 0.45}
+ 45%|████▌     | 3083/6779 [1:54:17<2:20:39,  2.28s/it] 45%|████▌     | 3084/6779 [1:54:19<2:19:53,  2.27s/it]                                                       {'loss': 1.8077, 'learning_rate': 0.00023347308971577796, 'epoch': 0.45}
+ 45%|████▌     | 3084/6779 [1:54:19<2:19:53,  2.27s/it] 46%|████▌     | 3085/6779 [1:54:21<2:17:35,  2.23s/it]                                                       {'loss': 1.7482, 'learning_rate': 0.00023338033919014647, 'epoch': 0.46}
+ 46%|████▌     | 3085/6779 [1:54:21<2:17:35,  2.23s/it] 46%|████▌     | 3086/6779 [1:54:23<2:14:55,  2.19s/it]                                                       {'loss': 1.5969, 'learning_rate': 0.0002332875812792242, 'epoch': 0.46}
+ 46%|████▌     | 3086/6779 [1:54:23<2:14:55,  2.19s/it] 46%|████▌     | 3087/6779 [1:54:25<2:13:07,  2.16s/it]                                                       {'loss': 1.6117, 'learning_rate': 0.00023319481600353367, 'epoch': 0.46}
+ 46%|████▌     | 3087/6779 [1:54:25<2:13:07,  2.16s/it] 46%|████▌     | 3088/6779 [1:54:27<2:14:19,  2.18s/it]                                                       {'loss': 1.7621, 'learning_rate': 0.00023310204338359883, 'epoch': 0.46}
+ 46%|████▌     | 3088/6779 [1:54:27<2:14:19,  2.18s/it] 46%|████▌     | 3089/6779 [1:54:29<2:11:32,  2.14s/it]                                                       {'loss': 1.6776, 'learning_rate': 0.00023300926343994518, 'epoch': 0.46}
+ 46%|████▌     | 3089/6779 [1:54:29<2:11:32,  2.14s/it] 46%|████▌     | 3090/6779 [1:54:32<2:12:43,  2.16s/it]                                                       {'loss': 1.5931, 'learning_rate': 0.0002329164761931002, 'epoch': 0.46}
+ 46%|████▌     | 3090/6779 [1:54:32<2:12:43,  2.16s/it] 46%|████▌     | 3091/6779 [1:54:34<2:14:08,  2.18s/it]                                                       {'loss': 1.6523, 'learning_rate': 0.00023282368166359265, 'epoch': 0.46}
+ 46%|████▌     | 3091/6779 [1:54:34<2:14:08,  2.18s/it] 46%|████▌     | 3092/6779 [1:54:36<2:14:16,  2.18s/it]                                                       {'loss': 1.7935, 'learning_rate': 0.00023273087987195302, 'epoch': 0.46}
+ 46%|████▌     | 3092/6779 [1:54:36<2:14:16,  2.18s/it] 46%|████▌     | 3093/6779 [1:54:38<2:14:42,  2.19s/it]                                                       {'loss': 1.7283, 'learning_rate': 0.00023263807083871344, 'epoch': 0.46}
+ 46%|████▌     | 3093/6779 [1:54:38<2:14:42,  2.19s/it] 46%|████▌     | 3094/6779 [1:54:41<2:14:51,  2.20s/it]                                                       {'loss': 1.5239, 'learning_rate': 0.00023254525458440753, 'epoch': 0.46}
+ 46%|████▌     | 3094/6779 [1:54:41<2:14:51,  2.20s/it] 46%|████▌     | 3095/6779 [1:54:43<2:11:38,  2.14s/it]                                                       {'loss': 1.6912, 'learning_rate': 0.00023245243112957073, 'epoch': 0.46}
+ 46%|████▌     | 3095/6779 [1:54:43<2:11:38,  2.14s/it] 46%|████▌     | 3096/6779 [1:54:45<2:13:25,  2.17s/it]                                                       {'loss': 1.61, 'learning_rate': 0.00023235960049473975, 'epoch': 0.46}
+ 46%|████▌     | 3096/6779 [1:54:45<2:13:25,  2.17s/it] 46%|████▌     | 3097/6779 [1:54:47<2:13:02,  2.17s/it]                                                       {'loss': 1.9018, 'learning_rate': 0.00023226676270045316, 'epoch': 0.46}
+ 46%|████▌     | 3097/6779 [1:54:47<2:13:02,  2.17s/it] 46%|████▌     | 3098/6779 [1:54:49<2:12:09,  2.15s/it]                                                       {'loss': 1.5722, 'learning_rate': 0.00023217391776725102, 'epoch': 0.46}
+ 46%|████▌     | 3098/6779 [1:54:49<2:12:09,  2.15s/it] 46%|████▌     | 3099/6779 [1:54:51<2:08:29,  2.10s/it]                                                       {'loss': 1.5686, 'learning_rate': 0.00023208106571567493, 'epoch': 0.46}
+ 46%|████▌     | 3099/6779 [1:54:51<2:08:29,  2.10s/it] 46%|████▌     | 3100/6779 [1:54:53<2:11:03,  2.14s/it]                                                       {'loss': 1.6858, 'learning_rate': 0.00023198820656626813, 'epoch': 0.46}
+ 46%|████▌     | 3100/6779 [1:54:53<2:11:03,  2.14s/it] 46%|████▌     | 3101/6779 [1:54:55<2:12:56,  2.17s/it]                                                       {'loss': 1.7694, 'learning_rate': 0.00023189534033957537, 'epoch': 0.46}
+ 46%|████▌     | 3101/6779 [1:54:55<2:12:56,  2.17s/it] 46%|████▌     | 3102/6779 [1:54:58<2:11:29,  2.15s/it]                                                       {'loss': 1.7325, 'learning_rate': 0.00023180246705614308, 'epoch': 0.46}
+ 46%|████▌     | 3102/6779 [1:54:58<2:11:29,  2.15s/it] 46%|████▌     | 3103/6779 [1:55:00<2:10:09,  2.12s/it]                                                       {'loss': 1.6622, 'learning_rate': 0.00023170958673651904, 'epoch': 0.46}
+ 46%|████▌     | 3103/6779 [1:55:00<2:10:09,  2.12s/it] 46%|████▌     | 3104/6779 [1:55:02<2:13:31,  2.18s/it]                                                       {'loss': 1.775, 'learning_rate': 0.00023161669940125287, 'epoch': 0.46}
+ 46%|████▌     | 3104/6779 [1:55:02<2:13:31,  2.18s/it] 46%|████▌     | 3105/6779 [1:55:04<2:14:31,  2.20s/it]                                                       {'loss': 1.7465, 'learning_rate': 0.00023152380507089547, 'epoch': 0.46}
+ 46%|████▌     | 3105/6779 [1:55:04<2:14:31,  2.20s/it] 46%|████▌     | 3106/6779 [1:55:06<2:10:49,  2.14s/it]                                                       {'loss': 1.6253, 'learning_rate': 0.00023143090376599946, 'epoch': 0.46}
+ 46%|████▌     | 3106/6779 [1:55:06<2:10:49,  2.14s/it] 46%|████▌     | 3107/6779 [1:55:08<2:09:05,  2.11s/it]                                                       {'loss': 1.7951, 'learning_rate': 0.00023133799550711888, 'epoch': 0.46}
+ 46%|████▌     | 3107/6779 [1:55:08<2:09:05,  2.11s/it] 46%|████▌     | 3108/6779 [1:55:11<2:12:11,  2.16s/it]                                                       {'loss': 1.7785, 'learning_rate': 0.00023124508031480945, 'epoch': 0.46}
+ 46%|████▌     | 3108/6779 [1:55:11<2:12:11,  2.16s/it] 46%|████▌     | 3109/6779 [1:55:13<2:11:17,  2.15s/it]                                                       {'loss': 1.6981, 'learning_rate': 0.00023115215820962838, 'epoch': 0.46}
+ 46%|████▌     | 3109/6779 [1:55:13<2:11:17,  2.15s/it] 46%|████▌     | 3110/6779 [1:55:15<2:10:19,  2.13s/it]                                                       {'loss': 1.6708, 'learning_rate': 0.0002310592292121343, 'epoch': 0.46}
+ 46%|████▌     | 3110/6779 [1:55:15<2:10:19,  2.13s/it] 46%|████▌     | 3111/6779 [1:55:17<2:11:22,  2.15s/it]                                                       {'loss': 1.6724, 'learning_rate': 0.0002309662933428875, 'epoch': 0.46}
+ 46%|████▌     | 3111/6779 [1:55:17<2:11:22,  2.15s/it] 46%|████▌     | 3112/6779 [1:55:19<2:12:34,  2.17s/it]                                                       {'loss': 1.5062, 'learning_rate': 0.00023087335062244968, 'epoch': 0.46}
+ 46%|████▌     | 3112/6779 [1:55:19<2:12:34,  2.17s/it] 46%|████▌     | 3113/6779 [1:55:21<2:13:15,  2.18s/it]                                                       {'loss': 1.6364, 'learning_rate': 0.00023078040107138418, 'epoch': 0.46}
+ 46%|████▌     | 3113/6779 [1:55:21<2:13:15,  2.18s/it] 46%|████▌     | 3114/6779 [1:55:23<2:12:18,  2.17s/it]                                                       {'loss': 1.7695, 'learning_rate': 0.00023068744471025574, 'epoch': 0.46}
+ 46%|████▌     | 3114/6779 [1:55:23<2:12:18,  2.17s/it] 46%|████▌     | 3115/6779 [1:55:26<2:13:44,  2.19s/it]                                                       {'loss': 1.5952, 'learning_rate': 0.00023059448155963064, 'epoch': 0.46}
+ 46%|████▌     | 3115/6779 [1:55:26<2:13:44,  2.19s/it] 46%|████▌     | 3116/6779 [1:55:28<2:15:01,  2.21s/it]                                                       {'loss': 1.8686, 'learning_rate': 0.00023050151164007675, 'epoch': 0.46}
+ 46%|████▌     | 3116/6779 [1:55:28<2:15:01,  2.21s/it] 46%|████▌     | 3117/6779 [1:55:30<2:16:33,  2.24s/it]                                                       {'loss': 1.5452, 'learning_rate': 0.00023040853497216328, 'epoch': 0.46}
+ 46%|████▌     | 3117/6779 [1:55:30<2:16:33,  2.24s/it] 46%|████▌     | 3118/6779 [1:55:32<2:14:02,  2.20s/it]                                                       {'loss': 1.6174, 'learning_rate': 0.00023031555157646105, 'epoch': 0.46}
+ 46%|████▌     | 3118/6779 [1:55:32<2:14:02,  2.20s/it] 46%|████▌     | 3119/6779 [1:55:34<2:12:28,  2.17s/it]                                                       {'loss': 1.5463, 'learning_rate': 0.00023022256147354236, 'epoch': 0.46}
+ 46%|████▌     | 3119/6779 [1:55:35<2:12:28,  2.17s/it] 46%|████▌     | 3120/6779 [1:55:37<2:09:54,  2.13s/it]                                                       {'loss': 1.719, 'learning_rate': 0.00023012956468398087, 'epoch': 0.46}
+ 46%|████▌     | 3120/6779 [1:55:37<2:09:54,  2.13s/it] 46%|████▌     | 3121/6779 [1:55:39<2:10:09,  2.13s/it]                                                       {'loss': 1.6278, 'learning_rate': 0.00023003656122835186, 'epoch': 0.46}
+ 46%|████▌     | 3121/6779 [1:55:39<2:10:09,  2.13s/it] 46%|████▌     | 3122/6779 [1:55:41<2:12:14,  2.17s/it]                                                       {'loss': 1.7229, 'learning_rate': 0.00022994355112723204, 'epoch': 0.46}
+ 46%|████▌     | 3122/6779 [1:55:41<2:12:14,  2.17s/it] 46%|████▌     | 3123/6779 [1:55:43<2:11:56,  2.17s/it]                                                       {'loss': 1.7978, 'learning_rate': 0.00022985053440119967, 'epoch': 0.46}
+ 46%|████▌     | 3123/6779 [1:55:43<2:11:56,  2.17s/it] 46%|████▌     | 3124/6779 [1:55:45<2:12:35,  2.18s/it]                                                       {'loss': 1.6204, 'learning_rate': 0.0002297575110708343, 'epoch': 0.46}
+ 46%|████▌     | 3124/6779 [1:55:45<2:12:35,  2.18s/it] 46%|████▌     | 3125/6779 [1:55:47<2:12:02,  2.17s/it]                                                       {'loss': 1.7025, 'learning_rate': 0.00022966448115671706, 'epoch': 0.46}
+ 46%|████▌     | 3125/6779 [1:55:47<2:12:02,  2.17s/it] 46%|████▌     | 3126/6779 [1:55:50<2:14:31,  2.21s/it]                                                       {'loss': 1.7653, 'learning_rate': 0.00022957144467943054, 'epoch': 0.46}
+ 46%|████▌     | 3126/6779 [1:55:50<2:14:31,  2.21s/it] 46%|████▌     | 3127/6779 [1:55:52<2:17:09,  2.25s/it]                                                       {'loss': 1.6865, 'learning_rate': 0.00022947840165955875, 'epoch': 0.46}
+ 46%|████▌     | 3127/6779 [1:55:52<2:17:09,  2.25s/it] 46%|████▌     | 3128/6779 [1:55:54<2:16:59,  2.25s/it]                                                       {'loss': 1.728, 'learning_rate': 0.0002293853521176871, 'epoch': 0.46}
+ 46%|████▌     | 3128/6779 [1:55:54<2:16:59,  2.25s/it] 46%|████▌     | 3129/6779 [1:55:57<2:18:41,  2.28s/it]                                                       {'loss': 1.484, 'learning_rate': 0.00022929229607440257, 'epoch': 0.46}
+ 46%|████▌     | 3129/6779 [1:55:57<2:18:41,  2.28s/it] 46%|████▌     | 3130/6779 [1:55:59<2:16:31,  2.24s/it]                                                       {'loss': 1.8072, 'learning_rate': 0.00022919923355029344, 'epoch': 0.46}
+ 46%|████▌     | 3130/6779 [1:55:59<2:16:31,  2.24s/it] 46%|████▌     | 3131/6779 [1:56:01<2:16:15,  2.24s/it]                                                       {'loss': 1.6094, 'learning_rate': 0.00022910616456594954, 'epoch': 0.46}
+ 46%|████▌     | 3131/6779 [1:56:01<2:16:15,  2.24s/it] 46%|████▌     | 3132/6779 [1:56:03<2:16:03,  2.24s/it]                                                       {'loss': 1.6731, 'learning_rate': 0.000229013089141962, 'epoch': 0.46}
+ 46%|████▌     | 3132/6779 [1:56:03<2:16:03,  2.24s/it] 46%|████▌     | 3133/6779 [1:56:05<2:14:08,  2.21s/it]                                                       {'loss': 1.5124, 'learning_rate': 0.0002289200072989236, 'epoch': 0.46}
+ 46%|████▌     | 3133/6779 [1:56:05<2:14:08,  2.21s/it] 46%|████▌     | 3134/6779 [1:56:08<2:15:02,  2.22s/it]                                                       {'loss': 1.707, 'learning_rate': 0.00022882691905742823, 'epoch': 0.46}
+ 46%|████▌     | 3134/6779 [1:56:08<2:15:02,  2.22s/it] 46%|████▌     | 3135/6779 [1:56:10<2:15:04,  2.22s/it]                                                       {'loss': 1.8078, 'learning_rate': 0.0002287338244380715, 'epoch': 0.46}
+ 46%|████▌     | 3135/6779 [1:56:10<2:15:04,  2.22s/it] 46%|████▋     | 3136/6779 [1:56:12<2:13:00,  2.19s/it]                                                       {'loss': 1.6673, 'learning_rate': 0.00022864072346145018, 'epoch': 0.46}
+ 46%|████▋     | 3136/6779 [1:56:12<2:13:00,  2.19s/it] 46%|████▋     | 3137/6779 [1:56:14<2:10:48,  2.16s/it]                                                       {'loss': 1.6621, 'learning_rate': 0.0002285476161481626, 'epoch': 0.46}
+ 46%|████▋     | 3137/6779 [1:56:14<2:10:48,  2.16s/it] 46%|████▋     | 3138/6779 [1:56:17<2:22:18,  2.34s/it]                                                       {'loss': 1.6811, 'learning_rate': 0.00022845450251880847, 'epoch': 0.46}
+ 46%|████▋     | 3138/6779 [1:56:17<2:22:18,  2.34s/it] 46%|████▋     | 3139/6779 [1:56:19<2:19:51,  2.31s/it]                                                       {'loss': 1.4991, 'learning_rate': 0.0002283613825939888, 'epoch': 0.46}
+ 46%|████▋     | 3139/6779 [1:56:19<2:19:51,  2.31s/it] 46%|████▋     | 3140/6779 [1:56:21<2:20:52,  2.32s/it]                                                       {'loss': 1.9231, 'learning_rate': 0.00022826825639430615, 'epoch': 0.46}
+ 46%|████▋     | 3140/6779 [1:56:21<2:20:52,  2.32s/it] 46%|████▋     | 3141/6779 [1:56:24<2:20:33,  2.32s/it]                                                       {'loss': 1.7073, 'learning_rate': 0.00022817512394036435, 'epoch': 0.46}
+ 46%|████▋     | 3141/6779 [1:56:24<2:20:33,  2.32s/it] 46%|████▋     | 3142/6779 [1:56:26<2:16:26,  2.25s/it]                                                       {'loss': 1.6747, 'learning_rate': 0.00022808198525276868, 'epoch': 0.46}
+ 46%|████▋     | 3142/6779 [1:56:26<2:16:26,  2.25s/it] 46%|████▋     | 3143/6779 [1:56:28<2:21:25,  2.33s/it]                                                       {'loss': 1.7034, 'learning_rate': 0.0002279888403521257, 'epoch': 0.46}
+ 46%|████▋     | 3143/6779 [1:56:28<2:21:25,  2.33s/it] 46%|████▋     | 3144/6779 [1:56:30<2:16:33,  2.25s/it]                                                       {'loss': 1.7265, 'learning_rate': 0.0002278956892590435, 'epoch': 0.46}
+ 46%|████▋     | 3144/6779 [1:56:30<2:16:33,  2.25s/it] 46%|████▋     | 3145/6779 [1:56:33<2:14:22,  2.22s/it]                                                       {'loss': 1.5085, 'learning_rate': 0.00022780253199413143, 'epoch': 0.46}
+ 46%|████▋     | 3145/6779 [1:56:33<2:14:22,  2.22s/it] 46%|████▋     | 3146/6779 [1:56:35<2:12:27,  2.19s/it]                                                       {'loss': 1.756, 'learning_rate': 0.00022770936857800016, 'epoch': 0.46}
+ 46%|████▋     | 3146/6779 [1:56:35<2:12:27,  2.19s/it] 46%|████▋     | 3147/6779 [1:56:37<2:17:08,  2.27s/it]                                                       {'loss': 1.7181, 'learning_rate': 0.0002276161990312619, 'epoch': 0.46}
+ 46%|████▋     | 3147/6779 [1:56:37<2:17:08,  2.27s/it] 46%|████▋     | 3148/6779 [1:56:39<2:15:23,  2.24s/it]                                                       {'loss': 1.7245, 'learning_rate': 0.00022752302337452997, 'epoch': 0.46}
+ 46%|████▋     | 3148/6779 [1:56:39<2:15:23,  2.24s/it] 46%|████▋     | 3149/6779 [1:56:42<2:14:22,  2.22s/it]                                                       {'loss': 1.6319, 'learning_rate': 0.00022742984162841935, 'epoch': 0.46}
+ 46%|████▋     | 3149/6779 [1:56:42<2:14:22,  2.22s/it] 46%|████▋     | 3150/6779 [1:56:44<2:13:50,  2.21s/it]                                                       {'loss': 1.8226, 'learning_rate': 0.00022733665381354605, 'epoch': 0.46}
+ 46%|████▋     | 3150/6779 [1:56:44<2:13:50,  2.21s/it] 46%|████▋     | 3151/6779 [1:56:46<2:12:33,  2.19s/it]                                                       {'loss': 1.6824, 'learning_rate': 0.00022724345995052766, 'epoch': 0.46}
+ 46%|████▋     | 3151/6779 [1:56:46<2:12:33,  2.19s/it] 46%|████▋     | 3152/6779 [1:56:48<2:12:09,  2.19s/it]                                                       {'loss': 1.834, 'learning_rate': 0.00022715026005998298, 'epoch': 0.46}
+ 46%|████▋     | 3152/6779 [1:56:48<2:12:09,  2.19s/it] 47%|████▋     | 3153/6779 [1:56:50<2:11:58,  2.18s/it]                                                       {'loss': 1.6936, 'learning_rate': 0.00022705705416253214, 'epoch': 0.47}
+ 47%|████▋     | 3153/6779 [1:56:50<2:11:58,  2.18s/it] 47%|████▋     | 3154/6779 [1:56:52<2:13:04,  2.20s/it]                                                       {'loss': 1.7356, 'learning_rate': 0.0002269638422787967, 'epoch': 0.47}
+ 47%|████▋     | 3154/6779 [1:56:52<2:13:04,  2.20s/it] 47%|████▋     | 3155/6779 [1:56:55<2:13:20,  2.21s/it]                                                       {'loss': 1.7292, 'learning_rate': 0.00022687062442939952, 'epoch': 0.47}
+ 47%|████▋     | 3155/6779 [1:56:55<2:13:20,  2.21s/it] 47%|████▋     | 3156/6779 [1:56:57<2:15:07,  2.24s/it]                                                       {'loss': 1.7855, 'learning_rate': 0.00022677740063496463, 'epoch': 0.47}
+ 47%|████▋     | 3156/6779 [1:56:57<2:15:07,  2.24s/it] 47%|████▋     | 3157/6779 [1:57:02<2:56:26,  2.92s/it]                                                       {'loss': 1.7303, 'learning_rate': 0.00022668417091611755, 'epoch': 0.47}
+ 47%|████▋     | 3157/6779 [1:57:02<2:56:26,  2.92s/it] 47%|████▋     | 3158/6779 [1:57:04<2:45:14,  2.74s/it]                                                       {'loss': 1.6391, 'learning_rate': 0.00022659093529348514, 'epoch': 0.47}
+ 47%|████▋     | 3158/6779 [1:57:04<2:45:14,  2.74s/it] 47%|████▋     | 3159/6779 [1:57:06<2:38:46,  2.63s/it]                                                       {'loss': 1.821, 'learning_rate': 0.00022649769378769535, 'epoch': 0.47}
+ 47%|████▋     | 3159/6779 [1:57:06<2:38:46,  2.63s/it] 47%|████▋     | 3160/6779 [1:57:09<2:32:44,  2.53s/it]                                                       {'loss': 1.5838, 'learning_rate': 0.0002264044464193775, 'epoch': 0.47}
+ 47%|████▋     | 3160/6779 [1:57:09<2:32:44,  2.53s/it] 47%|████▋     | 3161/6779 [1:57:11<2:30:57,  2.50s/it]                                                       {'loss': 1.7204, 'learning_rate': 0.00022631119320916244, 'epoch': 0.47}
+ 47%|████▋     | 3161/6779 [1:57:11<2:30:57,  2.50s/it] 47%|████▋     | 3162/6779 [1:57:13<2:24:50,  2.40s/it]                                                       {'loss': 1.6204, 'learning_rate': 0.00022621793417768203, 'epoch': 0.47}
+ 47%|████▋     | 3162/6779 [1:57:13<2:24:50,  2.40s/it] 47%|████▋     | 3163/6779 [1:57:15<2:22:16,  2.36s/it]                                                       {'loss': 1.7564, 'learning_rate': 0.00022612466934556955, 'epoch': 0.47}
+ 47%|████▋     | 3163/6779 [1:57:15<2:22:16,  2.36s/it] 47%|████▋     | 3164/6779 [1:57:18<2:20:51,  2.34s/it]                                                       {'loss': 1.8335, 'learning_rate': 0.00022603139873345954, 'epoch': 0.47}
+ 47%|████▋     | 3164/6779 [1:57:18<2:20:51,  2.34s/it] 47%|████▋     | 3165/6779 [1:57:20<2:17:14,  2.28s/it]                                                       {'loss': 1.7046, 'learning_rate': 0.0002259381223619878, 'epoch': 0.47}
+ 47%|████▋     | 3165/6779 [1:57:20<2:17:14,  2.28s/it] 47%|████▋     | 3166/6779 [1:57:22<2:14:31,  2.23s/it]                                                       {'loss': 1.8118, 'learning_rate': 0.00022584484025179157, 'epoch': 0.47}
+ 47%|████▋     | 3166/6779 [1:57:22<2:14:31,  2.23s/it] 47%|████▋     | 3167/6779 [1:57:24<2:11:41,  2.19s/it]                                                       {'loss': 1.7618, 'learning_rate': 0.0002257515524235089, 'epoch': 0.47}
+ 47%|████▋     | 3167/6779 [1:57:24<2:11:41,  2.19s/it] 47%|████▋     | 3168/6779 [1:57:26<2:12:36,  2.20s/it]                                                       {'loss': 1.7354, 'learning_rate': 0.0002256582588977797, 'epoch': 0.47}
+ 47%|████▋     | 3168/6779 [1:57:26<2:12:36,  2.20s/it] 47%|████▋     | 3169/6779 [1:57:28<2:09:48,  2.16s/it]                                                       {'loss': 1.6922, 'learning_rate': 0.00022556495969524473, 'epoch': 0.47}
+ 47%|████▋     | 3169/6779 [1:57:28<2:09:48,  2.16s/it] 47%|████▋     | 3170/6779 [1:57:30<2:06:11,  2.10s/it]                                                       {'loss': 1.5742, 'learning_rate': 0.00022547165483654616, 'epoch': 0.47}
+ 47%|████▋     | 3170/6779 [1:57:30<2:06:11,  2.10s/it] 47%|████▋     | 3171/6779 [1:57:33<2:10:56,  2.18s/it]                                                       {'loss': 1.6958, 'learning_rate': 0.00022537834434232737, 'epoch': 0.47}
+ 47%|████▋     | 3171/6779 [1:57:33<2:10:56,  2.18s/it] 47%|████▋     | 3172/6779 [1:57:35<2:13:17,  2.22s/it]                                                       {'loss': 1.7964, 'learning_rate': 0.000225285028233233, 'epoch': 0.47}
+ 47%|████▋     | 3172/6779 [1:57:35<2:13:17,  2.22s/it] 47%|████▋     | 3173/6779 [1:57:39<2:42:27,  2.70s/it]                                                       {'loss': 1.6459, 'learning_rate': 0.00022519170652990895, 'epoch': 0.47}
+ 47%|████▋     | 3173/6779 [1:57:39<2:42:27,  2.70s/it] 47%|████▋     | 3174/6779 [1:57:41<2:33:21,  2.55s/it]                                                       {'loss': 1.7237, 'learning_rate': 0.00022509837925300237, 'epoch': 0.47}
+ 47%|████▋     | 3174/6779 [1:57:41<2:33:21,  2.55s/it] 47%|████▋     | 3175/6779 [1:57:43<2:23:08,  2.38s/it]                                                       {'loss': 1.5525, 'learning_rate': 0.00022500504642316158, 'epoch': 0.47}
+ 47%|████▋     | 3175/6779 [1:57:43<2:23:08,  2.38s/it] 47%|████▋     | 3176/6779 [1:57:45<2:20:11,  2.33s/it]                                                       {'loss': 1.8376, 'learning_rate': 0.00022491170806103616, 'epoch': 0.47}
+ 47%|████▋     | 3176/6779 [1:57:45<2:20:11,  2.33s/it] 47%|████▋     | 3177/6779 [1:57:47<2:17:59,  2.30s/it]                                                       {'loss': 1.6625, 'learning_rate': 0.00022481836418727694, 'epoch': 0.47}
+ 47%|████▋     | 3177/6779 [1:57:47<2:17:59,  2.30s/it] 47%|████▋     | 3178/6779 [1:57:50<2:15:05,  2.25s/it]                                                       {'loss': 1.5604, 'learning_rate': 0.00022472501482253586, 'epoch': 0.47}
+ 47%|████▋     | 3178/6779 [1:57:50<2:15:05,  2.25s/it] 47%|████▋     | 3179/6779 [1:57:52<2:14:31,  2.24s/it]                                                       {'loss': 1.7171, 'learning_rate': 0.00022463165998746622, 'epoch': 0.47}
+ 47%|████▋     | 3179/6779 [1:57:52<2:14:31,  2.24s/it] 47%|████▋     | 3180/6779 [1:57:54<2:13:04,  2.22s/it]                                                       {'loss': 1.7824, 'learning_rate': 0.00022453829970272256, 'epoch': 0.47}
+ 47%|████▋     | 3180/6779 [1:57:54<2:13:04,  2.22s/it] 47%|████▋     | 3181/6779 [1:57:56<2:09:14,  2.16s/it]                                                       {'loss': 1.6846, 'learning_rate': 0.00022444493398896044, 'epoch': 0.47}
+ 47%|████▋     | 3181/6779 [1:57:56<2:09:14,  2.16s/it] 47%|████▋     | 3182/6779 [1:57:58<2:09:56,  2.17s/it]                                                       {'loss': 1.829, 'learning_rate': 0.0002243515628668367, 'epoch': 0.47}
+ 47%|████▋     | 3182/6779 [1:57:58<2:09:56,  2.17s/it] 47%|████▋     | 3183/6779 [1:58:00<2:10:58,  2.19s/it]                                                       {'loss': 1.768, 'learning_rate': 0.00022425818635700946, 'epoch': 0.47}
+ 47%|████▋     | 3183/6779 [1:58:00<2:10:58,  2.19s/it] 47%|████▋     | 3184/6779 [1:58:03<2:11:38,  2.20s/it]                                                       {'loss': 1.726, 'learning_rate': 0.00022416480448013797, 'epoch': 0.47}
+ 47%|████▋     | 3184/6779 [1:58:03<2:11:38,  2.20s/it] 47%|████▋     | 3185/6779 [1:58:05<2:09:01,  2.15s/it]                                                       {'loss': 1.8591, 'learning_rate': 0.00022407141725688253, 'epoch': 0.47}
+ 47%|████▋     | 3185/6779 [1:58:05<2:09:01,  2.15s/it] 47%|████▋     | 3186/6779 [1:58:07<2:05:32,  2.10s/it]                                                       {'loss': 1.5829, 'learning_rate': 0.00022397802470790494, 'epoch': 0.47}
+ 47%|████▋     | 3186/6779 [1:58:07<2:05:32,  2.10s/it] 47%|████▋     | 3187/6779 [1:58:09<2:06:20,  2.11s/it]                                                       {'loss': 1.6777, 'learning_rate': 0.0002238846268538679, 'epoch': 0.47}
+ 47%|████▋     | 3187/6779 [1:58:09<2:06:20,  2.11s/it] 47%|████▋     | 3188/6779 [1:58:11<2:04:34,  2.08s/it]                                                       {'loss': 1.4076, 'learning_rate': 0.0002237912237154354, 'epoch': 0.47}
+ 47%|████▋     | 3188/6779 [1:58:11<2:04:34,  2.08s/it] 47%|████▋     | 3189/6779 [1:58:13<2:05:08,  2.09s/it]                                                       {'loss': 1.5806, 'learning_rate': 0.0002236978153132726, 'epoch': 0.47}
+ 47%|████▋     | 3189/6779 [1:58:13<2:05:08,  2.09s/it] 47%|████▋     | 3190/6779 [1:58:15<2:09:55,  2.17s/it]                                                       {'loss': 1.7147, 'learning_rate': 0.00022360440166804572, 'epoch': 0.47}
+ 47%|████▋     | 3190/6779 [1:58:15<2:09:55,  2.17s/it] 47%|████▋     | 3191/6779 [1:58:17<2:10:41,  2.19s/it]                                                       {'loss': 1.8509, 'learning_rate': 0.0002235109828004223, 'epoch': 0.47}
+ 47%|████▋     | 3191/6779 [1:58:17<2:10:41,  2.19s/it] 47%|████▋     | 3192/6779 [1:58:20<2:09:51,  2.17s/it]                                                       {'loss': 1.7139, 'learning_rate': 0.0002234175587310709, 'epoch': 0.47}
+ 47%|████▋     | 3192/6779 [1:58:20<2:09:51,  2.17s/it] 47%|████▋     | 3193/6779 [1:58:22<2:06:53,  2.12s/it]                                                       {'loss': 1.4825, 'learning_rate': 0.0002233241294806614, 'epoch': 0.47}
+ 47%|████▋     | 3193/6779 [1:58:22<2:06:53,  2.12s/it] 47%|████▋     | 3194/6779 [1:58:24<2:06:32,  2.12s/it]                                                       {'loss': 1.6974, 'learning_rate': 0.0002232306950698646, 'epoch': 0.47}
+ 47%|████▋     | 3194/6779 [1:58:24<2:06:32,  2.12s/it] 47%|████▋     | 3195/6779 [1:58:26<2:05:55,  2.11s/it]                                                       {'loss': 1.6684, 'learning_rate': 0.00022313725551935263, 'epoch': 0.47}
+ 47%|████▋     | 3195/6779 [1:58:26<2:05:55,  2.11s/it] 47%|████▋     | 3196/6779 [1:58:28<2:12:21,  2.22s/it]                                                       {'loss': 1.9226, 'learning_rate': 0.00022304381084979863, 'epoch': 0.47}
+ 47%|████▋     | 3196/6779 [1:58:28<2:12:21,  2.22s/it] 47%|████▋     | 3197/6779 [1:58:30<2:12:51,  2.23s/it]                                                       {'loss': 1.7622, 'learning_rate': 0.00022295036108187693, 'epoch': 0.47}
+ 47%|████▋     | 3197/6779 [1:58:31<2:12:51,  2.23s/it] 47%|████▋     | 3198/6779 [1:58:33<2:11:25,  2.20s/it]                                                       {'loss': 1.7618, 'learning_rate': 0.0002228569062362631, 'epoch': 0.47}
+ 47%|████▋     | 3198/6779 [1:58:33<2:11:25,  2.20s/it] 47%|████▋     | 3199/6779 [1:58:35<2:11:42,  2.21s/it]                                                       {'loss': 1.6022, 'learning_rate': 0.00022276344633363353, 'epoch': 0.47}
+ 47%|████▋     | 3199/6779 [1:58:35<2:11:42,  2.21s/it] 47%|████▋     | 3200/6779 [1:58:37<2:08:59,  2.16s/it]                                                       {'loss': 1.6631, 'learning_rate': 0.00022266998139466605, 'epoch': 0.47}
+ 47%|████▋     | 3200/6779 [1:58:37<2:08:59,  2.16s/it] 47%|████▋     | 3201/6779 [1:58:39<2:09:20,  2.17s/it]                                                       {'loss': 1.4355, 'learning_rate': 0.00022257651144003943, 'epoch': 0.47}
+ 47%|████▋     | 3201/6779 [1:58:39<2:09:20,  2.17s/it] 47%|████▋     | 3202/6779 [1:58:41<2:07:11,  2.13s/it]                                                       {'loss': 1.7194, 'learning_rate': 0.0002224830364904336, 'epoch': 0.47}
+ 47%|████▋     | 3202/6779 [1:58:41<2:07:11,  2.13s/it] 47%|████▋     | 3203/6779 [1:58:43<2:08:39,  2.16s/it]                                                       {'loss': 1.8016, 'learning_rate': 0.00022238955656652955, 'epoch': 0.47}
+ 47%|████▋     | 3203/6779 [1:58:43<2:08:39,  2.16s/it] 47%|████▋     | 3204/6779 [1:58:46<2:09:24,  2.17s/it]                                                       {'loss': 1.7554, 'learning_rate': 0.00022229607168900947, 'epoch': 0.47}
+ 47%|████▋     | 3204/6779 [1:58:46<2:09:24,  2.17s/it] 47%|████▋     | 3205/6779 [1:58:48<2:08:03,  2.15s/it]                                                       {'loss': 1.6032, 'learning_rate': 0.00022220258187855653, 'epoch': 0.47}
+ 47%|████▋     | 3205/6779 [1:58:48<2:08:03,  2.15s/it] 47%|████▋     | 3206/6779 [1:58:50<2:15:21,  2.27s/it]                                                       {'loss': 1.6488, 'learning_rate': 0.0002221090871558551, 'epoch': 0.47}
+ 47%|████▋     | 3206/6779 [1:58:50<2:15:21,  2.27s/it] 47%|████▋     | 3207/6779 [1:58:52<2:14:19,  2.26s/it]                                                       {'loss': 1.756, 'learning_rate': 0.00022201558754159054, 'epoch': 0.47}
+ 47%|████▋     | 3207/6779 [1:58:52<2:14:19,  2.26s/it] 47%|████▋     | 3208/6779 [1:58:55<2:11:54,  2.22s/it]                                                       {'loss': 1.5507, 'learning_rate': 0.00022192208305644933, 'epoch': 0.47}
+ 47%|████▋     | 3208/6779 [1:58:55<2:11:54,  2.22s/it] 47%|████▋     | 3209/6779 [1:58:57<2:09:36,  2.18s/it]                                                       {'loss': 1.7864, 'learning_rate': 0.00022182857372111904, 'epoch': 0.47}
+ 47%|████▋     | 3209/6779 [1:58:57<2:09:36,  2.18s/it] 47%|████▋     | 3210/6779 [1:58:59<2:11:24,  2.21s/it]                                                       {'loss': 1.6181, 'learning_rate': 0.0002217350595562883, 'epoch': 0.47}
+ 47%|████▋     | 3210/6779 [1:58:59<2:11:24,  2.21s/it] 47%|████▋     | 3211/6779 [1:59:01<2:12:25,  2.23s/it]                                                       {'loss': 1.5972, 'learning_rate': 0.0002216415405826468, 'epoch': 0.47}
+ 47%|████▋     | 3211/6779 [1:59:01<2:12:25,  2.23s/it] 47%|████▋     | 3212/6779 [1:59:03<2:12:20,  2.23s/it]                                                       {'loss': 1.6684, 'learning_rate': 0.00022154801682088538, 'epoch': 0.47}
+ 47%|████▋     | 3212/6779 [1:59:03<2:12:20,  2.23s/it] 47%|████▋     | 3213/6779 [1:59:06<2:12:09,  2.22s/it]                                                       {'loss': 1.7442, 'learning_rate': 0.00022145448829169578, 'epoch': 0.47}
+ 47%|████▋     | 3213/6779 [1:59:06<2:12:09,  2.22s/it] 47%|████▋     | 3214/6779 [1:59:08<2:14:36,  2.27s/it]                                                       {'loss': 1.7334, 'learning_rate': 0.00022136095501577093, 'epoch': 0.47}
+ 47%|████▋     | 3214/6779 [1:59:08<2:14:36,  2.27s/it] 47%|████▋     | 3215/6779 [1:59:10<2:14:25,  2.26s/it]                                                       {'loss': 1.6647, 'learning_rate': 0.00022126741701380476, 'epoch': 0.47}
+ 47%|████▋     | 3215/6779 [1:59:10<2:14:25,  2.26s/it] 47%|████▋     | 3216/6779 [1:59:13<2:14:23,  2.26s/it]                                                       {'loss': 1.7365, 'learning_rate': 0.0002211738743064922, 'epoch': 0.47}
+ 47%|████▋     | 3216/6779 [1:59:13<2:14:23,  2.26s/it] 47%|████▋     | 3217/6779 [1:59:15<2:11:18,  2.21s/it]                                                       {'loss': 1.7141, 'learning_rate': 0.00022108032691452927, 'epoch': 0.47}
+ 47%|████▋     | 3217/6779 [1:59:15<2:11:18,  2.21s/it] 47%|████▋     | 3218/6779 [1:59:17<2:10:56,  2.21s/it]                                                       {'loss': 1.6552, 'learning_rate': 0.0002209867748586131, 'epoch': 0.47}
+ 47%|████▋     | 3218/6779 [1:59:17<2:10:56,  2.21s/it] 47%|████▋     | 3219/6779 [1:59:19<2:11:45,  2.22s/it]                                                       {'loss': 1.7033, 'learning_rate': 0.00022089321815944168, 'epoch': 0.47}
+ 47%|████▋     | 3219/6779 [1:59:19<2:11:45,  2.22s/it] 47%|████▋     | 3220/6779 [1:59:21<2:13:05,  2.24s/it]                                                       {'loss': 1.6874, 'learning_rate': 0.00022079965683771425, 'epoch': 0.47}
+ 47%|████▋     | 3220/6779 [1:59:21<2:13:05,  2.24s/it] 48%|████▊     | 3221/6779 [1:59:23<2:10:27,  2.20s/it]                                                       {'loss': 1.7712, 'learning_rate': 0.00022070609091413078, 'epoch': 0.48}
+ 48%|████▊     | 3221/6779 [1:59:23<2:10:27,  2.20s/it] 48%|████▊     | 3222/6779 [1:59:25<2:07:16,  2.15s/it]                                                       {'loss': 1.6608, 'learning_rate': 0.0002206125204093926, 'epoch': 0.48}
+ 48%|████▊     | 3222/6779 [1:59:26<2:07:16,  2.15s/it] 48%|████▊     | 3223/6779 [1:59:28<2:07:34,  2.15s/it]                                                       {'loss': 1.8063, 'learning_rate': 0.00022051894534420171, 'epoch': 0.48}
+ 48%|████▊     | 3223/6779 [1:59:28<2:07:34,  2.15s/it] 48%|████▊     | 3224/6779 [1:59:30<2:06:20,  2.13s/it]                                                       {'loss': 1.7491, 'learning_rate': 0.0002204253657392614, 'epoch': 0.48}
+ 48%|████▊     | 3224/6779 [1:59:30<2:06:20,  2.13s/it] 48%|████▊     | 3225/6779 [1:59:32<2:09:39,  2.19s/it]                                                       {'loss': 1.6207, 'learning_rate': 0.0002203317816152758, 'epoch': 0.48}
+ 48%|████▊     | 3225/6779 [1:59:32<2:09:39,  2.19s/it] 48%|████▊     | 3226/6779 [1:59:34<2:10:23,  2.20s/it]                                                       {'loss': 1.7538, 'learning_rate': 0.00022023819299295009, 'epoch': 0.48}
+ 48%|████▊     | 3226/6779 [1:59:34<2:10:23,  2.20s/it] 48%|████▊     | 3227/6779 [1:59:36<2:08:52,  2.18s/it]                                                       {'loss': 1.755, 'learning_rate': 0.00022014459989299053, 'epoch': 0.48}
+ 48%|████▊     | 3227/6779 [1:59:36<2:08:52,  2.18s/it] 48%|████▊     | 3228/6779 [1:59:39<2:17:35,  2.32s/it]                                                       {'loss': 1.7419, 'learning_rate': 0.00022005100233610415, 'epoch': 0.48}
+ 48%|████▊     | 3228/6779 [1:59:39<2:17:35,  2.32s/it] 48%|████▊     | 3229/6779 [1:59:41<2:12:28,  2.24s/it]                                                       {'loss': 1.6211, 'learning_rate': 0.00021995740034299927, 'epoch': 0.48}
+ 48%|████▊     | 3229/6779 [1:59:41<2:12:28,  2.24s/it] 48%|████▊     | 3230/6779 [1:59:43<2:11:34,  2.22s/it]                                                       {'loss': 1.6727, 'learning_rate': 0.00021986379393438483, 'epoch': 0.48}
+ 48%|████▊     | 3230/6779 [1:59:43<2:11:34,  2.22s/it] 48%|████▊     | 3231/6779 [1:59:45<2:09:20,  2.19s/it]                                                       {'loss': 1.7619, 'learning_rate': 0.00021977018313097105, 'epoch': 0.48}
+ 48%|████▊     | 3231/6779 [1:59:45<2:09:20,  2.19s/it] 48%|████▊     | 3232/6779 [1:59:48<2:08:27,  2.17s/it]                                                       {'loss': 1.7171, 'learning_rate': 0.00021967656795346906, 'epoch': 0.48}
+ 48%|████▊     | 3232/6779 [1:59:48<2:08:27,  2.17s/it] 48%|████▊     | 3233/6779 [1:59:50<2:11:40,  2.23s/it]                                                       {'loss': 1.8272, 'learning_rate': 0.00021958294842259083, 'epoch': 0.48}
+ 48%|████▊     | 3233/6779 [1:59:50<2:11:40,  2.23s/it] 48%|████▊     | 3234/6779 [1:59:52<2:14:27,  2.28s/it]                                                       {'loss': 1.6087, 'learning_rate': 0.00021948932455904938, 'epoch': 0.48}
+ 48%|████▊     | 3234/6779 [1:59:52<2:14:27,  2.28s/it] 48%|████▊     | 3235/6779 [1:59:55<2:15:47,  2.30s/it]                                                       {'loss': 1.7038, 'learning_rate': 0.00021939569638355867, 'epoch': 0.48}
+ 48%|████▊     | 3235/6779 [1:59:55<2:15:47,  2.30s/it] 48%|████▊     | 3236/6779 [1:59:57<2:20:49,  2.38s/it]                                                       {'loss': 1.5868, 'learning_rate': 0.00021930206391683374, 'epoch': 0.48}
+ 48%|████▊     | 3236/6779 [1:59:57<2:20:49,  2.38s/it] 48%|████▊     | 3237/6779 [1:59:59<2:14:45,  2.28s/it]                                                       {'loss': 1.7569, 'learning_rate': 0.00021920842717959032, 'epoch': 0.48}
+ 48%|████▊     | 3237/6779 [1:59:59<2:14:45,  2.28s/it] 48%|████▊     | 3238/6779 [2:00:01<2:12:30,  2.25s/it]                                                       {'loss': 1.7808, 'learning_rate': 0.00021911478619254533, 'epoch': 0.48}
+ 48%|████▊     | 3238/6779 [2:00:01<2:12:30,  2.25s/it] 48%|████▊     | 3239/6779 [2:00:04<2:11:55,  2.24s/it]                                                       {'loss': 1.7347, 'learning_rate': 0.0002190211409764165, 'epoch': 0.48}
+ 48%|████▊     | 3239/6779 [2:00:04<2:11:55,  2.24s/it] 48%|████▊     | 3240/6779 [2:00:06<2:22:27,  2.42s/it]                                                       {'loss': 1.7298, 'learning_rate': 0.0002189274915519225, 'epoch': 0.48}
+ 48%|████▊     | 3240/6779 [2:00:07<2:22:27,  2.42s/it] 48%|████▊     | 3241/6779 [2:00:09<2:16:58,  2.32s/it]                                                       {'loss': 1.5793, 'learning_rate': 0.00021883383793978305, 'epoch': 0.48}
+ 48%|████▊     | 3241/6779 [2:00:09<2:16:58,  2.32s/it] 48%|████▊     | 3242/6779 [2:00:11<2:17:16,  2.33s/it]                                                       {'loss': 1.4935, 'learning_rate': 0.00021874018016071855, 'epoch': 0.48}
+ 48%|████▊     | 3242/6779 [2:00:11<2:17:16,  2.33s/it] 48%|████▊     | 3243/6779 [2:00:13<2:16:29,  2.32s/it]                                                       {'loss': 1.7904, 'learning_rate': 0.00021864651823545064, 'epoch': 0.48}
+ 48%|████▊     | 3243/6779 [2:00:13<2:16:29,  2.32s/it] 48%|████▊     | 3244/6779 [2:00:15<2:13:13,  2.26s/it]                                                       {'loss': 1.8212, 'learning_rate': 0.0002185528521847016, 'epoch': 0.48}
+ 48%|████▊     | 3244/6779 [2:00:15<2:13:13,  2.26s/it] 48%|████▊     | 3245/6779 [2:00:18<2:20:08,  2.38s/it]                                                       {'loss': 1.8791, 'learning_rate': 0.0002184591820291948, 'epoch': 0.48}
+ 48%|████▊     | 3245/6779 [2:00:18<2:20:08,  2.38s/it] 48%|████▊     | 3246/6779 [2:00:20<2:16:37,  2.32s/it]                                                       {'loss': 1.6778, 'learning_rate': 0.00021836550778965444, 'epoch': 0.48}
+ 48%|████▊     | 3246/6779 [2:00:20<2:16:37,  2.32s/it] 48%|████▊     | 3247/6779 [2:00:23<2:16:47,  2.32s/it]                                                       {'loss': 1.8432, 'learning_rate': 0.00021827182948680563, 'epoch': 0.48}
+ 48%|████▊     | 3247/6779 [2:00:23<2:16:47,  2.32s/it] 48%|████▊     | 3248/6779 [2:00:25<2:16:10,  2.31s/it]                                                       {'loss': 1.7233, 'learning_rate': 0.00021817814714137436, 'epoch': 0.48}
+ 48%|████▊     | 3248/6779 [2:00:25<2:16:10,  2.31s/it] 48%|████▊     | 3249/6779 [2:00:27<2:19:41,  2.37s/it]                                                       {'loss': 1.7158, 'learning_rate': 0.00021808446077408754, 'epoch': 0.48}
+ 48%|████▊     | 3249/6779 [2:00:27<2:19:41,  2.37s/it] 48%|████▊     | 3250/6779 [2:00:29<2:15:23,  2.30s/it]                                                       {'loss': 1.8415, 'learning_rate': 0.00021799077040567309, 'epoch': 0.48}
+ 48%|████▊     | 3250/6779 [2:00:29<2:15:23,  2.30s/it] 48%|████▊     | 3251/6779 [2:00:32<2:16:20,  2.32s/it]                                                       {'loss': 1.7218, 'learning_rate': 0.00021789707605685953, 'epoch': 0.48}
+ 48%|████▊     | 3251/6779 [2:00:32<2:16:20,  2.32s/it] 48%|████▊     | 3252/6779 [2:00:34<2:14:07,  2.28s/it]                                                       {'loss': 1.691, 'learning_rate': 0.00021780337774837655, 'epoch': 0.48}
+ 48%|████▊     | 3252/6779 [2:00:34<2:14:07,  2.28s/it] 48%|████▊     | 3253/6779 [2:00:36<2:10:18,  2.22s/it]                                                       {'loss': 1.6185, 'learning_rate': 0.00021770967550095458, 'epoch': 0.48}
+ 48%|████▊     | 3253/6779 [2:00:36<2:10:18,  2.22s/it] 48%|████▊     | 3254/6779 [2:00:38<2:09:10,  2.20s/it]                                                       {'loss': 1.7934, 'learning_rate': 0.0002176159693353249, 'epoch': 0.48}
+ 48%|████▊     | 3254/6779 [2:00:38<2:09:10,  2.20s/it] 48%|████▊     | 3255/6779 [2:00:40<2:06:15,  2.15s/it]                                                       {'loss': 1.7119, 'learning_rate': 0.00021752225927221966, 'epoch': 0.48}
+ 48%|████▊     | 3255/6779 [2:00:40<2:06:15,  2.15s/it] 48%|████▊     | 3256/6779 [2:00:42<2:05:14,  2.13s/it]                                                       {'loss': 1.8139, 'learning_rate': 0.00021742854533237193, 'epoch': 0.48}
+ 48%|████▊     | 3256/6779 [2:00:42<2:05:14,  2.13s/it] 48%|████▊     | 3257/6779 [2:00:45<2:11:33,  2.24s/it]                                                       {'loss': 1.7075, 'learning_rate': 0.00021733482753651568, 'epoch': 0.48}
+ 48%|████▊     | 3257/6779 [2:00:45<2:11:33,  2.24s/it] 48%|████▊     | 3258/6779 [2:00:47<2:10:20,  2.22s/it]                                                       {'loss': 1.7502, 'learning_rate': 0.0002172411059053856, 'epoch': 0.48}
+ 48%|████▊     | 3258/6779 [2:00:47<2:10:20,  2.22s/it] 48%|████▊     | 3259/6779 [2:00:49<2:08:26,  2.19s/it]                                                       {'loss': 1.6778, 'learning_rate': 0.00021714738045971722, 'epoch': 0.48}
+ 48%|████▊     | 3259/6779 [2:00:49<2:08:26,  2.19s/it] 48%|████▊     | 3260/6779 [2:00:51<2:07:28,  2.17s/it]                                                       {'loss': 1.5608, 'learning_rate': 0.00021705365122024723, 'epoch': 0.48}
+ 48%|████▊     | 3260/6779 [2:00:51<2:07:28,  2.17s/it] 48%|████▊     | 3261/6779 [2:00:53<2:06:36,  2.16s/it]                                                       {'loss': 1.7271, 'learning_rate': 0.0002169599182077127, 'epoch': 0.48}
+ 48%|████▊     | 3261/6779 [2:00:53<2:06:36,  2.16s/it] 48%|████▊     | 3262/6779 [2:00:55<2:03:42,  2.11s/it]                                                       {'loss': 1.6872, 'learning_rate': 0.00021686618144285178, 'epoch': 0.48}
+ 48%|████▊     | 3262/6779 [2:00:55<2:03:42,  2.11s/it] 48%|████▊     | 3263/6779 [2:00:57<2:01:18,  2.07s/it]                                                       {'loss': 1.7633, 'learning_rate': 0.00021677244094640345, 'epoch': 0.48}
+ 48%|████▊     | 3263/6779 [2:00:57<2:01:18,  2.07s/it] 48%|████▊     | 3264/6779 [2:00:59<2:00:57,  2.06s/it]                                                       {'loss': 1.8613, 'learning_rate': 0.0002166786967391075, 'epoch': 0.48}
+ 48%|████▊     | 3264/6779 [2:00:59<2:00:57,  2.06s/it] 48%|████▊     | 3265/6779 [2:01:02<2:01:47,  2.08s/it]                                                       {'loss': 1.7832, 'learning_rate': 0.00021658494884170456, 'epoch': 0.48}
+ 48%|████▊     | 3265/6779 [2:01:02<2:01:47,  2.08s/it] 48%|████▊     | 3266/6779 [2:01:03<1:58:51,  2.03s/it]                                                       {'loss': 1.454, 'learning_rate': 0.000216491197274936, 'epoch': 0.48}
+ 48%|████▊     | 3266/6779 [2:01:03<1:58:51,  2.03s/it] 48%|████▊     | 3267/6779 [2:01:06<2:06:05,  2.15s/it]                                                       {'loss': 1.5658, 'learning_rate': 0.000216397442059544, 'epoch': 0.48}
+ 48%|████▊     | 3267/6779 [2:01:06<2:06:05,  2.15s/it] 48%|████▊     | 3268/6779 [2:01:08<2:02:56,  2.10s/it]                                                       {'loss': 1.7288, 'learning_rate': 0.0002163036832162717, 'epoch': 0.48}
+ 48%|████▊     | 3268/6779 [2:01:08<2:02:56,  2.10s/it] 48%|████▊     | 3269/6779 [2:01:10<2:04:45,  2.13s/it]                                                       {'loss': 1.7119, 'learning_rate': 0.00021620992076586292, 'epoch': 0.48}
+ 48%|████▊     | 3269/6779 [2:01:10<2:04:45,  2.13s/it] 48%|████▊     | 3270/6779 [2:01:12<2:06:50,  2.17s/it]                                                       {'loss': 1.4244, 'learning_rate': 0.00021611615472906217, 'epoch': 0.48}
+ 48%|████▊     | 3270/6779 [2:01:12<2:06:50,  2.17s/it] 48%|████▊     | 3271/6779 [2:01:15<2:10:28,  2.23s/it]                                                       {'loss': 1.5922, 'learning_rate': 0.000216022385126615, 'epoch': 0.48}
+ 48%|████▊     | 3271/6779 [2:01:15<2:10:28,  2.23s/it] 48%|████▊     | 3272/6779 [2:01:17<2:08:21,  2.20s/it]                                                       {'loss': 1.6069, 'learning_rate': 0.0002159286119792676, 'epoch': 0.48}
+ 48%|████▊     | 3272/6779 [2:01:17<2:08:21,  2.20s/it] 48%|████▊     | 3273/6779 [2:01:19<2:08:48,  2.20s/it]                                                       {'loss': 1.6717, 'learning_rate': 0.000215834835307767, 'epoch': 0.48}
+ 48%|████▊     | 3273/6779 [2:01:19<2:08:48,  2.20s/it] 48%|████▊     | 3274/6779 [2:01:21<2:07:58,  2.19s/it]                                                       {'loss': 1.6455, 'learning_rate': 0.0002157410551328609, 'epoch': 0.48}
+ 48%|████▊     | 3274/6779 [2:01:21<2:07:58,  2.19s/it] 48%|████▊     | 3275/6779 [2:01:23<2:06:02,  2.16s/it]                                                       {'loss': 1.7274, 'learning_rate': 0.00021564727147529796, 'epoch': 0.48}
+ 48%|████▊     | 3275/6779 [2:01:23<2:06:02,  2.16s/it] 48%|████▊     | 3276/6779 [2:01:25<2:03:03,  2.11s/it]                                                       {'loss': 1.7189, 'learning_rate': 0.00021555348435582742, 'epoch': 0.48}
+ 48%|████▊     | 3276/6779 [2:01:25<2:03:03,  2.11s/it] 48%|████▊     | 3277/6779 [2:01:28<2:08:39,  2.20s/it]                                                       {'loss': 1.806, 'learning_rate': 0.00021545969379519942, 'epoch': 0.48}
+ 48%|████▊     | 3277/6779 [2:01:28<2:08:39,  2.20s/it] 48%|████▊     | 3278/6779 [2:01:30<2:06:58,  2.18s/it]                                                       {'loss': 1.9979, 'learning_rate': 0.00021536589981416477, 'epoch': 0.48}
+ 48%|████▊     | 3278/6779 [2:01:30<2:06:58,  2.18s/it] 48%|████▊     | 3279/6779 [2:01:32<2:08:12,  2.20s/it]                                                       {'loss': 1.8247, 'learning_rate': 0.00021527210243347516, 'epoch': 0.48}
+ 48%|████▊     | 3279/6779 [2:01:32<2:08:12,  2.20s/it] 48%|████▊     | 3280/6779 [2:01:34<2:05:51,  2.16s/it]                                                       {'loss': 1.6519, 'learning_rate': 0.0002151783016738829, 'epoch': 0.48}
+ 48%|████▊     | 3280/6779 [2:01:34<2:05:51,  2.16s/it] 48%|████▊     | 3281/6779 [2:01:36<2:06:26,  2.17s/it]                                                       {'loss': 1.6929, 'learning_rate': 0.00021508449755614105, 'epoch': 0.48}
+ 48%|████▊     | 3281/6779 [2:01:36<2:06:26,  2.17s/it] 48%|████▊     | 3282/6779 [2:01:39<2:19:31,  2.39s/it]                                                       {'loss': 1.7776, 'learning_rate': 0.00021499069010100358, 'epoch': 0.48}
+ 48%|████▊     | 3282/6779 [2:01:39<2:19:31,  2.39s/it] 48%|████▊     | 3283/6779 [2:01:41<2:14:55,  2.32s/it]                                                       {'loss': 1.5838, 'learning_rate': 0.00021489687932922498, 'epoch': 0.48}
+ 48%|████▊     | 3283/6779 [2:01:41<2:14:55,  2.32s/it] 48%|████▊     | 3284/6779 [2:01:43<2:10:49,  2.25s/it]                                                       {'loss': 1.6744, 'learning_rate': 0.00021480306526156065, 'epoch': 0.48}
+ 48%|████▊     | 3284/6779 [2:01:43<2:10:49,  2.25s/it] 48%|████▊     | 3285/6779 [2:01:46<2:09:51,  2.23s/it]                                                       {'loss': 1.9064, 'learning_rate': 0.00021470924791876662, 'epoch': 0.48}
+ 48%|████▊     | 3285/6779 [2:01:46<2:09:51,  2.23s/it] 48%|████▊     | 3286/6779 [2:01:48<2:09:51,  2.23s/it]                                                       {'loss': 1.7116, 'learning_rate': 0.00021461542732159963, 'epoch': 0.48}
+ 48%|████▊     | 3286/6779 [2:01:48<2:09:51,  2.23s/it] 48%|████▊     | 3287/6779 [2:01:50<2:07:03,  2.18s/it]                                                       {'loss': 1.6439, 'learning_rate': 0.00021452160349081726, 'epoch': 0.48}
+ 48%|████▊     | 3287/6779 [2:01:50<2:07:03,  2.18s/it] 49%|████▊     | 3288/6779 [2:01:52<2:08:07,  2.20s/it]                                                       {'loss': 1.8836, 'learning_rate': 0.0002144277764471776, 'epoch': 0.49}
+ 49%|████▊     | 3288/6779 [2:01:52<2:08:07,  2.20s/it] 49%|████▊     | 3289/6779 [2:01:55<2:16:10,  2.34s/it]                                                       {'loss': 1.8414, 'learning_rate': 0.00021433394621143972, 'epoch': 0.49}
+ 49%|████▊     | 3289/6779 [2:01:55<2:16:10,  2.34s/it] 49%|████▊     | 3290/6779 [2:01:57<2:13:48,  2.30s/it]                                                       {'loss': 1.5304, 'learning_rate': 0.00021424011280436314, 'epoch': 0.49}
+ 49%|████▊     | 3290/6779 [2:01:57<2:13:48,  2.30s/it] 49%|████▊     | 3291/6779 [2:01:59<2:12:51,  2.29s/it]                                                       {'loss': 1.7502, 'learning_rate': 0.0002141462762467083, 'epoch': 0.49}
+ 49%|████▊     | 3291/6779 [2:01:59<2:12:51,  2.29s/it] 49%|████▊     | 3292/6779 [2:02:01<2:09:25,  2.23s/it]                                                       {'loss': 1.6035, 'learning_rate': 0.00021405243655923614, 'epoch': 0.49}
+ 49%|████▊     | 3292/6779 [2:02:01<2:09:25,  2.23s/it] 49%|████▊     | 3293/6779 [2:02:04<2:13:00,  2.29s/it]                                                       {'loss': 1.7958, 'learning_rate': 0.00021395859376270845, 'epoch': 0.49}
+ 49%|████▊     | 3293/6779 [2:02:04<2:13:00,  2.29s/it] 49%|████▊     | 3294/6779 [2:02:06<2:11:10,  2.26s/it]                                                       {'loss': 1.5272, 'learning_rate': 0.00021386474787788755, 'epoch': 0.49}
+ 49%|████▊     | 3294/6779 [2:02:06<2:11:10,  2.26s/it] 49%|████▊     | 3295/6779 [2:02:08<2:09:05,  2.22s/it]                                                       {'loss': 1.6042, 'learning_rate': 0.00021377089892553655, 'epoch': 0.49}
+ 49%|████▊     | 3295/6779 [2:02:08<2:09:05,  2.22s/it] 49%|████▊     | 3296/6779 [2:02:11<2:11:07,  2.26s/it]                                                       {'loss': 1.6682, 'learning_rate': 0.00021367704692641936, 'epoch': 0.49}
+ 49%|████▊     | 3296/6779 [2:02:11<2:11:07,  2.26s/it] 49%|████▊     | 3297/6779 [2:02:13<2:10:57,  2.26s/it]                                                       {'loss': 1.7129, 'learning_rate': 0.00021358319190130032, 'epoch': 0.49}
+ 49%|████▊     | 3297/6779 [2:02:13<2:10:57,  2.26s/it] 49%|████▊     | 3298/6779 [2:02:15<2:08:35,  2.22s/it]                                                       {'loss': 1.7905, 'learning_rate': 0.00021348933387094448, 'epoch': 0.49}
+ 49%|████▊     | 3298/6779 [2:02:15<2:08:35,  2.22s/it] 49%|████▊     | 3299/6779 [2:02:17<2:05:17,  2.16s/it]                                                       {'loss': 1.7394, 'learning_rate': 0.00021339547285611777, 'epoch': 0.49}
+ 49%|████▊     | 3299/6779 [2:02:17<2:05:17,  2.16s/it] 49%|████▊     | 3300/6779 [2:02:19<2:05:05,  2.16s/it]                                                       {'loss': 1.5988, 'learning_rate': 0.00021330160887758664, 'epoch': 0.49}
+ 49%|████▊     | 3300/6779 [2:02:19<2:05:05,  2.16s/it] 49%|████▊     | 3301/6779 [2:02:21<2:06:24,  2.18s/it]                                                       {'loss': 1.6786, 'learning_rate': 0.000213207741956118, 'epoch': 0.49}
+ 49%|████▊     | 3301/6779 [2:02:21<2:06:24,  2.18s/it] 49%|████▊     | 3302/6779 [2:02:23<2:04:59,  2.16s/it]                                                       {'loss': 1.6093, 'learning_rate': 0.0002131138721124797, 'epoch': 0.49}
+ 49%|████▊     | 3302/6779 [2:02:23<2:04:59,  2.16s/it] 49%|████▊     | 3303/6779 [2:02:26<2:04:29,  2.15s/it]                                                       {'loss': 1.7383, 'learning_rate': 0.00021301999936744018, 'epoch': 0.49}
+ 49%|████▊     | 3303/6779 [2:02:26<2:04:29,  2.15s/it] 49%|████▊     | 3304/6779 [2:02:28<2:03:35,  2.13s/it]                                                       {'loss': 1.7475, 'learning_rate': 0.00021292612374176843, 'epoch': 0.49}
+ 49%|████▊     | 3304/6779 [2:02:28<2:03:35,  2.13s/it] 49%|████▉     | 3305/6779 [2:02:30<2:01:20,  2.10s/it]                                                       {'loss': 1.6022, 'learning_rate': 0.00021283224525623417, 'epoch': 0.49}
+ 49%|████▉     | 3305/6779 [2:02:30<2:01:20,  2.10s/it] 49%|████▉     | 3306/6779 [2:02:32<2:01:46,  2.10s/it]                                                       {'loss': 1.7157, 'learning_rate': 0.0002127383639316076, 'epoch': 0.49}
+ 49%|████▉     | 3306/6779 [2:02:32<2:01:46,  2.10s/it] 49%|████▉     | 3307/6779 [2:02:34<2:04:14,  2.15s/it]                                                       {'loss': 1.6026, 'learning_rate': 0.0002126444797886598, 'epoch': 0.49}
+ 49%|████▉     | 3307/6779 [2:02:34<2:04:14,  2.15s/it] 49%|████▉     | 3308/6779 [2:02:36<2:06:28,  2.19s/it]                                                       {'loss': 1.7608, 'learning_rate': 0.0002125505928481623, 'epoch': 0.49}
+ 49%|████▉     | 3308/6779 [2:02:36<2:06:28,  2.19s/it] 49%|████▉     | 3309/6779 [2:02:38<2:06:19,  2.18s/it]                                                       {'loss': 1.953, 'learning_rate': 0.00021245670313088715, 'epoch': 0.49}
+ 49%|████▉     | 3309/6779 [2:02:39<2:06:19,  2.18s/it] 49%|████▉     | 3310/6779 [2:02:41<2:10:54,  2.26s/it]                                                       {'loss': 1.7561, 'learning_rate': 0.0002123628106576073, 'epoch': 0.49}
+ 49%|████▉     | 3310/6779 [2:02:41<2:10:54,  2.26s/it] 49%|████▉     | 3311/6779 [2:02:43<2:12:41,  2.30s/it]                                                       {'loss': 1.8265, 'learning_rate': 0.00021226891544909605, 'epoch': 0.49}
+ 49%|████▉     | 3311/6779 [2:02:43<2:12:41,  2.30s/it] 49%|████▉     | 3312/6779 [2:02:45<2:08:40,  2.23s/it]                                                       {'loss': 1.8667, 'learning_rate': 0.0002121750175261274, 'epoch': 0.49}
+ 49%|████▉     | 3312/6779 [2:02:45<2:08:40,  2.23s/it] 49%|████▉     | 3313/6779 [2:02:48<2:11:20,  2.27s/it]                                                       {'loss': 1.8116, 'learning_rate': 0.00021208111690947603, 'epoch': 0.49}
+ 49%|████▉     | 3313/6779 [2:02:48<2:11:20,  2.27s/it] 49%|████▉     | 3314/6779 [2:02:50<2:11:33,  2.28s/it]                                                       {'loss': 1.7482, 'learning_rate': 0.00021198721361991713, 'epoch': 0.49}
+ 49%|████▉     | 3314/6779 [2:02:50<2:11:33,  2.28s/it] 49%|████▉     | 3315/6779 [2:02:52<2:09:36,  2.24s/it]                                                       {'loss': 1.7362, 'learning_rate': 0.00021189330767822643, 'epoch': 0.49}
+ 49%|████▉     | 3315/6779 [2:02:52<2:09:36,  2.24s/it] 49%|████▉     | 3316/6779 [2:02:54<2:09:02,  2.24s/it]                                                       {'loss': 1.614, 'learning_rate': 0.00021179939910518042, 'epoch': 0.49}
+ 49%|████▉     | 3316/6779 [2:02:54<2:09:02,  2.24s/it] 49%|████▉     | 3317/6779 [2:02:57<2:14:44,  2.34s/it]                                                       {'loss': 1.7448, 'learning_rate': 0.00021170548792155596, 'epoch': 0.49}
+ 49%|████▉     | 3317/6779 [2:02:57<2:14:44,  2.34s/it] 49%|████▉     | 3318/6779 [2:02:59<2:15:54,  2.36s/it]                                                       {'loss': 1.7366, 'learning_rate': 0.00021161157414813065, 'epoch': 0.49}
+ 49%|████▉     | 3318/6779 [2:02:59<2:15:54,  2.36s/it] 49%|████▉     | 3319/6779 [2:03:02<2:14:02,  2.32s/it]                                                       {'loss': 1.8324, 'learning_rate': 0.0002115176578056826, 'epoch': 0.49}
+ 49%|████▉     | 3319/6779 [2:03:02<2:14:02,  2.32s/it] 49%|████▉     | 3320/6779 [2:03:04<2:13:13,  2.31s/it]                                                       {'loss': 1.6527, 'learning_rate': 0.00021142373891499045, 'epoch': 0.49}
+ 49%|████▉     | 3320/6779 [2:03:04<2:13:13,  2.31s/it] 49%|████▉     | 3321/6779 [2:03:06<2:12:11,  2.29s/it]                                                       {'loss': 1.7893, 'learning_rate': 0.0002113298174968335, 'epoch': 0.49}
+ 49%|████▉     | 3321/6779 [2:03:06<2:12:11,  2.29s/it] 49%|████▉     | 3322/6779 [2:03:09<2:12:22,  2.30s/it]                                                       {'loss': 1.7349, 'learning_rate': 0.00021123589357199154, 'epoch': 0.49}
+ 49%|████▉     | 3322/6779 [2:03:09<2:12:22,  2.30s/it] 49%|████▉     | 3323/6779 [2:03:11<2:10:24,  2.26s/it]                                                       {'loss': 1.7976, 'learning_rate': 0.0002111419671612449, 'epoch': 0.49}
+ 49%|████▉     | 3323/6779 [2:03:11<2:10:24,  2.26s/it] 49%|████▉     | 3324/6779 [2:03:13<2:11:54,  2.29s/it]                                                       {'loss': 1.8621, 'learning_rate': 0.00021104803828537455, 'epoch': 0.49}
+ 49%|████▉     | 3324/6779 [2:03:13<2:11:54,  2.29s/it] 49%|████▉     | 3325/6779 [2:03:15<2:09:55,  2.26s/it]                                                       {'loss': 1.7861, 'learning_rate': 0.00021095410696516195, 'epoch': 0.49}
+ 49%|████▉     | 3325/6779 [2:03:15<2:09:55,  2.26s/it] 49%|████▉     | 3326/6779 [2:03:17<2:09:26,  2.25s/it]                                                       {'loss': 1.7662, 'learning_rate': 0.00021086017322138897, 'epoch': 0.49}
+ 49%|████▉     | 3326/6779 [2:03:17<2:09:26,  2.25s/it] 49%|████▉     | 3327/6779 [2:03:19<2:04:31,  2.16s/it]                                                       {'loss': 1.7026, 'learning_rate': 0.00021076623707483826, 'epoch': 0.49}
+ 49%|████▉     | 3327/6779 [2:03:19<2:04:31,  2.16s/it] 49%|████▉     | 3328/6779 [2:03:22<2:05:17,  2.18s/it]                                                       {'loss': 1.6607, 'learning_rate': 0.00021067229854629288, 'epoch': 0.49}
+ 49%|████▉     | 3328/6779 [2:03:22<2:05:17,  2.18s/it] 49%|████▉     | 3329/6779 [2:03:24<2:04:02,  2.16s/it]                                                       {'loss': 1.7583, 'learning_rate': 0.00021057835765653642, 'epoch': 0.49}
+ 49%|████▉     | 3329/6779 [2:03:24<2:04:02,  2.16s/it] 49%|████▉     | 3330/6779 [2:03:26<2:09:19,  2.25s/it]                                                       {'loss': 1.6883, 'learning_rate': 0.00021048441442635292, 'epoch': 0.49}
+ 49%|████▉     | 3330/6779 [2:03:26<2:09:19,  2.25s/it] 49%|████▉     | 3331/6779 [2:03:29<2:15:47,  2.36s/it]                                                       {'loss': 1.5724, 'learning_rate': 0.00021039046887652712, 'epoch': 0.49}
+ 49%|████▉     | 3331/6779 [2:03:29<2:15:47,  2.36s/it] 49%|████▉     | 3332/6779 [2:03:31<2:15:38,  2.36s/it]                                                       {'loss': 1.791, 'learning_rate': 0.0002102965210278441, 'epoch': 0.49}
+ 49%|████▉     | 3332/6779 [2:03:31<2:15:38,  2.36s/it] 49%|████▉     | 3333/6779 [2:03:33<2:10:50,  2.28s/it]                                                       {'loss': 1.7007, 'learning_rate': 0.00021020257090108952, 'epoch': 0.49}
+ 49%|████▉     | 3333/6779 [2:03:33<2:10:50,  2.28s/it] 49%|████▉     | 3334/6779 [2:03:35<2:07:24,  2.22s/it]                                                       {'loss': 1.8812, 'learning_rate': 0.0002101086185170495, 'epoch': 0.49}
+ 49%|████▉     | 3334/6779 [2:03:35<2:07:24,  2.22s/it] 49%|████▉     | 3335/6779 [2:03:38<2:11:23,  2.29s/it]                                                       {'loss': 1.6407, 'learning_rate': 0.00021001466389651078, 'epoch': 0.49}
+ 49%|████▉     | 3335/6779 [2:03:38<2:11:23,  2.29s/it] 49%|████▉     | 3336/6779 [2:03:40<2:10:48,  2.28s/it]                                                       {'loss': 1.6232, 'learning_rate': 0.00020992070706026046, 'epoch': 0.49}
+ 49%|████▉     | 3336/6779 [2:03:40<2:10:48,  2.28s/it] 49%|████▉     | 3337/6779 [2:03:42<2:07:16,  2.22s/it]                                                       {'loss': 1.6354, 'learning_rate': 0.00020982674802908616, 'epoch': 0.49}
+ 49%|████▉     | 3337/6779 [2:03:42<2:07:16,  2.22s/it] 49%|████▉     | 3338/6779 [2:03:44<2:06:09,  2.20s/it]                                                       {'loss': 1.5366, 'learning_rate': 0.00020973278682377613, 'epoch': 0.49}
+ 49%|████▉     | 3338/6779 [2:03:44<2:06:09,  2.20s/it] 49%|████▉     | 3339/6779 [2:03:47<2:06:25,  2.20s/it]                                                       {'loss': 1.5954, 'learning_rate': 0.00020963882346511885, 'epoch': 0.49}
+ 49%|████▉     | 3339/6779 [2:03:47<2:06:25,  2.20s/it] 49%|████▉     | 3340/6779 [2:03:49<2:08:25,  2.24s/it]                                                       {'loss': 1.6532, 'learning_rate': 0.0002095448579739035, 'epoch': 0.49}
+ 49%|████▉     | 3340/6779 [2:03:49<2:08:25,  2.24s/it] 49%|████▉     | 3341/6779 [2:03:51<2:05:30,  2.19s/it]                                                       {'loss': 1.6704, 'learning_rate': 0.00020945089037091949, 'epoch': 0.49}
+ 49%|████▉     | 3341/6779 [2:03:51<2:05:30,  2.19s/it] 49%|████▉     | 3342/6779 [2:03:53<2:06:59,  2.22s/it]                                                       {'loss': 1.6852, 'learning_rate': 0.00020935692067695696, 'epoch': 0.49}
+ 49%|████▉     | 3342/6779 [2:03:53<2:06:59,  2.22s/it] 49%|████▉     | 3343/6779 [2:03:55<2:05:27,  2.19s/it]                                                       {'loss': 1.6832, 'learning_rate': 0.0002092629489128064, 'epoch': 0.49}
+ 49%|████▉     | 3343/6779 [2:03:55<2:05:27,  2.19s/it] 49%|████▉     | 3344/6779 [2:03:57<2:03:34,  2.16s/it]                                                       {'loss': 1.8331, 'learning_rate': 0.00020916897509925874, 'epoch': 0.49}
+ 49%|████▉     | 3344/6779 [2:03:57<2:03:34,  2.16s/it] 49%|████▉     | 3345/6779 [2:04:00<2:03:38,  2.16s/it]                                                       {'loss': 1.5019, 'learning_rate': 0.00020907499925710532, 'epoch': 0.49}
+ 49%|████▉     | 3345/6779 [2:04:00<2:03:38,  2.16s/it] 49%|████▉     | 3346/6779 [2:04:02<2:06:39,  2.21s/it]                                                       {'loss': 1.7605, 'learning_rate': 0.00020898102140713806, 'epoch': 0.49}
+ 49%|████▉     | 3346/6779 [2:04:02<2:06:39,  2.21s/it] 49%|████▉     | 3347/6779 [2:04:04<2:04:49,  2.18s/it]                                                       {'loss': 1.7448, 'learning_rate': 0.00020888704157014928, 'epoch': 0.49}
+ 49%|████▉     | 3347/6779 [2:04:04<2:04:49,  2.18s/it] 49%|████▉     | 3348/6779 [2:04:06<2:03:26,  2.16s/it]                                                       {'loss': 1.6306, 'learning_rate': 0.0002087930597669316, 'epoch': 0.49}
+ 49%|████▉     | 3348/6779 [2:04:06<2:03:26,  2.16s/it] 49%|████▉     | 3349/6779 [2:04:08<2:03:54,  2.17s/it]                                                       {'loss': 1.6701, 'learning_rate': 0.00020869907601827828, 'epoch': 0.49}
+ 49%|████▉     | 3349/6779 [2:04:08<2:03:54,  2.17s/it] 49%|████▉     | 3350/6779 [2:04:11<2:04:32,  2.18s/it]                                                       {'loss': 1.744, 'learning_rate': 0.00020860509034498285, 'epoch': 0.49}
+ 49%|████▉     | 3350/6779 [2:04:11<2:04:32,  2.18s/it] 49%|████▉     | 3351/6779 [2:04:13<2:12:45,  2.32s/it]                                                       {'loss': 1.7878, 'learning_rate': 0.00020851110276783944, 'epoch': 0.49}
+ 49%|████▉     | 3351/6779 [2:04:13<2:12:45,  2.32s/it] 49%|████▉     | 3352/6779 [2:04:16<2:13:35,  2.34s/it]                                                       {'loss': 1.6051, 'learning_rate': 0.0002084171133076423, 'epoch': 0.49}
+ 49%|████▉     | 3352/6779 [2:04:16<2:13:35,  2.34s/it] 49%|████▉     | 3353/6779 [2:04:18<2:07:46,  2.24s/it]                                                       {'loss': 1.7685, 'learning_rate': 0.00020832312198518644, 'epoch': 0.49}
+ 49%|████▉     | 3353/6779 [2:04:18<2:07:46,  2.24s/it] 49%|████▉     | 3354/6779 [2:04:20<2:08:03,  2.24s/it]                                                       {'loss': 1.6166, 'learning_rate': 0.00020822912882126717, 'epoch': 0.49}
+ 49%|████▉     | 3354/6779 [2:04:20<2:08:03,  2.24s/it] 49%|████▉     | 3355/6779 [2:04:22<2:09:56,  2.28s/it]                                                       {'loss': 1.6939, 'learning_rate': 0.00020813513383668007, 'epoch': 0.49}
+ 49%|████▉     | 3355/6779 [2:04:22<2:09:56,  2.28s/it] 50%|████▉     | 3356/6779 [2:04:24<2:08:18,  2.25s/it]                                                       {'loss': 1.7053, 'learning_rate': 0.00020804113705222123, 'epoch': 0.5}
+ 50%|████▉     | 3356/6779 [2:04:24<2:08:18,  2.25s/it] 50%|████▉     | 3357/6779 [2:04:26<2:05:14,  2.20s/it]                                                       {'loss': 1.7371, 'learning_rate': 0.00020794713848868717, 'epoch': 0.5}
+ 50%|████▉     | 3357/6779 [2:04:26<2:05:14,  2.20s/it] 50%|████▉     | 3358/6779 [2:04:29<2:04:40,  2.19s/it]                                                       {'loss': 1.7026, 'learning_rate': 0.00020785313816687473, 'epoch': 0.5}
+ 50%|████▉     | 3358/6779 [2:04:29<2:04:40,  2.19s/it] 50%|████▉     | 3359/6779 [2:04:31<2:01:40,  2.13s/it]                                                       {'loss': 1.7911, 'learning_rate': 0.00020775913610758117, 'epoch': 0.5}
+ 50%|████▉     | 3359/6779 [2:04:31<2:01:40,  2.13s/it] 50%|████▉     | 3360/6779 [2:04:33<2:00:53,  2.12s/it]                                                       {'loss': 1.4349, 'learning_rate': 0.0002076651323316042, 'epoch': 0.5}
+ 50%|████▉     | 3360/6779 [2:04:33<2:00:53,  2.12s/it] 50%|████▉     | 3361/6779 [2:04:35<2:01:10,  2.13s/it]                                                       {'loss': 1.5674, 'learning_rate': 0.0002075711268597418, 'epoch': 0.5}
+ 50%|████▉     | 3361/6779 [2:04:35<2:01:10,  2.13s/it] 50%|████▉     | 3362/6779 [2:04:37<1:59:14,  2.09s/it]                                                       {'loss': 1.6748, 'learning_rate': 0.0002074771197127924, 'epoch': 0.5}
+ 50%|████▉     | 3362/6779 [2:04:37<1:59:14,  2.09s/it] 50%|████▉     | 3363/6779 [2:04:39<2:02:11,  2.15s/it]                                                       {'loss': 1.4932, 'learning_rate': 0.0002073831109115547, 'epoch': 0.5}
+ 50%|████▉     | 3363/6779 [2:04:39<2:02:11,  2.15s/it] 50%|████▉     | 3364/6779 [2:04:41<2:00:03,  2.11s/it]                                                       {'loss': 1.4318, 'learning_rate': 0.00020728910047682793, 'epoch': 0.5}
+ 50%|████▉     | 3364/6779 [2:04:41<2:00:03,  2.11s/it] 50%|████▉     | 3365/6779 [2:04:43<2:01:05,  2.13s/it]                                                       {'loss': 1.6715, 'learning_rate': 0.00020719508842941155, 'epoch': 0.5}
+ 50%|████▉     | 3365/6779 [2:04:43<2:01:05,  2.13s/it] 50%|████▉     | 3366/6779 [2:04:45<1:59:42,  2.10s/it]                                                       {'loss': 1.7946, 'learning_rate': 0.00020710107479010538, 'epoch': 0.5}
+ 50%|████▉     | 3366/6779 [2:04:45<1:59:42,  2.10s/it] 50%|████▉     | 3367/6779 [2:04:48<2:06:25,  2.22s/it]                                                       {'loss': 1.5707, 'learning_rate': 0.0002070070595797097, 'epoch': 0.5}
+ 50%|████▉     | 3367/6779 [2:04:48<2:06:25,  2.22s/it] 50%|████▉     | 3368/6779 [2:04:50<2:04:17,  2.19s/it]                                                       {'loss': 1.5147, 'learning_rate': 0.00020691304281902505, 'epoch': 0.5}
+ 50%|████▉     | 3368/6779 [2:04:50<2:04:17,  2.19s/it] 50%|████▉     | 3369/6779 [2:04:52<2:02:41,  2.16s/it]                                                       {'loss': 1.6307, 'learning_rate': 0.0002068190245288523, 'epoch': 0.5}
+ 50%|████▉     | 3369/6779 [2:04:52<2:02:41,  2.16s/it] 50%|████▉     | 3370/6779 [2:04:54<2:02:39,  2.16s/it]                                                       {'loss': 1.5858, 'learning_rate': 0.00020672500472999268, 'epoch': 0.5}
+ 50%|████▉     | 3370/6779 [2:04:54<2:02:39,  2.16s/it] 50%|████▉     | 3371/6779 [2:04:56<2:02:09,  2.15s/it]                                                       {'loss': 1.5606, 'learning_rate': 0.00020663098344324786, 'epoch': 0.5}
+ 50%|████▉     | 3371/6779 [2:04:56<2:02:09,  2.15s/it] 50%|████▉     | 3372/6779 [2:04:59<2:02:30,  2.16s/it]                                                       {'loss': 1.5621, 'learning_rate': 0.00020653696068941967, 'epoch': 0.5}
+ 50%|████▉     | 3372/6779 [2:04:59<2:02:30,  2.16s/it] 50%|████▉     | 3373/6779 [2:05:01<2:04:39,  2.20s/it]                                                       {'loss': 1.6761, 'learning_rate': 0.00020644293648931027, 'epoch': 0.5}
+ 50%|████▉     | 3373/6779 [2:05:01<2:04:39,  2.20s/it] 50%|████▉     | 3374/6779 [2:05:03<2:11:36,  2.32s/it]                                                       {'loss': 1.6076, 'learning_rate': 0.0002063489108637223, 'epoch': 0.5}
+ 50%|████▉     | 3374/6779 [2:05:03<2:11:36,  2.32s/it] 50%|████▉     | 3375/6779 [2:05:06<2:08:28,  2.26s/it]                                                       {'loss': 1.5146, 'learning_rate': 0.00020625488383345858, 'epoch': 0.5}
+ 50%|████▉     | 3375/6779 [2:05:06<2:08:28,  2.26s/it] 50%|████▉     | 3376/6779 [2:05:09<2:21:07,  2.49s/it]                                                       {'loss': 1.663, 'learning_rate': 0.0002061608554193223, 'epoch': 0.5}
+ 50%|████▉     | 3376/6779 [2:05:09<2:21:07,  2.49s/it] 50%|████▉     | 3377/6779 [2:05:11<2:15:33,  2.39s/it]                                                       {'loss': 1.7993, 'learning_rate': 0.00020606682564211693, 'epoch': 0.5}
+ 50%|████▉     | 3377/6779 [2:05:11<2:15:33,  2.39s/it] 50%|████▉     | 3378/6779 [2:05:13<2:09:53,  2.29s/it]                                                       {'loss': 1.6789, 'learning_rate': 0.0002059727945226463, 'epoch': 0.5}
+ 50%|████▉     | 3378/6779 [2:05:13<2:09:53,  2.29s/it] 50%|████▉     | 3379/6779 [2:05:15<2:07:33,  2.25s/it]                                                       {'loss': 1.7126, 'learning_rate': 0.00020587876208171446, 'epoch': 0.5}
+ 50%|████▉     | 3379/6779 [2:05:15<2:07:33,  2.25s/it] 50%|████▉     | 3380/6779 [2:05:17<2:03:44,  2.18s/it]                                                       {'loss': 1.616, 'learning_rate': 0.00020578472834012569, 'epoch': 0.5}
+ 50%|████▉     | 3380/6779 [2:05:17<2:03:44,  2.18s/it] 50%|████▉     | 3381/6779 [2:05:19<2:01:08,  2.14s/it]                                                       {'loss': 1.5626, 'learning_rate': 0.0002056906933186848, 'epoch': 0.5}
+ 50%|████▉     | 3381/6779 [2:05:19<2:01:08,  2.14s/it] 50%|████▉     | 3382/6779 [2:05:21<2:02:23,  2.16s/it]                                                       {'loss': 1.7607, 'learning_rate': 0.00020559665703819658, 'epoch': 0.5}
+ 50%|████▉     | 3382/6779 [2:05:21<2:02:23,  2.16s/it] 50%|████▉     | 3383/6779 [2:05:24<2:04:40,  2.20s/it]                                                       {'loss': 1.66, 'learning_rate': 0.0002055026195194664, 'epoch': 0.5}
+ 50%|████▉     | 3383/6779 [2:05:24<2:04:40,  2.20s/it] 50%|████▉     | 3384/6779 [2:05:26<2:05:41,  2.22s/it]                                                       {'loss': 1.7625, 'learning_rate': 0.00020540858078329954, 'epoch': 0.5}
+ 50%|████▉     | 3384/6779 [2:05:26<2:05:41,  2.22s/it] 50%|████▉     | 3385/6779 [2:05:28<2:08:50,  2.28s/it]                                                       {'loss': 1.6745, 'learning_rate': 0.00020531454085050198, 'epoch': 0.5}
+ 50%|████▉     | 3385/6779 [2:05:28<2:08:50,  2.28s/it] 50%|████▉     | 3386/6779 [2:05:30<2:04:44,  2.21s/it]                                                       {'loss': 1.6289, 'learning_rate': 0.0002052204997418797, 'epoch': 0.5}
+ 50%|████▉     | 3386/6779 [2:05:30<2:04:44,  2.21s/it] 50%|████▉     | 3387/6779 [2:05:33<2:06:27,  2.24s/it]                                                       {'loss': 1.8016, 'learning_rate': 0.0002051264574782389, 'epoch': 0.5}
+ 50%|████▉     | 3387/6779 [2:05:33<2:06:27,  2.24s/it] 50%|████▉     | 3388/6779 [2:05:35<2:07:01,  2.25s/it]                                                       {'loss': 1.6626, 'learning_rate': 0.00020503241408038618, 'epoch': 0.5}
+ 50%|████▉     | 3388/6779 [2:05:35<2:07:01,  2.25s/it] 50%|████▉     | 3389/6779 [2:05:37<2:09:19,  2.29s/it]                                                       {'loss': 1.6698, 'learning_rate': 0.00020493836956912836, 'epoch': 0.5}
+ 50%|████▉     | 3389/6779 [2:05:37<2:09:19,  2.29s/it] 50%|█████     | 3390/6779 [2:05:39<2:06:20,  2.24s/it]                                                       {'loss': 1.7338, 'learning_rate': 0.00020484432396527242, 'epoch': 0.5}
+ 50%|█████     | 3390/6779 [2:05:39<2:06:20,  2.24s/it] 50%|█████     | 3391/6779 [2:05:42<2:07:35,  2.26s/it]                                                       {'loss': 1.6031, 'learning_rate': 0.0002047502772896256, 'epoch': 0.5}
+ 50%|█████     | 3391/6779 [2:05:42<2:07:35,  2.26s/it] 50%|█████     | 3392/6779 [2:05:44<2:03:57,  2.20s/it]                                                       {'loss': 1.5973, 'learning_rate': 0.0002046562295629956, 'epoch': 0.5}
+ 50%|█████     | 3392/6779 [2:05:44<2:03:57,  2.20s/it] 50%|█████     | 3393/6779 [2:05:46<2:02:00,  2.16s/it]                                                       {'loss': 1.5806, 'learning_rate': 0.00020456218080619, 'epoch': 0.5}
+ 50%|█████     | 3393/6779 [2:05:46<2:02:00,  2.16s/it] 50%|█████     | 3394/6779 [2:05:48<2:06:02,  2.23s/it]                                                       {'loss': 1.6844, 'learning_rate': 0.00020446813104001686, 'epoch': 0.5}
+ 50%|█████     | 3394/6779 [2:05:48<2:06:02,  2.23s/it] 50%|█████     | 3395/6779 [2:05:50<2:05:14,  2.22s/it]                                                       {'loss': 1.7871, 'learning_rate': 0.00020437408028528434, 'epoch': 0.5}
+ 50%|█████     | 3395/6779 [2:05:50<2:05:14,  2.22s/it] 50%|█████     | 3396/6779 [2:05:53<2:06:34,  2.24s/it]                                                       {'loss': 1.6384, 'learning_rate': 0.0002042800285628009, 'epoch': 0.5}
+ 50%|█████     | 3396/6779 [2:05:53<2:06:34,  2.24s/it] 50%|█████     | 3397/6779 [2:05:55<2:06:32,  2.25s/it]                                                       {'loss': 1.5295, 'learning_rate': 0.0002041859758933752, 'epoch': 0.5}
+ 50%|█████     | 3397/6779 [2:05:55<2:06:32,  2.25s/it] 50%|█████     | 3398/6779 [2:05:57<2:05:39,  2.23s/it]                                                       {'loss': 1.7206, 'learning_rate': 0.00020409192229781594, 'epoch': 0.5}
+ 50%|█████     | 3398/6779 [2:05:57<2:05:39,  2.23s/it] 50%|█████     | 3399/6779 [2:05:59<2:03:40,  2.20s/it]                                                       {'loss': 1.816, 'learning_rate': 0.00020399786779693235, 'epoch': 0.5}
+ 50%|█████     | 3399/6779 [2:05:59<2:03:40,  2.20s/it] 50%|█████     | 3400/6779 [2:06:01<2:04:21,  2.21s/it]                                                       {'loss': 1.4965, 'learning_rate': 0.00020390381241153357, 'epoch': 0.5}
+ 50%|█████     | 3400/6779 [2:06:01<2:04:21,  2.21s/it] 50%|█████     | 3401/6779 [2:06:04<2:04:40,  2.21s/it]                                                       {'loss': 1.4979, 'learning_rate': 0.00020380975616242909, 'epoch': 0.5}
+ 50%|█████     | 3401/6779 [2:06:04<2:04:40,  2.21s/it] 50%|█████     | 3402/6779 [2:06:06<2:09:08,  2.29s/it]                                                       {'loss': 1.8731, 'learning_rate': 0.0002037156990704286, 'epoch': 0.5}
+ 50%|█████     | 3402/6779 [2:06:06<2:09:08,  2.29s/it] 50%|█████     | 3403/6779 [2:06:08<2:09:17,  2.30s/it]                                                       {'loss': 1.7492, 'learning_rate': 0.00020362164115634177, 'epoch': 0.5}
+ 50%|█████     | 3403/6779 [2:06:08<2:09:17,  2.30s/it] 50%|█████     | 3404/6779 [2:06:11<2:08:33,  2.29s/it]                                                       {'loss': 1.7806, 'learning_rate': 0.00020352758244097873, 'epoch': 0.5}
+ 50%|█████     | 3404/6779 [2:06:11<2:08:33,  2.29s/it] 50%|█████     | 3405/6779 [2:06:13<2:07:01,  2.26s/it]                                                       {'loss': 1.7502, 'learning_rate': 0.00020343352294514957, 'epoch': 0.5}
+ 50%|█████     | 3405/6779 [2:06:13<2:07:01,  2.26s/it] 50%|█████     | 3406/6779 [2:06:15<2:02:37,  2.18s/it]                                                       {'loss': 1.6994, 'learning_rate': 0.0002033394626896648, 'epoch': 0.5}
+ 50%|█████     | 3406/6779 [2:06:15<2:02:37,  2.18s/it] 50%|█████     | 3407/6779 [2:06:17<2:00:52,  2.15s/it]                                                       {'loss': 1.6593, 'learning_rate': 0.00020324540169533477, 'epoch': 0.5}
+ 50%|█████     | 3407/6779 [2:06:17<2:00:52,  2.15s/it] 50%|█████     | 3408/6779 [2:06:19<1:59:47,  2.13s/it]                                                       {'loss': 1.7519, 'learning_rate': 0.00020315133998297026, 'epoch': 0.5}
+ 50%|█████     | 3408/6779 [2:06:19<1:59:47,  2.13s/it] 50%|█████     | 3409/6779 [2:06:21<2:00:43,  2.15s/it]                                                       {'loss': 1.8678, 'learning_rate': 0.00020305727757338212, 'epoch': 0.5}
+ 50%|█████     | 3409/6779 [2:06:21<2:00:43,  2.15s/it] 50%|█████     | 3410/6779 [2:06:23<2:01:21,  2.16s/it]                                                       {'loss': 1.6347, 'learning_rate': 0.00020296321448738135, 'epoch': 0.5}
+ 50%|█████     | 3410/6779 [2:06:23<2:01:21,  2.16s/it] 50%|█████     | 3411/6779 [2:06:26<2:01:00,  2.16s/it]                                                       {'loss': 1.6374, 'learning_rate': 0.00020286915074577909, 'epoch': 0.5}
+ 50%|█████     | 3411/6779 [2:06:26<2:01:00,  2.16s/it] 50%|█████     | 3412/6779 [2:06:28<2:01:32,  2.17s/it]                                                       {'loss': 1.7194, 'learning_rate': 0.00020277508636938656, 'epoch': 0.5}
+ 50%|█████     | 3412/6779 [2:06:28<2:01:32,  2.17s/it] 50%|█████     | 3413/6779 [2:06:30<2:03:27,  2.20s/it]                                                       {'loss': 1.7048, 'learning_rate': 0.0002026810213790153, 'epoch': 0.5}
+ 50%|█████     | 3413/6779 [2:06:30<2:03:27,  2.20s/it] 50%|█████     | 3414/6779 [2:06:32<2:03:49,  2.21s/it]                                                       {'loss': 1.6664, 'learning_rate': 0.00020258695579547685, 'epoch': 0.5}
+ 50%|█████     | 3414/6779 [2:06:32<2:03:49,  2.21s/it] 50%|█████     | 3415/6779 [2:06:34<2:00:54,  2.16s/it]                                                       {'loss': 1.5324, 'learning_rate': 0.00020249288963958284, 'epoch': 0.5}
+ 50%|█████     | 3415/6779 [2:06:34<2:00:54,  2.16s/it] 50%|█████     | 3416/6779 [2:06:37<2:02:35,  2.19s/it]                                                       {'loss': 1.6318, 'learning_rate': 0.00020239882293214523, 'epoch': 0.5}
+ 50%|█████     | 3416/6779 [2:06:37<2:02:35,  2.19s/it] 50%|█████     | 3417/6779 [2:06:39<2:02:01,  2.18s/it]                                                       {'loss': 1.7078, 'learning_rate': 0.0002023047556939759, 'epoch': 0.5}
+ 50%|█████     | 3417/6779 [2:06:39<2:02:01,  2.18s/it] 50%|█████     | 3418/6779 [2:06:41<2:11:37,  2.35s/it]                                                       {'loss': 1.9372, 'learning_rate': 0.0002022106879458869, 'epoch': 0.5}
+ 50%|█████     | 3418/6779 [2:06:41<2:11:37,  2.35s/it] 50%|█████     | 3419/6779 [2:06:44<2:06:18,  2.26s/it]                                                       {'loss': 1.6461, 'learning_rate': 0.0002021166197086904, 'epoch': 0.5}
+ 50%|█████     | 3419/6779 [2:06:44<2:06:18,  2.26s/it] 50%|█████     | 3420/6779 [2:06:46<2:14:20,  2.40s/it]                                                       {'loss': 1.5375, 'learning_rate': 0.00020202255100319877, 'epoch': 0.5}
+ 50%|█████     | 3420/6779 [2:06:46<2:14:20,  2.40s/it] 50%|█████     | 3421/6779 [2:06:49<2:13:27,  2.38s/it]                                                       {'loss': 1.5455, 'learning_rate': 0.00020192848185022436, 'epoch': 0.5}
+ 50%|█████     | 3421/6779 [2:06:49<2:13:27,  2.38s/it] 50%|█████     | 3422/6779 [2:06:51<2:11:47,  2.36s/it]                                                       {'loss': 1.6272, 'learning_rate': 0.00020183441227057967, 'epoch': 0.5}
+ 50%|█████     | 3422/6779 [2:06:51<2:11:47,  2.36s/it] 50%|█████     | 3423/6779 [2:06:53<2:08:44,  2.30s/it]                                                       {'loss': 1.7224, 'learning_rate': 0.00020174034228507716, 'epoch': 0.5}
+ 50%|█████     | 3423/6779 [2:06:53<2:08:44,  2.30s/it] 51%|█████     | 3424/6779 [2:06:55<2:04:54,  2.23s/it]                                                       {'loss': 1.6838, 'learning_rate': 0.00020164627191452975, 'epoch': 0.51}
+ 51%|█████     | 3424/6779 [2:06:55<2:04:54,  2.23s/it] 51%|█████     | 3425/6779 [2:06:57<2:02:05,  2.18s/it]                                                       {'loss': 1.5423, 'learning_rate': 0.00020155220117975002, 'epoch': 0.51}
+ 51%|█████     | 3425/6779 [2:06:57<2:02:05,  2.18s/it] 51%|█████     | 3426/6779 [2:07:00<2:05:49,  2.25s/it]                                                       {'loss': 1.7988, 'learning_rate': 0.00020145813010155082, 'epoch': 0.51}
+ 51%|█████     | 3426/6779 [2:07:00<2:05:49,  2.25s/it] 51%|█████     | 3427/6779 [2:07:02<2:04:38,  2.23s/it]                                                       {'loss': 1.7048, 'learning_rate': 0.0002013640587007452, 'epoch': 0.51}
+ 51%|█████     | 3427/6779 [2:07:02<2:04:38,  2.23s/it] 51%|█████     | 3428/6779 [2:07:04<2:03:24,  2.21s/it]                                                       {'loss': 1.8154, 'learning_rate': 0.00020126998699814604, 'epoch': 0.51}
+ 51%|█████     | 3428/6779 [2:07:04<2:03:24,  2.21s/it] 51%|█████     | 3429/6779 [2:07:06<2:00:58,  2.17s/it]                                                       {'loss': 1.7796, 'learning_rate': 0.00020117591501456637, 'epoch': 0.51}
+ 51%|█████     | 3429/6779 [2:07:06<2:00:58,  2.17s/it] 51%|█████     | 3430/6779 [2:07:08<2:03:38,  2.22s/it]                                                       {'loss': 1.7433, 'learning_rate': 0.00020108184277081934, 'epoch': 0.51}
+ 51%|█████     | 3430/6779 [2:07:08<2:03:38,  2.22s/it] 51%|█████     | 3431/6779 [2:07:11<2:02:34,  2.20s/it]                                                       {'loss': 1.6016, 'learning_rate': 0.00020098777028771818, 'epoch': 0.51}
+ 51%|█████     | 3431/6779 [2:07:11<2:02:34,  2.20s/it] 51%|█████     | 3432/6779 [2:07:13<2:05:13,  2.24s/it]                                                       {'loss': 1.6866, 'learning_rate': 0.0002008936975860761, 'epoch': 0.51}
+ 51%|█████     | 3432/6779 [2:07:13<2:05:13,  2.24s/it] 51%|█████     | 3433/6779 [2:07:15<2:04:17,  2.23s/it]                                                       {'loss': 1.683, 'learning_rate': 0.00020079962468670632, 'epoch': 0.51}
+ 51%|█████     | 3433/6779 [2:07:15<2:04:17,  2.23s/it] 51%|█████     | 3434/6779 [2:07:17<2:03:46,  2.22s/it]                                                       {'loss': 1.722, 'learning_rate': 0.00020070555161042219, 'epoch': 0.51}
+ 51%|█████     | 3434/6779 [2:07:17<2:03:46,  2.22s/it] 51%|█████     | 3435/6779 [2:07:19<2:03:02,  2.21s/it]                                                       {'loss': 1.7221, 'learning_rate': 0.00020061147837803711, 'epoch': 0.51}
+ 51%|█████     | 3435/6779 [2:07:19<2:03:02,  2.21s/it] 51%|█████     | 3436/6779 [2:07:22<2:02:45,  2.20s/it]                                                       {'loss': 1.8571, 'learning_rate': 0.00020051740501036443, 'epoch': 0.51}
+ 51%|█████     | 3436/6779 [2:07:22<2:02:45,  2.20s/it] 51%|█████     | 3437/6779 [2:07:24<2:05:19,  2.25s/it]                                                       {'loss': 1.8402, 'learning_rate': 0.00020042333152821756, 'epoch': 0.51}
+ 51%|█████     | 3437/6779 [2:07:24<2:05:19,  2.25s/it] 51%|█████     | 3438/6779 [2:07:28<2:33:19,  2.75s/it]                                                       {'loss': 1.5308, 'learning_rate': 0.00020032925795241, 'epoch': 0.51}
+ 51%|█████     | 3438/6779 [2:07:28<2:33:19,  2.75s/it] 51%|█████     | 3439/6779 [2:07:30<2:24:55,  2.60s/it]                                                       {'loss': 1.7032, 'learning_rate': 0.0002002351843037552, 'epoch': 0.51}
+ 51%|█████     | 3439/6779 [2:07:30<2:24:55,  2.60s/it] 51%|█████     | 3440/6779 [2:07:32<2:19:20,  2.50s/it]                                                       {'loss': 1.6164, 'learning_rate': 0.00020014111060306662, 'epoch': 0.51}
+ 51%|█████     | 3440/6779 [2:07:32<2:19:20,  2.50s/it] 51%|█████     | 3441/6779 [2:07:35<2:14:41,  2.42s/it]                                                       {'loss': 1.6375, 'learning_rate': 0.00020004703687115778, 'epoch': 0.51}
+ 51%|█████     | 3441/6779 [2:07:35<2:14:41,  2.42s/it] 51%|█████     | 3442/6779 [2:07:37<2:12:23,  2.38s/it]                                                       {'loss': 1.8288, 'learning_rate': 0.00019995296312884226, 'epoch': 0.51}
+ 51%|█████     | 3442/6779 [2:07:37<2:12:23,  2.38s/it] 51%|█████     | 3443/6779 [2:07:39<2:08:52,  2.32s/it]                                                       {'loss': 1.78, 'learning_rate': 0.00019985888939693346, 'epoch': 0.51}
+ 51%|█████     | 3443/6779 [2:07:39<2:08:52,  2.32s/it] 51%|█████     | 3444/6779 [2:07:41<2:06:38,  2.28s/it]                                                       {'loss': 1.68, 'learning_rate': 0.00019976481569624488, 'epoch': 0.51}
+ 51%|█████     | 3444/6779 [2:07:41<2:06:38,  2.28s/it] 51%|█████     | 3445/6779 [2:07:44<2:06:52,  2.28s/it]                                                       {'loss': 1.5357, 'learning_rate': 0.00019967074204759009, 'epoch': 0.51}
+ 51%|█████     | 3445/6779 [2:07:44<2:06:52,  2.28s/it] 51%|█████     | 3446/6779 [2:07:46<2:06:12,  2.27s/it]                                                       {'loss': 1.7564, 'learning_rate': 0.00019957666847178246, 'epoch': 0.51}
+ 51%|█████     | 3446/6779 [2:07:46<2:06:12,  2.27s/it] 51%|█████     | 3447/6779 [2:07:48<2:05:48,  2.27s/it]                                                       {'loss': 1.7303, 'learning_rate': 0.0001994825949896356, 'epoch': 0.51}
+ 51%|█████     | 3447/6779 [2:07:48<2:05:48,  2.27s/it] 51%|█████     | 3448/6779 [2:07:50<2:02:06,  2.20s/it]                                                       {'loss': 1.6892, 'learning_rate': 0.00019938852162196293, 'epoch': 0.51}
+ 51%|█████     | 3448/6779 [2:07:50<2:02:06,  2.20s/it] 51%|█████     | 3449/6779 [2:07:52<1:58:59,  2.14s/it]                                                       {'loss': 1.856, 'learning_rate': 0.00019929444838957783, 'epoch': 0.51}
+ 51%|█████     | 3449/6779 [2:07:52<1:58:59,  2.14s/it] 51%|█████     | 3450/6779 [2:07:54<1:59:20,  2.15s/it]                                                       {'loss': 1.6682, 'learning_rate': 0.00019920037531329373, 'epoch': 0.51}
+ 51%|█████     | 3450/6779 [2:07:54<1:59:20,  2.15s/it] 51%|█████     | 3451/6779 [2:07:56<1:58:53,  2.14s/it]                                                       {'loss': 1.4921, 'learning_rate': 0.000199106302413924, 'epoch': 0.51}
+ 51%|█████     | 3451/6779 [2:07:56<1:58:53,  2.14s/it] 51%|█████     | 3452/6779 [2:07:59<1:58:44,  2.14s/it]                                                       {'loss': 1.6322, 'learning_rate': 0.0001990122297122819, 'epoch': 0.51}
+ 51%|█████     | 3452/6779 [2:07:59<1:58:44,  2.14s/it] 51%|█████     | 3453/6779 [2:08:01<1:59:19,  2.15s/it]                                                       {'loss': 1.6171, 'learning_rate': 0.00019891815722918065, 'epoch': 0.51}
+ 51%|█████     | 3453/6779 [2:08:01<1:59:19,  2.15s/it] 51%|█████     | 3454/6779 [2:08:03<2:03:12,  2.22s/it]                                                       {'loss': 1.5913, 'learning_rate': 0.00019882408498543368, 'epoch': 0.51}
+ 51%|█████     | 3454/6779 [2:08:03<2:03:12,  2.22s/it] 51%|█████     | 3455/6779 [2:08:05<2:01:50,  2.20s/it]                                                       {'loss': 1.8826, 'learning_rate': 0.00019873001300185403, 'epoch': 0.51}
+ 51%|█████     | 3455/6779 [2:08:05<2:01:50,  2.20s/it] 51%|█████     | 3456/6779 [2:08:08<2:09:57,  2.35s/it]                                                       {'loss': 1.7496, 'learning_rate': 0.00019863594129925484, 'epoch': 0.51}
+ 51%|█████     | 3456/6779 [2:08:08<2:09:57,  2.35s/it] 51%|█████     | 3457/6779 [2:08:11<2:13:01,  2.40s/it]                                                       {'loss': 1.6895, 'learning_rate': 0.0001985418698984492, 'epoch': 0.51}
+ 51%|█████     | 3457/6779 [2:08:11<2:13:01,  2.40s/it] 51%|█████     | 3458/6779 [2:08:13<2:12:54,  2.40s/it]                                                       {'loss': 1.7472, 'learning_rate': 0.00019844779882025005, 'epoch': 0.51}
+ 51%|█████     | 3458/6779 [2:08:13<2:12:54,  2.40s/it] 51%|█████     | 3459/6779 [2:08:15<2:11:33,  2.38s/it]                                                       {'loss': 1.5836, 'learning_rate': 0.00019835372808547038, 'epoch': 0.51}
+ 51%|█████     | 3459/6779 [2:08:15<2:11:33,  2.38s/it] 51%|█████     | 3460/6779 [2:08:17<2:08:38,  2.33s/it]                                                       {'loss': 1.6281, 'learning_rate': 0.0001982596577149228, 'epoch': 0.51}
+ 51%|█████     | 3460/6779 [2:08:17<2:08:38,  2.33s/it] 51%|█████     | 3461/6779 [2:08:20<2:04:50,  2.26s/it]                                                       {'loss': 1.6771, 'learning_rate': 0.0001981655877294204, 'epoch': 0.51}
+ 51%|█████     | 3461/6779 [2:08:20<2:04:50,  2.26s/it] 51%|█████     | 3462/6779 [2:08:22<2:04:53,  2.26s/it]                                                       {'loss': 1.7121, 'learning_rate': 0.00019807151814977566, 'epoch': 0.51}
+ 51%|█████     | 3462/6779 [2:08:22<2:04:53,  2.26s/it] 51%|█████     | 3463/6779 [2:08:24<2:05:41,  2.27s/it]                                                       {'loss': 1.7778, 'learning_rate': 0.00019797744899680125, 'epoch': 0.51}
+ 51%|█████     | 3463/6779 [2:08:24<2:05:41,  2.27s/it] 51%|█████     | 3464/6779 [2:08:26<2:06:40,  2.29s/it]                                                       {'loss': 1.5628, 'learning_rate': 0.0001978833802913096, 'epoch': 0.51}
+ 51%|█████     | 3464/6779 [2:08:26<2:06:40,  2.29s/it] 51%|█████     | 3465/6779 [2:08:29<2:06:13,  2.29s/it]                                                       {'loss': 1.574, 'learning_rate': 0.00019778931205411315, 'epoch': 0.51}
+ 51%|█████     | 3465/6779 [2:08:29<2:06:13,  2.29s/it] 51%|█████     | 3466/6779 [2:08:31<2:04:38,  2.26s/it]                                                       {'loss': 1.8394, 'learning_rate': 0.00019769524430602418, 'epoch': 0.51}
+ 51%|█████     | 3466/6779 [2:08:31<2:04:38,  2.26s/it] 51%|█████     | 3467/6779 [2:08:33<2:01:37,  2.20s/it]                                                       {'loss': 1.5664, 'learning_rate': 0.00019760117706785478, 'epoch': 0.51}
+ 51%|█████     | 3467/6779 [2:08:33<2:01:37,  2.20s/it] 51%|█████     | 3468/6779 [2:08:35<2:04:03,  2.25s/it]                                                       {'loss': 1.649, 'learning_rate': 0.00019750711036041715, 'epoch': 0.51}
+ 51%|█████     | 3468/6779 [2:08:35<2:04:03,  2.25s/it] 51%|█████     | 3469/6779 [2:08:38<2:03:31,  2.24s/it]                                                       {'loss': 1.6258, 'learning_rate': 0.0001974130442045232, 'epoch': 0.51}
+ 51%|█████     | 3469/6779 [2:08:38<2:03:31,  2.24s/it] 51%|█████     | 3470/6779 [2:08:40<2:01:04,  2.20s/it]                                                       {'loss': 1.8043, 'learning_rate': 0.00019731897862098474, 'epoch': 0.51}
+ 51%|█████     | 3470/6779 [2:08:40<2:01:04,  2.20s/it] 51%|█████     | 3471/6779 [2:08:42<2:02:37,  2.22s/it]                                                       {'loss': 1.6433, 'learning_rate': 0.0001972249136306135, 'epoch': 0.51}
+ 51%|█████     | 3471/6779 [2:08:42<2:02:37,  2.22s/it] 51%|█████     | 3472/6779 [2:08:44<2:00:32,  2.19s/it]                                                       {'loss': 1.7482, 'learning_rate': 0.000197130849254221, 'epoch': 0.51}
+ 51%|█████     | 3472/6779 [2:08:44<2:00:32,  2.19s/it] 51%|█████     | 3473/6779 [2:08:46<1:59:27,  2.17s/it]                                                       {'loss': 1.6857, 'learning_rate': 0.0001970367855126187, 'epoch': 0.51}
+ 51%|█████     | 3473/6779 [2:08:46<1:59:27,  2.17s/it] 51%|█████     | 3474/6779 [2:08:48<1:56:39,  2.12s/it]                                                       {'loss': 1.6729, 'learning_rate': 0.00019694272242661788, 'epoch': 0.51}
+ 51%|█████     | 3474/6779 [2:08:48<1:56:39,  2.12s/it] 51%|█████▏    | 3475/6779 [2:08:50<1:57:48,  2.14s/it]                                                       {'loss': 1.8157, 'learning_rate': 0.00019684866001702973, 'epoch': 0.51}
+ 51%|█████▏    | 3475/6779 [2:08:50<1:57:48,  2.14s/it] 51%|█████▏    | 3476/6779 [2:08:53<2:05:32,  2.28s/it]                                                       {'loss': 1.645, 'learning_rate': 0.00019675459830466525, 'epoch': 0.51}
+ 51%|█████▏    | 3476/6779 [2:08:53<2:05:32,  2.28s/it] 51%|█████▏    | 3477/6779 [2:08:55<2:00:35,  2.19s/it]                                                       {'loss': 1.653, 'learning_rate': 0.00019666053731033528, 'epoch': 0.51}
+ 51%|█████▏    | 3477/6779 [2:08:55<2:00:35,  2.19s/it] 51%|█████▏    | 3478/6779 [2:08:57<1:59:20,  2.17s/it]                                                       {'loss': 1.7855, 'learning_rate': 0.00019656647705485044, 'epoch': 0.51}
+ 51%|█████▏    | 3478/6779 [2:08:57<1:59:20,  2.17s/it] 51%|█████▏    | 3479/6779 [2:08:59<2:02:42,  2.23s/it]                                                       {'loss': 1.6507, 'learning_rate': 0.00019647241755902135, 'epoch': 0.51}
+ 51%|█████▏    | 3479/6779 [2:08:59<2:02:42,  2.23s/it] 51%|█████▏    | 3480/6779 [2:09:02<2:02:27,  2.23s/it]                                                       {'loss': 1.7562, 'learning_rate': 0.00019637835884365833, 'epoch': 0.51}
+ 51%|█████▏    | 3480/6779 [2:09:02<2:02:27,  2.23s/it] 51%|█████▏    | 3481/6779 [2:09:04<2:03:48,  2.25s/it]                                                       {'loss': 1.6917, 'learning_rate': 0.00019628430092957148, 'epoch': 0.51}
+ 51%|█████▏    | 3481/6779 [2:09:04<2:03:48,  2.25s/it] 51%|█████▏    | 3482/6779 [2:09:06<2:02:22,  2.23s/it]                                                       {'loss': 1.6663, 'learning_rate': 0.00019619024383757093, 'epoch': 0.51}
+ 51%|█████▏    | 3482/6779 [2:09:06<2:02:22,  2.23s/it] 51%|█████▏    | 3483/6779 [2:09:09<2:06:46,  2.31s/it]                                                       {'loss': 1.6933, 'learning_rate': 0.00019609618758846645, 'epoch': 0.51}
+ 51%|█████▏    | 3483/6779 [2:09:09<2:06:46,  2.31s/it] 51%|█████▏    | 3484/6779 [2:09:11<2:05:22,  2.28s/it]                                                       {'loss': 1.9148, 'learning_rate': 0.00019600213220306772, 'epoch': 0.51}
+ 51%|█████▏    | 3484/6779 [2:09:11<2:05:22,  2.28s/it] 51%|█████▏    | 3485/6779 [2:09:13<2:02:24,  2.23s/it]                                                       {'loss': 1.6237, 'learning_rate': 0.0001959080777021841, 'epoch': 0.51}
+ 51%|█████▏    | 3485/6779 [2:09:13<2:02:24,  2.23s/it] 51%|█████▏    | 3486/6779 [2:09:16<2:18:28,  2.52s/it]                                                       {'loss': 1.6678, 'learning_rate': 0.0001958140241066249, 'epoch': 0.51}
+ 51%|█████▏    | 3486/6779 [2:09:16<2:18:28,  2.52s/it] 51%|█████▏    | 3487/6779 [2:09:18<2:13:08,  2.43s/it]                                                       {'loss': 1.5786, 'learning_rate': 0.00019571997143719917, 'epoch': 0.51}
+ 51%|█████▏    | 3487/6779 [2:09:18<2:13:08,  2.43s/it] 51%|█████▏    | 3488/6779 [2:09:21<2:08:29,  2.34s/it]                                                       {'loss': 1.5989, 'learning_rate': 0.00019562591971471568, 'epoch': 0.51}
+ 51%|█████▏    | 3488/6779 [2:09:21<2:08:29,  2.34s/it] 51%|█████▏    | 3489/6779 [2:09:24<2:18:44,  2.53s/it]                                                       {'loss': 1.6251, 'learning_rate': 0.0001955318689599832, 'epoch': 0.51}
+ 51%|█████▏    | 3489/6779 [2:09:24<2:18:44,  2.53s/it] 51%|█████▏    | 3490/6779 [2:09:26<2:14:39,  2.46s/it]                                                       {'loss': 1.5699, 'learning_rate': 0.00019543781919381003, 'epoch': 0.51}
+ 51%|█████▏    | 3490/6779 [2:09:26<2:14:39,  2.46s/it] 51%|█████▏    | 3491/6779 [2:09:28<2:11:15,  2.40s/it]                                                       {'loss': 1.6627, 'learning_rate': 0.00019534377043700445, 'epoch': 0.51}
+ 51%|█████▏    | 3491/6779 [2:09:28<2:11:15,  2.40s/it] 52%|█████▏    | 3492/6779 [2:09:30<2:09:05,  2.36s/it]                                                       {'loss': 1.7202, 'learning_rate': 0.00019524972271037442, 'epoch': 0.52}
+ 52%|█████▏    | 3492/6779 [2:09:30<2:09:05,  2.36s/it] 52%|█████▏    | 3493/6779 [2:09:32<2:02:59,  2.25s/it]                                                       {'loss': 1.6786, 'learning_rate': 0.00019515567603472765, 'epoch': 0.52}
+ 52%|█████▏    | 3493/6779 [2:09:32<2:02:59,  2.25s/it] 52%|█████▏    | 3494/6779 [2:09:34<2:01:31,  2.22s/it]                                                       {'loss': 1.5742, 'learning_rate': 0.00019506163043087174, 'epoch': 0.52}
+ 52%|█████▏    | 3494/6779 [2:09:34<2:01:31,  2.22s/it] 52%|█████▏    | 3495/6779 [2:09:37<1:59:22,  2.18s/it]                                                       {'loss': 1.6653, 'learning_rate': 0.0001949675859196138, 'epoch': 0.52}
+ 52%|█████▏    | 3495/6779 [2:09:37<1:59:22,  2.18s/it] 52%|█████▏    | 3496/6779 [2:09:39<1:59:32,  2.18s/it]                                                       {'loss': 1.7963, 'learning_rate': 0.00019487354252176113, 'epoch': 0.52}
+ 52%|█████▏    | 3496/6779 [2:09:39<1:59:32,  2.18s/it] 52%|█████▏    | 3497/6779 [2:09:41<2:01:02,  2.21s/it]                                                       {'loss': 1.6751, 'learning_rate': 0.00019477950025812034, 'epoch': 0.52}
+ 52%|█████▏    | 3497/6779 [2:09:41<2:01:02,  2.21s/it] 52%|█████▏    | 3498/6779 [2:09:43<1:59:18,  2.18s/it]                                                       {'loss': 1.7682, 'learning_rate': 0.00019468545914949804, 'epoch': 0.52}
+ 52%|█████▏    | 3498/6779 [2:09:43<1:59:18,  2.18s/it] 52%|█████▏    | 3499/6779 [2:09:46<2:04:11,  2.27s/it]                                                       {'loss': 1.6689, 'learning_rate': 0.00019459141921670048, 'epoch': 0.52}
+ 52%|█████▏    | 3499/6779 [2:09:46<2:04:11,  2.27s/it] 52%|█████▏    | 3500/6779 [2:09:48<2:00:52,  2.21s/it]                                                       {'loss': 1.7682, 'learning_rate': 0.0001944973804805337, 'epoch': 0.52}
+ 52%|█████▏    | 3500/6779 [2:09:48<2:00:52,  2.21s/it] 52%|█████▏    | 3501/6779 [2:09:50<1:58:34,  2.17s/it]                                                       {'loss': 1.6917, 'learning_rate': 0.0001944033429618035, 'epoch': 0.52}
+ 52%|█████▏    | 3501/6779 [2:09:50<1:58:34,  2.17s/it] 52%|█████▏    | 3502/6779 [2:09:52<2:00:10,  2.20s/it]                                                       {'loss': 1.7705, 'learning_rate': 0.00019430930668131523, 'epoch': 0.52}
+ 52%|█████▏    | 3502/6779 [2:09:52<2:00:10,  2.20s/it] 52%|█████▏    | 3503/6779 [2:09:54<1:58:34,  2.17s/it]                                                       {'loss': 1.6703, 'learning_rate': 0.00019421527165987428, 'epoch': 0.52}
+ 52%|█████▏    | 3503/6779 [2:09:54<1:58:34,  2.17s/it] 52%|█████▏    | 3504/6779 [2:09:56<2:00:41,  2.21s/it]                                                       {'loss': 1.6305, 'learning_rate': 0.0001941212379182856, 'epoch': 0.52}
+ 52%|█████▏    | 3504/6779 [2:09:56<2:00:41,  2.21s/it] 52%|█████▏    | 3505/6779 [2:09:59<2:03:12,  2.26s/it]                                                       {'loss': 1.6344, 'learning_rate': 0.00019402720547735374, 'epoch': 0.52}
+ 52%|█████▏    | 3505/6779 [2:09:59<2:03:12,  2.26s/it] 52%|█████▏    | 3506/6779 [2:10:01<2:02:06,  2.24s/it]                                                       {'loss': 1.8104, 'learning_rate': 0.00019393317435788309, 'epoch': 0.52}
+ 52%|█████▏    | 3506/6779 [2:10:01<2:02:06,  2.24s/it] 52%|█████▏    | 3507/6779 [2:10:03<1:58:15,  2.17s/it]                                                       {'loss': 1.7134, 'learning_rate': 0.00019383914458067774, 'epoch': 0.52}
+ 52%|█████▏    | 3507/6779 [2:10:03<1:58:15,  2.17s/it] 52%|█████▏    | 3508/6779 [2:10:05<1:58:36,  2.18s/it]                                                       {'loss': 1.8188, 'learning_rate': 0.00019374511616654147, 'epoch': 0.52}
+ 52%|█████▏    | 3508/6779 [2:10:05<1:58:36,  2.18s/it] 52%|█████▏    | 3509/6779 [2:10:07<1:59:41,  2.20s/it]                                                       {'loss': 1.8337, 'learning_rate': 0.00019365108913627768, 'epoch': 0.52}
+ 52%|█████▏    | 3509/6779 [2:10:07<1:59:41,  2.20s/it] 52%|█████▏    | 3510/6779 [2:10:10<2:00:15,  2.21s/it]                                                       {'loss': 1.6456, 'learning_rate': 0.00019355706351068975, 'epoch': 0.52}
+ 52%|█████▏    | 3510/6779 [2:10:10<2:00:15,  2.21s/it] 52%|█████▏    | 3511/6779 [2:10:12<2:02:36,  2.25s/it]                                                       {'loss': 1.7474, 'learning_rate': 0.00019346303931058037, 'epoch': 0.52}
+ 52%|█████▏    | 3511/6779 [2:10:12<2:02:36,  2.25s/it] 52%|█████▏    | 3512/6779 [2:10:14<2:00:58,  2.22s/it]                                                       {'loss': 1.6877, 'learning_rate': 0.00019336901655675216, 'epoch': 0.52}
+ 52%|█████▏    | 3512/6779 [2:10:14<2:00:58,  2.22s/it] 52%|█████▏    | 3513/6779 [2:10:16<1:58:52,  2.18s/it]                                                       {'loss': 1.7095, 'learning_rate': 0.00019327499527000734, 'epoch': 0.52}
+ 52%|█████▏    | 3513/6779 [2:10:16<1:58:52,  2.18s/it] 52%|█████▏    | 3514/6779 [2:10:18<1:56:51,  2.15s/it]                                                       {'loss': 1.7436, 'learning_rate': 0.00019318097547114778, 'epoch': 0.52}
+ 52%|█████▏    | 3514/6779 [2:10:18<1:56:51,  2.15s/it] 52%|█████▏    | 3515/6779 [2:10:20<1:55:18,  2.12s/it]                                                       {'loss': 1.7387, 'learning_rate': 0.00019308695718097503, 'epoch': 0.52}
+ 52%|█████▏    | 3515/6779 [2:10:20<1:55:18,  2.12s/it] 52%|█████▏    | 3516/6779 [2:10:23<2:00:21,  2.21s/it]                                                       {'loss': 1.7737, 'learning_rate': 0.0001929929404202903, 'epoch': 0.52}
+ 52%|█████▏    | 3516/6779 [2:10:23<2:00:21,  2.21s/it] 52%|█████▏    | 3517/6779 [2:10:25<1:58:50,  2.19s/it]                                                       {'loss': 1.7348, 'learning_rate': 0.00019289892520989461, 'epoch': 0.52}
+ 52%|█████▏    | 3517/6779 [2:10:25<1:58:50,  2.19s/it] 52%|█████▏    | 3518/6779 [2:10:27<1:59:18,  2.20s/it]                                                       {'loss': 1.8664, 'learning_rate': 0.0001928049115705885, 'epoch': 0.52}
+ 52%|█████▏    | 3518/6779 [2:10:27<1:59:18,  2.20s/it] 52%|█████▏    | 3519/6779 [2:10:29<2:00:42,  2.22s/it]                                                       {'loss': 1.6055, 'learning_rate': 0.00019271089952317208, 'epoch': 0.52}
+ 52%|█████▏    | 3519/6779 [2:10:29<2:00:42,  2.22s/it] 52%|█████▏    | 3520/6779 [2:10:32<2:01:52,  2.24s/it]                                                       {'loss': 1.7792, 'learning_rate': 0.00019261688908844534, 'epoch': 0.52}
+ 52%|█████▏    | 3520/6779 [2:10:32<2:01:52,  2.24s/it] 52%|█████▏    | 3521/6779 [2:10:34<2:04:56,  2.30s/it]                                                       {'loss': 1.6715, 'learning_rate': 0.00019252288028720767, 'epoch': 0.52}
+ 52%|█████▏    | 3521/6779 [2:10:34<2:04:56,  2.30s/it] 52%|█████▏    | 3522/6779 [2:10:36<2:01:51,  2.24s/it]                                                       {'loss': 1.7039, 'learning_rate': 0.00019242887314025828, 'epoch': 0.52}
+ 52%|█████▏    | 3522/6779 [2:10:36<2:01:51,  2.24s/it] 52%|█████▏    | 3523/6779 [2:10:38<2:00:07,  2.21s/it]                                                       {'loss': 1.7353, 'learning_rate': 0.00019233486766839588, 'epoch': 0.52}
+ 52%|█████▏    | 3523/6779 [2:10:38<2:00:07,  2.21s/it] 52%|█████▏    | 3524/6779 [2:10:41<1:58:28,  2.18s/it]                                                       {'loss': 1.8221, 'learning_rate': 0.00019224086389241883, 'epoch': 0.52}
+ 52%|█████▏    | 3524/6779 [2:10:41<1:58:28,  2.18s/it] 52%|█████▏    | 3525/6779 [2:10:43<1:56:37,  2.15s/it]                                                       {'loss': 1.6689, 'learning_rate': 0.0001921468618331253, 'epoch': 0.52}
+ 52%|█████▏    | 3525/6779 [2:10:43<1:56:37,  2.15s/it] 52%|█████▏    | 3526/6779 [2:10:45<1:59:21,  2.20s/it]                                                       {'loss': 1.6001, 'learning_rate': 0.00019205286151131287, 'epoch': 0.52}
+ 52%|█████▏    | 3526/6779 [2:10:45<1:59:21,  2.20s/it] 52%|█████▏    | 3527/6779 [2:10:47<1:57:01,  2.16s/it]                                                       {'loss': 1.8592, 'learning_rate': 0.00019195886294777882, 'epoch': 0.52}
+ 52%|█████▏    | 3527/6779 [2:10:47<1:57:01,  2.16s/it] 52%|█████▏    | 3528/6779 [2:10:49<1:55:12,  2.13s/it]                                                       {'loss': 1.6468, 'learning_rate': 0.00019186486616332, 'epoch': 0.52}
+ 52%|█████▏    | 3528/6779 [2:10:49<1:55:12,  2.13s/it] 52%|█████▏    | 3529/6779 [2:10:51<1:55:00,  2.12s/it]                                                       {'loss': 1.5556, 'learning_rate': 0.0001917708711787329, 'epoch': 0.52}
+ 52%|█████▏    | 3529/6779 [2:10:51<1:55:00,  2.12s/it] 52%|█████▏    | 3530/6779 [2:10:53<1:54:12,  2.11s/it]                                                       {'loss': 1.6721, 'learning_rate': 0.00019167687801481363, 'epoch': 0.52}
+ 52%|█████▏    | 3530/6779 [2:10:53<1:54:12,  2.11s/it] 52%|█████▏    | 3531/6779 [2:10:55<1:56:03,  2.14s/it]                                                       {'loss': 1.7297, 'learning_rate': 0.0001915828866923577, 'epoch': 0.52}
+ 52%|█████▏    | 3531/6779 [2:10:55<1:56:03,  2.14s/it] 52%|█████▏    | 3532/6779 [2:10:58<1:57:32,  2.17s/it]                                                       {'loss': 1.7676, 'learning_rate': 0.00019148889723216063, 'epoch': 0.52}
+ 52%|█████▏    | 3532/6779 [2:10:58<1:57:32,  2.17s/it] 52%|█████▏    | 3533/6779 [2:11:00<1:58:23,  2.19s/it]                                                       {'loss': 1.6279, 'learning_rate': 0.00019139490965501717, 'epoch': 0.52}
+ 52%|█████▏    | 3533/6779 [2:11:00<1:58:23,  2.19s/it] 52%|█████▏    | 3534/6779 [2:11:02<1:59:09,  2.20s/it]                                                       {'loss': 1.6926, 'learning_rate': 0.00019130092398172177, 'epoch': 0.52}
+ 52%|█████▏    | 3534/6779 [2:11:02<1:59:09,  2.20s/it] 52%|█████▏    | 3535/6779 [2:11:04<1:57:21,  2.17s/it]                                                       {'loss': 1.6447, 'learning_rate': 0.00019120694023306843, 'epoch': 0.52}
+ 52%|█████▏    | 3535/6779 [2:11:04<1:57:21,  2.17s/it] 52%|█████▏    | 3536/6779 [2:11:06<1:56:32,  2.16s/it]                                                       {'loss': 1.7217, 'learning_rate': 0.00019111295842985077, 'epoch': 0.52}
+ 52%|█████▏    | 3536/6779 [2:11:06<1:56:32,  2.16s/it] 52%|█████▏    | 3537/6779 [2:11:09<2:00:08,  2.22s/it]                                                       {'loss': 1.7264, 'learning_rate': 0.00019101897859286196, 'epoch': 0.52}
+ 52%|█████▏    | 3537/6779 [2:11:09<2:00:08,  2.22s/it] 52%|█████▏    | 3538/6779 [2:11:11<1:59:16,  2.21s/it]                                                       {'loss': 1.6807, 'learning_rate': 0.00019092500074289467, 'epoch': 0.52}
+ 52%|█████▏    | 3538/6779 [2:11:11<1:59:16,  2.21s/it] 52%|█████▏    | 3539/6779 [2:11:13<2:00:31,  2.23s/it]                                                       {'loss': 1.5805, 'learning_rate': 0.0001908310249007413, 'epoch': 0.52}
+ 52%|█████▏    | 3539/6779 [2:11:13<2:00:31,  2.23s/it] 52%|█████▏    | 3540/6779 [2:11:15<1:59:53,  2.22s/it]                                                       {'loss': 1.6739, 'learning_rate': 0.00019073705108719363, 'epoch': 0.52}
+ 52%|█████▏    | 3540/6779 [2:11:15<1:59:53,  2.22s/it] 52%|█████▏    | 3541/6779 [2:11:18<2:02:02,  2.26s/it]                                                       {'loss': 1.6716, 'learning_rate': 0.00019064307932304306, 'epoch': 0.52}
+ 52%|█████▏    | 3541/6779 [2:11:18<2:02:02,  2.26s/it] 52%|█████▏    | 3542/6779 [2:11:20<2:05:19,  2.32s/it]                                                       {'loss': 1.7894, 'learning_rate': 0.00019054910962908056, 'epoch': 0.52}
+ 52%|█████▏    | 3542/6779 [2:11:20<2:05:19,  2.32s/it] 52%|█████▏    | 3543/6779 [2:11:22<2:03:45,  2.29s/it]                                                       {'loss': 1.6199, 'learning_rate': 0.0001904551420260966, 'epoch': 0.52}
+ 52%|█████▏    | 3543/6779 [2:11:22<2:03:45,  2.29s/it] 52%|█████▏    | 3544/6779 [2:11:25<1:59:42,  2.22s/it]                                                       {'loss': 1.7352, 'learning_rate': 0.00019036117653488123, 'epoch': 0.52}
+ 52%|█████▏    | 3544/6779 [2:11:25<1:59:42,  2.22s/it] 52%|█████▏    | 3545/6779 [2:11:27<2:02:01,  2.26s/it]                                                       {'loss': 1.8426, 'learning_rate': 0.0001902672131762239, 'epoch': 0.52}
+ 52%|█████▏    | 3545/6779 [2:11:27<2:02:01,  2.26s/it] 52%|█████▏    | 3546/6779 [2:11:29<1:59:18,  2.21s/it]                                                       {'loss': 1.7658, 'learning_rate': 0.00019017325197091383, 'epoch': 0.52}
+ 52%|█████▏    | 3546/6779 [2:11:29<1:59:18,  2.21s/it] 52%|█████▏    | 3547/6779 [2:11:31<2:00:22,  2.23s/it]                                                       {'loss': 1.6525, 'learning_rate': 0.00019007929293973956, 'epoch': 0.52}
+ 52%|█████▏    | 3547/6779 [2:11:31<2:00:22,  2.23s/it] 52%|█████▏    | 3548/6779 [2:11:34<2:05:36,  2.33s/it]                                                       {'loss': 1.7052, 'learning_rate': 0.00018998533610348924, 'epoch': 0.52}
+ 52%|█████▏    | 3548/6779 [2:11:34<2:05:36,  2.33s/it] 52%|█████▏    | 3549/6779 [2:11:36<2:02:47,  2.28s/it]                                                       {'loss': 1.6755, 'learning_rate': 0.00018989138148295054, 'epoch': 0.52}
+ 52%|█████▏    | 3549/6779 [2:11:36<2:02:47,  2.28s/it] 52%|█████▏    | 3550/6779 [2:11:38<2:00:00,  2.23s/it]                                                       {'loss': 1.7658, 'learning_rate': 0.00018979742909891055, 'epoch': 0.52}
+ 52%|█████▏    | 3550/6779 [2:11:38<2:00:00,  2.23s/it] 52%|█████▏    | 3551/6779 [2:11:40<2:01:14,  2.25s/it]                                                       {'loss': 1.6031, 'learning_rate': 0.000189703478972156, 'epoch': 0.52}
+ 52%|█████▏    | 3551/6779 [2:11:40<2:01:14,  2.25s/it] 52%|█████▏    | 3552/6779 [2:11:43<2:00:26,  2.24s/it]                                                       {'loss': 1.7582, 'learning_rate': 0.00018960953112347293, 'epoch': 0.52}
+ 52%|█████▏    | 3552/6779 [2:11:43<2:00:26,  2.24s/it] 52%|█████▏    | 3553/6779 [2:11:45<1:58:26,  2.20s/it]                                                       {'loss': 1.6066, 'learning_rate': 0.0001895155855736471, 'epoch': 0.52}
+ 52%|█████▏    | 3553/6779 [2:11:45<1:58:26,  2.20s/it] 52%|█████▏    | 3554/6779 [2:11:47<1:59:07,  2.22s/it]                                                       {'loss': 1.6028, 'learning_rate': 0.00018942164234346366, 'epoch': 0.52}
+ 52%|█████▏    | 3554/6779 [2:11:47<1:59:07,  2.22s/it] 52%|█████▏    | 3555/6779 [2:11:49<1:58:54,  2.21s/it]                                                       {'loss': 1.6793, 'learning_rate': 0.00018932770145370714, 'epoch': 0.52}
+ 52%|█████▏    | 3555/6779 [2:11:49<1:58:54,  2.21s/it] 52%|█████▏    | 3556/6779 [2:11:51<1:54:23,  2.13s/it]                                                       {'loss': 1.7208, 'learning_rate': 0.00018923376292516176, 'epoch': 0.52}
+ 52%|█████▏    | 3556/6779 [2:11:51<1:54:23,  2.13s/it] 52%|█████▏    | 3557/6779 [2:11:53<1:56:41,  2.17s/it]                                                       {'loss': 1.6738, 'learning_rate': 0.00018913982677861107, 'epoch': 0.52}
+ 52%|█████▏    | 3557/6779 [2:11:53<1:56:41,  2.17s/it] 52%|█████▏    | 3558/6779 [2:11:55<1:54:53,  2.14s/it]                                                       {'loss': 1.5103, 'learning_rate': 0.00018904589303483818, 'epoch': 0.52}
+ 52%|█████▏    | 3558/6779 [2:11:55<1:54:53,  2.14s/it] 53%|█████▎    | 3559/6779 [2:11:58<1:57:57,  2.20s/it]                                                       {'loss': 1.9111, 'learning_rate': 0.00018895196171462547, 'epoch': 0.53}
+ 53%|█████▎    | 3559/6779 [2:11:58<1:57:57,  2.20s/it] 53%|█████▎    | 3560/6779 [2:12:00<1:57:32,  2.19s/it]                                                       {'loss': 1.6733, 'learning_rate': 0.00018885803283875513, 'epoch': 0.53}
+ 53%|█████▎    | 3560/6779 [2:12:00<1:57:32,  2.19s/it] 53%|█████▎    | 3561/6779 [2:12:02<1:57:14,  2.19s/it]                                                       {'loss': 1.6698, 'learning_rate': 0.0001887641064280085, 'epoch': 0.53}
+ 53%|█████▎    | 3561/6779 [2:12:02<1:57:14,  2.19s/it] 53%|█████▎    | 3562/6779 [2:12:04<1:57:00,  2.18s/it]                                                       {'loss': 1.6601, 'learning_rate': 0.00018867018250316654, 'epoch': 0.53}
+ 53%|█████▎    | 3562/6779 [2:12:04<1:57:00,  2.18s/it] 53%|█████▎    | 3563/6779 [2:12:07<1:57:49,  2.20s/it]                                                       {'loss': 1.6403, 'learning_rate': 0.0001885762610850096, 'epoch': 0.53}
+ 53%|█████▎    | 3563/6779 [2:12:07<1:57:49,  2.20s/it] 53%|█████▎    | 3564/6779 [2:12:08<1:53:54,  2.13s/it]                                                       {'loss': 1.7121, 'learning_rate': 0.0001884823421943175, 'epoch': 0.53}
+ 53%|█████▎    | 3564/6779 [2:12:08<1:53:54,  2.13s/it] 53%|█████▎    | 3565/6779 [2:12:11<1:57:57,  2.20s/it]                                                       {'loss': 1.8361, 'learning_rate': 0.00018838842585186942, 'epoch': 0.53}
+ 53%|█████▎    | 3565/6779 [2:12:11<1:57:57,  2.20s/it] 53%|█████▎    | 3566/6779 [2:12:13<2:00:16,  2.25s/it]                                                       {'loss': 1.7748, 'learning_rate': 0.00018829451207844403, 'epoch': 0.53}
+ 53%|█████▎    | 3566/6779 [2:12:13<2:00:16,  2.25s/it] 53%|█████▎    | 3567/6779 [2:12:15<1:59:04,  2.22s/it]                                                       {'loss': 1.6542, 'learning_rate': 0.00018820060089481963, 'epoch': 0.53}
+ 53%|█████▎    | 3567/6779 [2:12:15<1:59:04,  2.22s/it] 53%|█████▎    | 3568/6779 [2:12:18<1:59:15,  2.23s/it]                                                       {'loss': 1.5158, 'learning_rate': 0.0001881066923217736, 'epoch': 0.53}
+ 53%|█████▎    | 3568/6779 [2:12:18<1:59:15,  2.23s/it] 53%|█████▎    | 3569/6779 [2:12:20<1:58:02,  2.21s/it]                                                       {'loss': 1.681, 'learning_rate': 0.00018801278638008292, 'epoch': 0.53}
+ 53%|█████▎    | 3569/6779 [2:12:20<1:58:02,  2.21s/it] 53%|█████▎    | 3570/6779 [2:12:22<1:58:11,  2.21s/it]                                                       {'loss': 1.757, 'learning_rate': 0.00018791888309052405, 'epoch': 0.53}
+ 53%|█████▎    | 3570/6779 [2:12:22<1:58:11,  2.21s/it] 53%|█████▎    | 3571/6779 [2:12:24<1:57:48,  2.20s/it]                                                       {'loss': 1.58, 'learning_rate': 0.00018782498247387267, 'epoch': 0.53}
+ 53%|█████▎    | 3571/6779 [2:12:24<1:57:48,  2.20s/it] 53%|█████▎    | 3572/6779 [2:12:26<1:58:10,  2.21s/it]                                                       {'loss': 1.8303, 'learning_rate': 0.00018773108455090405, 'epoch': 0.53}
+ 53%|█████▎    | 3572/6779 [2:12:26<1:58:10,  2.21s/it] 53%|█████▎    | 3573/6779 [2:12:29<1:57:19,  2.20s/it]                                                       {'loss': 1.4957, 'learning_rate': 0.00018763718934239272, 'epoch': 0.53}
+ 53%|█████▎    | 3573/6779 [2:12:29<1:57:19,  2.20s/it] 53%|█████▎    | 3574/6779 [2:12:31<1:56:01,  2.17s/it]                                                       {'loss': 1.5058, 'learning_rate': 0.00018754329686911282, 'epoch': 0.53}
+ 53%|█████▎    | 3574/6779 [2:12:31<1:56:01,  2.17s/it] 53%|█████▎    | 3575/6779 [2:12:33<1:55:18,  2.16s/it]                                                       {'loss': 1.7124, 'learning_rate': 0.00018744940715183776, 'epoch': 0.53}
+ 53%|█████▎    | 3575/6779 [2:12:33<1:55:18,  2.16s/it] 53%|█████▎    | 3576/6779 [2:12:35<1:54:13,  2.14s/it]                                                       {'loss': 1.7936, 'learning_rate': 0.00018735552021134023, 'epoch': 0.53}
+ 53%|█████▎    | 3576/6779 [2:12:35<1:54:13,  2.14s/it] 53%|█████▎    | 3577/6779 [2:12:37<1:51:22,  2.09s/it]                                                       {'loss': 1.5597, 'learning_rate': 0.0001872616360683924, 'epoch': 0.53}
+ 53%|█████▎    | 3577/6779 [2:12:37<1:51:22,  2.09s/it] 53%|█████▎    | 3578/6779 [2:12:39<1:56:34,  2.19s/it]                                                       {'loss': 1.7235, 'learning_rate': 0.0001871677547437659, 'epoch': 0.53}
+ 53%|█████▎    | 3578/6779 [2:12:39<1:56:34,  2.19s/it] 53%|█████▎    | 3579/6779 [2:12:42<1:59:59,  2.25s/it]                                                       {'loss': 1.6844, 'learning_rate': 0.00018707387625823164, 'epoch': 0.53}
+ 53%|█████▎    | 3579/6779 [2:12:42<1:59:59,  2.25s/it] 53%|█████▎    | 3580/6779 [2:12:44<1:58:28,  2.22s/it]                                                       {'loss': 1.6807, 'learning_rate': 0.00018698000063255982, 'epoch': 0.53}
+ 53%|█████▎    | 3580/6779 [2:12:44<1:58:28,  2.22s/it] 53%|█████▎    | 3581/6779 [2:12:46<1:54:42,  2.15s/it]                                                       {'loss': 1.6333, 'learning_rate': 0.0001868861278875203, 'epoch': 0.53}
+ 53%|█████▎    | 3581/6779 [2:12:46<1:54:42,  2.15s/it] 53%|█████▎    | 3582/6779 [2:12:49<2:03:15,  2.31s/it]                                                       {'loss': 1.547, 'learning_rate': 0.00018679225804388202, 'epoch': 0.53}
+ 53%|█████▎    | 3582/6779 [2:12:49<2:03:15,  2.31s/it] 53%|█████▎    | 3583/6779 [2:12:51<1:59:55,  2.25s/it]                                                       {'loss': 1.5066, 'learning_rate': 0.00018669839112241344, 'epoch': 0.53}
+ 53%|█████▎    | 3583/6779 [2:12:51<1:59:55,  2.25s/it] 53%|█████▎    | 3584/6779 [2:12:53<1:57:16,  2.20s/it]                                                       {'loss': 1.5654, 'learning_rate': 0.00018660452714388225, 'epoch': 0.53}
+ 53%|█████▎    | 3584/6779 [2:12:53<1:57:16,  2.20s/it] 53%|█████▎    | 3585/6779 [2:12:55<2:01:51,  2.29s/it]                                                       {'loss': 1.6057, 'learning_rate': 0.00018651066612905554, 'epoch': 0.53}
+ 53%|█████▎    | 3585/6779 [2:12:55<2:01:51,  2.29s/it] 53%|█████▎    | 3586/6779 [2:12:57<2:00:32,  2.27s/it]                                                       {'loss': 1.7318, 'learning_rate': 0.00018641680809869976, 'epoch': 0.53}
+ 53%|█████▎    | 3586/6779 [2:12:57<2:00:32,  2.27s/it] 53%|█████▎    | 3587/6779 [2:13:00<2:02:27,  2.30s/it]                                                       {'loss': 1.9189, 'learning_rate': 0.00018632295307358064, 'epoch': 0.53}
+ 53%|█████▎    | 3587/6779 [2:13:00<2:02:27,  2.30s/it] 53%|█████▎    | 3588/6779 [2:13:02<1:58:19,  2.22s/it]                                                       {'loss': 1.7155, 'learning_rate': 0.00018622910107446344, 'epoch': 0.53}
+ 53%|█████▎    | 3588/6779 [2:13:02<1:58:19,  2.22s/it] 53%|█████▎    | 3589/6779 [2:13:04<1:56:51,  2.20s/it]                                                       {'loss': 1.7808, 'learning_rate': 0.0001861352521221125, 'epoch': 0.53}
+ 53%|█████▎    | 3589/6779 [2:13:04<1:56:51,  2.20s/it] 53%|█████▎    | 3590/6779 [2:13:06<1:58:15,  2.22s/it]                                                       {'loss': 1.5583, 'learning_rate': 0.00018604140623729163, 'epoch': 0.53}
+ 53%|█████▎    | 3590/6779 [2:13:06<1:58:15,  2.22s/it] 53%|█████▎    | 3591/6779 [2:13:09<2:00:03,  2.26s/it]                                                       {'loss': 1.7715, 'learning_rate': 0.0001859475634407639, 'epoch': 0.53}
+ 53%|█████▎    | 3591/6779 [2:13:09<2:00:03,  2.26s/it] 53%|█████▎    | 3592/6779 [2:13:11<1:56:56,  2.20s/it]                                                       {'loss': 1.6229, 'learning_rate': 0.00018585372375329177, 'epoch': 0.53}
+ 53%|█████▎    | 3592/6779 [2:13:11<1:56:56,  2.20s/it] 53%|█████▎    | 3593/6779 [2:13:13<1:56:53,  2.20s/it]                                                       {'loss': 1.6678, 'learning_rate': 0.00018575988719563694, 'epoch': 0.53}
+ 53%|█████▎    | 3593/6779 [2:13:13<1:56:53,  2.20s/it] 53%|█████▎    | 3594/6779 [2:13:15<1:55:09,  2.17s/it]                                                       {'loss': 1.6042, 'learning_rate': 0.0001856660537885603, 'epoch': 0.53}
+ 53%|█████▎    | 3594/6779 [2:13:15<1:55:09,  2.17s/it] 53%|█████▎    | 3595/6779 [2:13:17<1:51:50,  2.11s/it]                                                       {'loss': 1.4973, 'learning_rate': 0.0001855722235528224, 'epoch': 0.53}
+ 53%|█████▎    | 3595/6779 [2:13:17<1:51:50,  2.11s/it] 53%|█████▎    | 3596/6779 [2:13:20<2:03:58,  2.34s/it]                                                       {'loss': 1.6238, 'learning_rate': 0.0001854783965091828, 'epoch': 0.53}
+ 53%|█████▎    | 3596/6779 [2:13:20<2:03:58,  2.34s/it] 53%|█████▎    | 3597/6779 [2:13:22<2:03:32,  2.33s/it]                                                       {'loss': 1.6284, 'learning_rate': 0.0001853845726784004, 'epoch': 0.53}
+ 53%|█████▎    | 3597/6779 [2:13:22<2:03:32,  2.33s/it] 53%|█████▎    | 3598/6779 [2:13:24<2:00:28,  2.27s/it]                                                       {'loss': 1.6725, 'learning_rate': 0.00018529075208123343, 'epoch': 0.53}
+ 53%|█████▎    | 3598/6779 [2:13:24<2:00:28,  2.27s/it] 53%|█████▎    | 3599/6779 [2:13:27<2:00:37,  2.28s/it]                                                       {'loss': 1.6866, 'learning_rate': 0.0001851969347384394, 'epoch': 0.53}
+ 53%|█████▎    | 3599/6779 [2:13:27<2:00:37,  2.28s/it] 53%|█████▎    | 3600/6779 [2:13:29<1:57:57,  2.23s/it]                                                       {'loss': 1.5589, 'learning_rate': 0.00018510312067077507, 'epoch': 0.53}
+ 53%|█████▎    | 3600/6779 [2:13:29<1:57:57,  2.23s/it] 53%|█████▎    | 3601/6779 [2:13:31<1:56:14,  2.19s/it]                                                       {'loss': 1.8507, 'learning_rate': 0.00018500930989899652, 'epoch': 0.53}
+ 53%|█████▎    | 3601/6779 [2:13:31<1:56:14,  2.19s/it] 53%|█████▎    | 3602/6779 [2:13:33<1:55:27,  2.18s/it]                                                       {'loss': 1.7288, 'learning_rate': 0.00018491550244385897, 'epoch': 0.53}
+ 53%|█████▎    | 3602/6779 [2:13:33<1:55:27,  2.18s/it] 53%|█████▎    | 3603/6779 [2:13:35<1:56:41,  2.20s/it]                                                       {'loss': 1.6522, 'learning_rate': 0.00018482169832611714, 'epoch': 0.53}
+ 53%|█████▎    | 3603/6779 [2:13:35<1:56:41,  2.20s/it] 53%|█████▎    | 3604/6779 [2:13:37<1:55:11,  2.18s/it]                                                       {'loss': 1.8538, 'learning_rate': 0.00018472789756652488, 'epoch': 0.53}
+ 53%|█████▎    | 3604/6779 [2:13:37<1:55:11,  2.18s/it] 53%|█████▎    | 3605/6779 [2:13:40<1:55:57,  2.19s/it]                                                       {'loss': 1.7357, 'learning_rate': 0.00018463410018583525, 'epoch': 0.53}
+ 53%|█████▎    | 3605/6779 [2:13:40<1:55:57,  2.19s/it] 53%|█████▎    | 3606/6779 [2:13:42<1:55:49,  2.19s/it]                                                       {'loss': 1.8936, 'learning_rate': 0.00018454030620480063, 'epoch': 0.53}
+ 53%|█████▎    | 3606/6779 [2:13:42<1:55:49,  2.19s/it] 53%|█████▎    | 3607/6779 [2:13:44<1:55:07,  2.18s/it]                                                       {'loss': 1.514, 'learning_rate': 0.00018444651564417263, 'epoch': 0.53}
+ 53%|█████▎    | 3607/6779 [2:13:44<1:55:07,  2.18s/it] 53%|█████▎    | 3608/6779 [2:13:46<1:53:20,  2.14s/it]                                                       {'loss': 1.685, 'learning_rate': 0.0001843527285247021, 'epoch': 0.53}
+ 53%|█████▎    | 3608/6779 [2:13:46<1:53:20,  2.14s/it] 53%|██���██▎    | 3609/6779 [2:13:48<1:49:54,  2.08s/it]                                                       {'loss': 1.5852, 'learning_rate': 0.00018425894486713912, 'epoch': 0.53}
+ 53%|█████▎    | 3609/6779 [2:13:48<1:49:54,  2.08s/it] 53%|█████▎    | 3610/6779 [2:13:50<1:50:56,  2.10s/it]                                                       {'loss': 1.6774, 'learning_rate': 0.00018416516469223305, 'epoch': 0.53}
+ 53%|█████▎    | 3610/6779 [2:13:50<1:50:56,  2.10s/it] 53%|█████▎    | 3611/6779 [2:13:52<1:52:37,  2.13s/it]                                                       {'loss': 1.79, 'learning_rate': 0.00018407138802073244, 'epoch': 0.53}
+ 53%|█████▎    | 3611/6779 [2:13:52<1:52:37,  2.13s/it] 53%|█████▎    | 3612/6779 [2:13:54<1:53:44,  2.16s/it]                                                       {'loss': 1.7156, 'learning_rate': 0.00018397761487338503, 'epoch': 0.53}
+ 53%|█████▎    | 3612/6779 [2:13:54<1:53:44,  2.16s/it] 53%|█████▎    | 3613/6779 [2:13:57<1:52:15,  2.13s/it]                                                       {'loss': 1.6343, 'learning_rate': 0.00018388384527093788, 'epoch': 0.53}
+ 53%|█████▎    | 3613/6779 [2:13:57<1:52:15,  2.13s/it] 53%|█████▎    | 3614/6779 [2:13:59<1:51:24,  2.11s/it]                                                       {'loss': 1.7861, 'learning_rate': 0.00018379007923413718, 'epoch': 0.53}
+ 53%|█████▎    | 3614/6779 [2:13:59<1:51:24,  2.11s/it] 53%|█████▎    | 3615/6779 [2:14:01<1:53:18,  2.15s/it]                                                       {'loss': 1.5993, 'learning_rate': 0.00018369631678372836, 'epoch': 0.53}
+ 53%|█████▎    | 3615/6779 [2:14:01<1:53:18,  2.15s/it] 53%|█████▎    | 3616/6779 [2:14:03<1:49:44,  2.08s/it]                                                       {'loss': 1.6086, 'learning_rate': 0.000183602557940456, 'epoch': 0.53}
+ 53%|█████▎    | 3616/6779 [2:14:03<1:49:44,  2.08s/it] 53%|█████▎    | 3617/6779 [2:14:05<1:53:15,  2.15s/it]                                                       {'loss': 1.608, 'learning_rate': 0.00018350880272506405, 'epoch': 0.53}
+ 53%|█████▎    | 3617/6779 [2:14:05<1:53:15,  2.15s/it] 53%|█████▎    | 3618/6779 [2:14:07<1:52:32,  2.14s/it]                                                       {'loss': 1.6391, 'learning_rate': 0.0001834150511582955, 'epoch': 0.53}
+ 53%|█████▎    | 3618/6779 [2:14:07<1:52:32,  2.14s/it] 53%|█████▎    | 3619/6779 [2:14:09<1:54:06,  2.17s/it]                                                       {'loss': 1.7144, 'learning_rate': 0.00018332130326089251, 'epoch': 0.53}
+ 53%|█████▎    | 3619/6779 [2:14:09<1:54:06,  2.17s/it] 53%|█████▎    | 3620/6779 [2:14:12<1:56:45,  2.22s/it]                                                       {'loss': 1.6485, 'learning_rate': 0.00018322755905359657, 'epoch': 0.53}
+ 53%|█████▎    | 3620/6779 [2:14:12<1:56:45,  2.22s/it] 53%|█████▎    | 3621/6779 [2:14:14<1:57:12,  2.23s/it]                                                       {'loss': 1.5918, 'learning_rate': 0.0001831338185571483, 'epoch': 0.53}
+ 53%|█████▎    | 3621/6779 [2:14:14<1:57:12,  2.23s/it] 53%|█████▎    | 3622/6779 [2:14:16<1:56:52,  2.22s/it]                                                       {'loss': 1.6462, 'learning_rate': 0.0001830400817922874, 'epoch': 0.53}
+ 53%|█████▎    | 3622/6779 [2:14:16<1:56:52,  2.22s/it] 53%|█████▎    | 3623/6779 [2:14:18<1:54:32,  2.18s/it]                                                       {'loss': 1.6356, 'learning_rate': 0.00018294634877975282, 'epoch': 0.53}
+ 53%|█████▎    | 3623/6779 [2:14:18<1:54:32,  2.18s/it] 53%|█████▎    | 3624/6779 [2:14:20<1:53:28,  2.16s/it]                                                       {'loss': 1.7063, 'learning_rate': 0.00018285261954028274, 'epoch': 0.53}
+ 53%|█████▎    | 3624/6779 [2:14:20<1:53:28,  2.16s/it] 53%|█████▎    | 3625/6779 [2:14:23<1:53:03,  2.15s/it]                                                       {'loss': 1.6266, 'learning_rate': 0.00018275889409461447, 'epoch': 0.53}
+ 53%|█████▎    | 3625/6779 [2:14:23<1:53:03,  2.15s/it] 53%|█████▎    | 3626/6779 [2:14:25<1:54:35,  2.18s/it]                                                       {'loss': 1.5392, 'learning_rate': 0.00018266517246348437, 'epoch': 0.53}
+ 53%|█████▎    | 3626/6779 [2:14:25<1:54:35,  2.18s/it] 54%|█████▎    | 3627/6779 [2:14:27<1:53:42,  2.16s/it]                                                       {'loss': 1.5917, 'learning_rate': 0.00018257145466762812, 'epoch': 0.54}
+ 54%|█████▎    | 3627/6779 [2:14:27<1:53:42,  2.16s/it] 54%|█████▎    | 3628/6779 [2:14:29<1:55:47,  2.20s/it]                                                       {'loss': 1.5856, 'learning_rate': 0.00018247774072778042, 'epoch': 0.54}
+ 54%|█████▎    | 3628/6779 [2:14:29<1:55:47,  2.20s/it] 54%|█████▎    | 3629/6779 [2:14:31<1:54:39,  2.18s/it]                                                       {'loss': 1.7267, 'learning_rate': 0.0001823840306646752, 'epoch': 0.54}
+ 54%|█████▎    | 3629/6779 [2:14:31<1:54:39,  2.18s/it] 54%|█████▎    | 3630/6779 [2:14:34<1:56:50,  2.23s/it]                                                       {'loss': 1.786, 'learning_rate': 0.00018229032449904546, 'epoch': 0.54}
+ 54%|█████▎    | 3630/6779 [2:14:34<1:56:50,  2.23s/it] 54%|█████▎    | 3631/6779 [2:14:36<1:54:46,  2.19s/it]                                                       {'loss': 1.7513, 'learning_rate': 0.00018219662225162347, 'epoch': 0.54}
+ 54%|█████▎    | 3631/6779 [2:14:36<1:54:46,  2.19s/it] 54%|█████▎    | 3632/6779 [2:14:38<1:57:55,  2.25s/it]                                                       {'loss': 1.7895, 'learning_rate': 0.0001821029239431405, 'epoch': 0.54}
+ 54%|█████▎    | 3632/6779 [2:14:38<1:57:55,  2.25s/it] 54%|█████▎    | 3633/6779 [2:14:40<1:53:18,  2.16s/it]                                                       {'loss': 1.5635, 'learning_rate': 0.000182009229594327, 'epoch': 0.54}
+ 54%|█████▎    | 3633/6779 [2:14:40<1:53:18,  2.16s/it] 54%|█████▎    | 3634/6779 [2:14:42<1:55:31,  2.20s/it]                                                       {'loss': 1.5481, 'learning_rate': 0.00018191553922591248, 'epoch': 0.54}
+ 54%|█████▎    | 3634/6779 [2:14:42<1:55:31,  2.20s/it] 54%|█████▎    | 3635/6779 [2:14:45<1:55:13,  2.20s/it]                                                       {'loss': 1.7595, 'learning_rate': 0.00018182185285862571, 'epoch': 0.54}
+ 54%|█████▎    | 3635/6779 [2:14:45<1:55:13,  2.20s/it] 54%|█████▎    | 3636/6779 [2:14:47<1:56:56,  2.23s/it]                                                       {'loss': 1.8361, 'learning_rate': 0.00018172817051319447, 'epoch': 0.54}
+ 54%|█████▎    | 3636/6779 [2:14:47<1:56:56,  2.23s/it] 54%|█████▎    | 3637/6779 [2:14:50<2:04:46,  2.38s/it]                                                       {'loss': 1.6654, 'learning_rate': 0.00018163449221034555, 'epoch': 0.54}
+ 54%|█████▎    | 3637/6779 [2:14:50<2:04:46,  2.38s/it] 54%|█████▎    | 3638/6779 [2:14:52<2:02:42,  2.34s/it]                                                       {'loss': 1.665, 'learning_rate': 0.00018154081797080524, 'epoch': 0.54}
+ 54%|█████▎    | 3638/6779 [2:14:52<2:02:42,  2.34s/it] 54%|█████▎    | 3639/6779 [2:14:54<1:59:43,  2.29s/it]                                                       {'loss': 1.5614, 'learning_rate': 0.00018144714781529844, 'epoch': 0.54}
+ 54%|█████▎    | 3639/6779 [2:14:54<1:59:43,  2.29s/it] 54%|█████▎    | 3640/6779 [2:14:56<2:00:51,  2.31s/it]                                                       {'loss': 1.6885, 'learning_rate': 0.00018135348176454943, 'epoch': 0.54}
+ 54%|█████▎    | 3640/6779 [2:14:56<2:00:51,  2.31s/it] 54%|█████▎    | 3641/6779 [2:14:59<1:59:43,  2.29s/it]                                                       {'loss': 1.6832, 'learning_rate': 0.0001812598198392815, 'epoch': 0.54}
+ 54%|█████▎    | 3641/6779 [2:14:59<1:59:43,  2.29s/it] 54%|█████▎    | 3642/6779 [2:15:01<1:58:43,  2.27s/it]                                                       {'loss': 1.8746, 'learning_rate': 0.00018116616206021705, 'epoch': 0.54}
+ 54%|█████▎    | 3642/6779 [2:15:01<1:58:43,  2.27s/it] 54%|█████▎    | 3643/6779 [2:15:03<1:56:45,  2.23s/it]                                                       {'loss': 1.7233, 'learning_rate': 0.00018107250844807754, 'epoch': 0.54}
+ 54%|█████▎    | 3643/6779 [2:15:03<1:56:45,  2.23s/it] 54%|█████▍    | 3644/6779 [2:15:05<1:58:18,  2.26s/it]                                                       {'loss': 1.7125, 'learning_rate': 0.00018097885902358348, 'epoch': 0.54}
+ 54%|█████▍    | 3644/6779 [2:15:05<1:58:18,  2.26s/it] 54%|█████▍    | 3645/6779 [2:15:08<1:56:32,  2.23s/it]                                                       {'loss': 1.6465, 'learning_rate': 0.00018088521380745466, 'epoch': 0.54}
+ 54%|█████▍    | 3645/6779 [2:15:08<1:56:32,  2.23s/it] 54%|█████▍    | 3646/6779 [2:15:10<1:56:08,  2.22s/it]                                                       {'loss': 1.5254, 'learning_rate': 0.00018079157282040973, 'epoch': 0.54}
+ 54%|█████▍    | 3646/6779 [2:15:10<1:56:08,  2.22s/it] 54%|█████▍    | 3647/6779 [2:15:12<1:55:04,  2.20s/it]                                                       {'loss': 1.7839, 'learning_rate': 0.00018069793608316634, 'epoch': 0.54}
+ 54%|█████▍    | 3647/6779 [2:15:12<1:55:04,  2.20s/it] 54%|█████▍    | 3648/6779 [2:15:14<1:53:44,  2.18s/it]                                                       {'loss': 1.6952, 'learning_rate': 0.00018060430361644138, 'epoch': 0.54}
+ 54%|█████▍    | 3648/6779 [2:15:14<1:53:44,  2.18s/it] 54%|█████▍    | 3649/6779 [2:15:16<1:54:50,  2.20s/it]                                                       {'loss': 1.6472, 'learning_rate': 0.0001805106754409507, 'epoch': 0.54}
+ 54%|█████▍    | 3649/6779 [2:15:16<1:54:50,  2.20s/it] 54%|█████▍    | 3650/6779 [2:15:19<1:58:52,  2.28s/it]                                                       {'loss': 1.5257, 'learning_rate': 0.0001804170515774093, 'epoch': 0.54}
+ 54%|█████▍    | 3650/6779 [2:15:19<1:58:52,  2.28s/it] 54%|█████▍    | 3651/6779 [2:15:21<1:58:35,  2.27s/it]                                                       {'loss': 1.7858, 'learning_rate': 0.00018032343204653096, 'epoch': 0.54}
+ 54%|█████▍    | 3651/6779 [2:15:21<1:58:35,  2.27s/it] 54%|█████▍    | 3652/6779 [2:15:23<1:56:57,  2.24s/it]                                                       {'loss': 1.8239, 'learning_rate': 0.00018022981686902895, 'epoch': 0.54}
+ 54%|█████▍    | 3652/6779 [2:15:23<1:56:57,  2.24s/it] 54%|█████▍    | 3653/6779 [2:15:25<1:58:25,  2.27s/it]                                                       {'loss': 1.6951, 'learning_rate': 0.00018013620606561519, 'epoch': 0.54}
+ 54%|█████▍    | 3653/6779 [2:15:25<1:58:25,  2.27s/it] 54%|█████▍    | 3654/6779 [2:15:28<1:54:33,  2.20s/it]                                                       {'loss': 1.6776, 'learning_rate': 0.00018004259965700078, 'epoch': 0.54}
+ 54%|█████▍    | 3654/6779 [2:15:28<1:54:33,  2.20s/it] 54%|█████▍    | 3655/6779 [2:15:30<1:54:36,  2.20s/it]                                                       {'loss': 1.6528, 'learning_rate': 0.0001799489976638959, 'epoch': 0.54}
+ 54%|█████▍    | 3655/6779 [2:15:30<1:54:36,  2.20s/it] 54%|█████▍    | 3656/6779 [2:15:32<1:58:38,  2.28s/it]                                                       {'loss': 1.7647, 'learning_rate': 0.00017985540010700957, 'epoch': 0.54}
+ 54%|█████▍    | 3656/6779 [2:15:32<1:58:38,  2.28s/it] 54%|█████▍    | 3657/6779 [2:15:34<1:56:40,  2.24s/it]                                                       {'loss': 1.7045, 'learning_rate': 0.00017976180700704996, 'epoch': 0.54}
+ 54%|█████▍    | 3657/6779 [2:15:34<1:56:40,  2.24s/it] 54%|█████▍    | 3658/6779 [2:15:36<1:54:12,  2.20s/it]                                                       {'loss': 1.4837, 'learning_rate': 0.00017966821838472422, 'epoch': 0.54}
+ 54%|█████▍    | 3658/6779 [2:15:36<1:54:12,  2.20s/it] 54%|█████▍    | 3659/6779 [2:15:39<1:52:58,  2.17s/it]                                                       {'loss': 1.8004, 'learning_rate': 0.00017957463426073863, 'epoch': 0.54}
+ 54%|█████▍    | 3659/6779 [2:15:39<1:52:58,  2.17s/it] 54%|█████▍    | 3660/6779 [2:15:41<1:53:55,  2.19s/it]                                                       {'loss': 1.9135, 'learning_rate': 0.00017948105465579833, 'epoch': 0.54}
+ 54%|█████▍    | 3660/6779 [2:15:41<1:53:55,  2.19s/it] 54%|█████▍    | 3661/6779 [2:15:43<1:55:14,  2.22s/it]                                                       {'loss': 1.7548, 'learning_rate': 0.00017938747959060747, 'epoch': 0.54}
+ 54%|█████▍    | 3661/6779 [2:15:43<1:55:14,  2.22s/it] 54%|█████▍    | 3662/6779 [2:15:45<1:55:05,  2.22s/it]                                                       {'loss': 1.5421, 'learning_rate': 0.00017929390908586924, 'epoch': 0.54}
+ 54%|█████▍    | 3662/6779 [2:15:45<1:55:05,  2.22s/it] 54%|█████▍    | 3663/6779 [2:15:48<1:59:27,  2.30s/it]                                                       {'loss': 1.6909, 'learning_rate': 0.00017920034316228582, 'epoch': 0.54}
+ 54%|█████▍    | 3663/6779 [2:15:48<1:59:27,  2.30s/it] 54%|█████▍    | 3664/6779 [2:15:50<1:58:34,  2.28s/it]                                                       {'loss': 1.6907, 'learning_rate': 0.0001791067818405584, 'epoch': 0.54}
+ 54%|█████▍    | 3664/6779 [2:15:50<1:58:34,  2.28s/it] 54%|█████▍    | 3665/6779 [2:15:53<2:11:32,  2.53s/it]                                                       {'loss': 1.6753, 'learning_rate': 0.00017901322514138693, 'epoch': 0.54}
+ 54%|█████▍    | 3665/6779 [2:15:53<2:11:32,  2.53s/it] 54%|█████▍    | 3666/6779 [2:15:55<2:04:17,  2.40s/it]                                                       {'loss': 1.7582, 'learning_rate': 0.00017891967308547075, 'epoch': 0.54}
+ 54%|█████▍    | 3666/6779 [2:15:55<2:04:17,  2.40s/it] 54%|█████▍    | 3667/6779 [2:15:57<1:58:52,  2.29s/it]                                                       {'loss': 1.5952, 'learning_rate': 0.00017882612569350786, 'epoch': 0.54}
+ 54%|█████▍    | 3667/6779 [2:15:57<1:58:52,  2.29s/it] 54%|█████▍    | 3668/6779 [2:15:59<1:55:35,  2.23s/it]                                                       {'loss': 1.6551, 'learning_rate': 0.0001787325829861953, 'epoch': 0.54}
+ 54%|█████▍    | 3668/6779 [2:15:59<1:55:35,  2.23s/it] 54%|█████▍    | 3669/6779 [2:16:01<1:52:58,  2.18s/it]                                                       {'loss': 1.6626, 'learning_rate': 0.0001786390449842291, 'epoch': 0.54}
+ 54%|█████▍    | 3669/6779 [2:16:01<1:52:58,  2.18s/it] 54%|█████▍    | 3670/6779 [2:16:04<1:51:54,  2.16s/it]                                                       {'loss': 1.6185, 'learning_rate': 0.00017854551170830423, 'epoch': 0.54}
+ 54%|█████▍    | 3670/6779 [2:16:04<1:51:54,  2.16s/it] 54%|█████▍    | 3671/6779 [2:16:06<1:56:37,  2.25s/it]                                                       {'loss': 1.7401, 'learning_rate': 0.00017845198317911466, 'epoch': 0.54}
+ 54%|█████▍    | 3671/6779 [2:16:06<1:56:37,  2.25s/it] 54%|█████▍    | 3672/6779 [2:16:08<1:56:23,  2.25s/it]                                                       {'loss': 1.7297, 'learning_rate': 0.0001783584594173532, 'epoch': 0.54}
+ 54%|█████▍    | 3672/6779 [2:16:08<1:56:23,  2.25s/it] 54%|█████▍    | 3673/6779 [2:16:10<1:56:07,  2.24s/it]                                                       {'loss': 1.6132, 'learning_rate': 0.0001782649404437117, 'epoch': 0.54}
+ 54%|█████▍    | 3673/6779 [2:16:10<1:56:07,  2.24s/it] 54%|█████▍    | 3674/6779 [2:16:13<2:01:10,  2.34s/it]                                                       {'loss': 1.7688, 'learning_rate': 0.00017817142627888098, 'epoch': 0.54}
+ 54%|█████▍    | 3674/6779 [2:16:13<2:01:10,  2.34s/it] 54%|█████▍    | 3675/6779 [2:16:15<1:56:25,  2.25s/it]                                                       {'loss': 1.6571, 'learning_rate': 0.00017807791694355072, 'epoch': 0.54}
+ 54%|█████▍    | 3675/6779 [2:16:15<1:56:25,  2.25s/it] 54%|█████▍    | 3676/6779 [2:16:17<1:54:32,  2.21s/it]                                                       {'loss': 1.667, 'learning_rate': 0.0001779844124584095, 'epoch': 0.54}
+ 54%|█████▍    | 3676/6779 [2:16:17<1:54:32,  2.21s/it] 54%|█████▍    | 3677/6779 [2:16:19<1:52:26,  2.17s/it]                                                       {'loss': 1.8199, 'learning_rate': 0.00017789091284414497, 'epoch': 0.54}
+ 54%|█████▍    | 3677/6779 [2:16:19<1:52:26,  2.17s/it] 54%|█████▍    | 3678/6779 [2:16:21<1:52:22,  2.17s/it]                                                       {'loss': 1.6583, 'learning_rate': 0.00017779741812144352, 'epoch': 0.54}
+ 54%|█████▍    | 3678/6779 [2:16:21<1:52:22,  2.17s/it] 54%|█████▍    | 3679/6779 [2:16:24<1:52:24,  2.18s/it]                                                       {'loss': 1.6978, 'learning_rate': 0.0001777039283109906, 'epoch': 0.54}
+ 54%|█████▍    | 3679/6779 [2:16:24<1:52:24,  2.18s/it] 54%|█████▍    | 3680/6779 [2:16:26<1:56:17,  2.25s/it]                                                       {'loss': 1.7201, 'learning_rate': 0.00017761044343347047, 'epoch': 0.54}
+ 54%|█████▍    | 3680/6779 [2:16:26<1:56:17,  2.25s/it] 54%|█████▍    | 3681/6779 [2:16:28<1:53:18,  2.19s/it]                                                       {'loss': 1.8245, 'learning_rate': 0.00017751696350956647, 'epoch': 0.54}
+ 54%|█████▍    | 3681/6779 [2:16:28<1:53:18,  2.19s/it] 54%|█████▍    | 3682/6779 [2:16:30<1:55:07,  2.23s/it]                                                       {'loss': 1.5766, 'learning_rate': 0.00017742348855996062, 'epoch': 0.54}
+ 54%|█████▍    | 3682/6779 [2:16:30<1:55:07,  2.23s/it] 54%|█████▍    | 3683/6779 [2:16:33<1:54:35,  2.22s/it]                                                       {'loss': 1.8581, 'learning_rate': 0.000177330018605334, 'epoch': 0.54}
+ 54%|█████▍    | 3683/6779 [2:16:33<1:54:35,  2.22s/it] 54%|█████▍    | 3684/6779 [2:16:35<1:53:58,  2.21s/it]                                                       {'loss': 1.6881, 'learning_rate': 0.00017723655366636655, 'epoch': 0.54}
+ 54%|█████▍    | 3684/6779 [2:16:35<1:53:58,  2.21s/it] 54%|█████▍    | 3685/6779 [2:16:37<1:56:47,  2.26s/it]                                                       {'loss': 1.6321, 'learning_rate': 0.00017714309376373698, 'epoch': 0.54}
+ 54%|█████▍    | 3685/6779 [2:16:37<1:56:47,  2.26s/it] 54%|█████▍    | 3686/6779 [2:16:39<1:52:38,  2.19s/it]                                                       {'loss': 1.7543, 'learning_rate': 0.0001770496389181231, 'epoch': 0.54}
+ 54%|█████▍    | 3686/6779 [2:16:39<1:52:38,  2.19s/it] 54%|█████▍    | 3687/6779 [2:16:42<1:56:43,  2.27s/it]                                                       {'loss': 1.7112, 'learning_rate': 0.0001769561891502014, 'epoch': 0.54}
+ 54%|█████▍    | 3687/6779 [2:16:42<1:56:43,  2.27s/it] 54%|█████▍    | 3688/6779 [2:16:44<1:56:25,  2.26s/it]                                                       {'loss': 1.6851, 'learning_rate': 0.00017686274448064742, 'epoch': 0.54}
+ 54%|█████▍    | 3688/6779 [2:16:44<1:56:25,  2.26s/it] 54%|█████▍    | 3689/6779 [2:16:46<1:54:24,  2.22s/it]                                                       {'loss': 1.5084, 'learning_rate': 0.00017676930493013544, 'epoch': 0.54}
+ 54%|█████▍    | 3689/6779 [2:16:46<1:54:24,  2.22s/it] 54%|█████▍    | 3690/6779 [2:16:48<1:54:49,  2.23s/it]                                                       {'loss': 1.5135, 'learning_rate': 0.00017667587051933866, 'epoch': 0.54}
+ 54%|█████▍    | 3690/6779 [2:16:48<1:54:49,  2.23s/it] 54%|█████▍    | 3691/6779 [2:16:50<1:53:40,  2.21s/it]                                                       {'loss': 1.7996, 'learning_rate': 0.0001765824412689291, 'epoch': 0.54}
+ 54%|█████▍    | 3691/6779 [2:16:50<1:53:40,  2.21s/it] 54%|█████▍    | 3692/6779 [2:16:53<1:57:05,  2.28s/it]                                                       {'loss': 1.6667, 'learning_rate': 0.00017648901719957775, 'epoch': 0.54}
+ 54%|█████▍    | 3692/6779 [2:16:53<1:57:05,  2.28s/it] 54%|█████▍    | 3693/6779 [2:16:55<1:55:50,  2.25s/it]                                                       {'loss': 1.6528, 'learning_rate': 0.00017639559833195436, 'epoch': 0.54}
+ 54%|█████▍    | 3693/6779 [2:16:55<1:55:50,  2.25s/it] 54%|█████▍    | 3694/6779 [2:16:57<1:53:46,  2.21s/it]                                                       {'loss': 1.538, 'learning_rate': 0.00017630218468672745, 'epoch': 0.54}
+ 54%|█████▍    | 3694/6779 [2:16:57<1:53:46,  2.21s/it] 55%|█████▍    | 3695/6779 [2:16:59<1:51:05,  2.16s/it]                                                       {'loss': 1.6274, 'learning_rate': 0.00017620877628456464, 'epoch': 0.55}
+ 55%|█████▍    | 3695/6779 [2:16:59<1:51:05,  2.16s/it] 55%|█████▍    | 3696/6779 [2:17:02<1:54:15,  2.22s/it]                                                       {'loss': 1.7577, 'learning_rate': 0.00017611537314613215, 'epoch': 0.55}
+ 55%|█████▍    | 3696/6779 [2:17:02<1:54:15,  2.22s/it] 55%|█████▍    | 3697/6779 [2:17:04<1:51:49,  2.18s/it]                                                       {'loss': 1.7007, 'learning_rate': 0.0001760219752920951, 'epoch': 0.55}
+ 55%|█████▍    | 3697/6779 [2:17:04<1:51:49,  2.18s/it] 55%|█████▍    | 3698/6779 [2:17:06<1:54:03,  2.22s/it]                                                       {'loss': 1.6449, 'learning_rate': 0.0001759285827431175, 'epoch': 0.55}
+ 55%|█████▍    | 3698/6779 [2:17:06<1:54:03,  2.22s/it] 55%|█████▍    | 3699/6779 [2:17:08<1:57:06,  2.28s/it]                                                       {'loss': 1.5096, 'learning_rate': 0.00017583519551986213, 'epoch': 0.55}
+ 55%|█████▍    | 3699/6779 [2:17:08<1:57:06,  2.28s/it] 55%|█████▍    | 3700/6779 [2:17:11<1:54:55,  2.24s/it]                                                       {'loss': 1.6715, 'learning_rate': 0.0001757418136429906, 'epoch': 0.55}
+ 55%|█████▍    | 3700/6779 [2:17:11<1:54:55,  2.24s/it] 55%|█████▍    | 3701/6779 [2:17:13<1:55:39,  2.25s/it]                                                       {'loss': 1.8116, 'learning_rate': 0.00017564843713316334, 'epoch': 0.55}
+ 55%|█████▍    | 3701/6779 [2:17:13<1:55:39,  2.25s/it] 55%|█████▍    | 3702/6779 [2:17:15<1:52:39,  2.20s/it]                                                       {'loss': 1.6577, 'learning_rate': 0.0001755550660110396, 'epoch': 0.55}
+ 55%|█████▍    | 3702/6779 [2:17:15<1:52:39,  2.20s/it] 55%|█████▍    | 3703/6779 [2:17:17<1:53:36,  2.22s/it]                                                       {'loss': 1.7302, 'learning_rate': 0.0001754617002972775, 'epoch': 0.55}
+ 55%|█████▍    | 3703/6779 [2:17:17<1:53:36,  2.22s/it] 55%|█████▍    | 3704/6779 [2:17:19<1:53:39,  2.22s/it]                                                       {'loss': 1.7943, 'learning_rate': 0.0001753683400125338, 'epoch': 0.55}
+ 55%|█████▍    | 3704/6779 [2:17:19<1:53:39,  2.22s/it] 55%|████���▍    | 3705/6779 [2:17:21<1:52:00,  2.19s/it]                                                       {'loss': 1.7165, 'learning_rate': 0.00017527498517746421, 'epoch': 0.55}
+ 55%|█████▍    | 3705/6779 [2:17:22<1:52:00,  2.19s/it] 55%|█████▍    | 3706/6779 [2:17:24<1:50:03,  2.15s/it]                                                       {'loss': 1.7664, 'learning_rate': 0.00017518163581272317, 'epoch': 0.55}
+ 55%|█████▍    | 3706/6779 [2:17:24<1:50:03,  2.15s/it] 55%|█████▍    | 3707/6779 [2:17:26<1:53:06,  2.21s/it]                                                       {'loss': 1.6438, 'learning_rate': 0.00017508829193896394, 'epoch': 0.55}
+ 55%|█████▍    | 3707/6779 [2:17:26<1:53:06,  2.21s/it] 55%|█████▍    | 3708/6779 [2:17:28<1:56:02,  2.27s/it]                                                       {'loss': 1.794, 'learning_rate': 0.0001749949535768384, 'epoch': 0.55}
+ 55%|█████▍    | 3708/6779 [2:17:28<1:56:02,  2.27s/it] 55%|█████▍    | 3709/6779 [2:17:31<1:56:09,  2.27s/it]                                                       {'loss': 1.7149, 'learning_rate': 0.00017490162074699768, 'epoch': 0.55}
+ 55%|█████▍    | 3709/6779 [2:17:31<1:56:09,  2.27s/it] 55%|█████▍    | 3710/6779 [2:17:33<1:56:53,  2.29s/it]                                                       {'loss': 1.6027, 'learning_rate': 0.00017480829347009107, 'epoch': 0.55}
+ 55%|█████▍    | 3710/6779 [2:17:33<1:56:53,  2.29s/it] 55%|█████▍    | 3711/6779 [2:17:35<1:57:51,  2.30s/it]                                                       {'loss': 1.7148, 'learning_rate': 0.00017471497176676707, 'epoch': 0.55}
+ 55%|█████▍    | 3711/6779 [2:17:35<1:57:51,  2.30s/it] 55%|█████▍    | 3712/6779 [2:17:38<1:57:20,  2.30s/it]                                                       {'loss': 1.7758, 'learning_rate': 0.0001746216556576727, 'epoch': 0.55}
+ 55%|█████▍    | 3712/6779 [2:17:38<1:57:20,  2.30s/it] 55%|█████▍    | 3713/6779 [2:17:41<2:14:11,  2.63s/it]                                                       {'loss': 1.649, 'learning_rate': 0.00017452834516345394, 'epoch': 0.55}
+ 55%|█████▍    | 3713/6779 [2:17:41<2:14:11,  2.63s/it] 55%|█████▍    | 3714/6779 [2:17:43<2:07:07,  2.49s/it]                                                       {'loss': 1.8308, 'learning_rate': 0.00017443504030475535, 'epoch': 0.55}
+ 55%|█████▍    | 3714/6779 [2:17:43<2:07:07,  2.49s/it] 55%|█████▍    | 3715/6779 [2:17:45<2:01:59,  2.39s/it]                                                       {'loss': 1.6431, 'learning_rate': 0.0001743417411022203, 'epoch': 0.55}
+ 55%|█████▍    | 3715/6779 [2:17:45<2:01:59,  2.39s/it] 55%|█████▍    | 3716/6779 [2:17:47<1:59:13,  2.34s/it]                                                       {'loss': 1.6688, 'learning_rate': 0.0001742484475764911, 'epoch': 0.55}
+ 55%|█████▍    | 3716/6779 [2:17:47<1:59:13,  2.34s/it] 55%|█████▍    | 3717/6779 [2:17:50<2:00:43,  2.37s/it]                                                       {'loss': 1.6421, 'learning_rate': 0.0001741551597482085, 'epoch': 0.55}
+ 55%|█████▍    | 3717/6779 [2:17:50<2:00:43,  2.37s/it] 55%|█████▍    | 3718/6779 [2:17:52<1:56:13,  2.28s/it]                                                       {'loss': 1.7424, 'learning_rate': 0.00017406187763801222, 'epoch': 0.55}
+ 55%|█████▍    | 3718/6779 [2:17:52<1:56:13,  2.28s/it] 55%|█████▍    | 3719/6779 [2:17:54<1:54:23,  2.24s/it]                                                       {'loss': 1.6269, 'learning_rate': 0.0001739686012665405, 'epoch': 0.55}
+ 55%|█████▍    | 3719/6779 [2:17:54<1:54:23,  2.24s/it] 55%|█████▍    | 3720/6779 [2:17:56<1:50:34,  2.17s/it]                                                       {'loss': 1.6691, 'learning_rate': 0.00017387533065443052, 'epoch': 0.55}
+ 55%|█████▍    | 3720/6779 [2:17:56<1:50:34,  2.17s/it] 55%|█████▍    | 3721/6779 [2:17:58<1:48:57,  2.14s/it]                                                       {'loss': 1.571, 'learning_rate': 0.00017378206582231807, 'epoch': 0.55}
+ 55%|█████▍    | 3721/6779 [2:17:58<1:48:57,  2.14s/it] 55%|█████▍    | 3722/6779 [2:18:00<1:50:22,  2.17s/it]                                                       {'loss': 1.7353, 'learning_rate': 0.00017368880679083756, 'epoch': 0.55}
+ 55%|█████▍    | 3722/6779 [2:18:00<1:50:22,  2.17s/it] 55%|█████▍    | 3723/6779 [2:18:03<1:49:41,  2.15s/it]                                                       {'loss': 1.8588, 'learning_rate': 0.0001735955535806225, 'epoch': 0.55}
+ 55%|█████▍    | 3723/6779 [2:18:03<1:49:41,  2.15s/it] 55%|█████▍    | 3724/6779 [2:18:05<1:48:15,  2.13s/it]                                                       {'loss': 1.7388, 'learning_rate': 0.00017350230621230472, 'epoch': 0.55}
+ 55%|█████▍    | 3724/6779 [2:18:05<1:48:15,  2.13s/it] 55%|█████▍    | 3725/6779 [2:18:07<1:46:58,  2.10s/it]                                                       {'loss': 1.5401, 'learning_rate': 0.0001734090647065149, 'epoch': 0.55}
+ 55%|█████▍    | 3725/6779 [2:18:07<1:46:58,  2.10s/it] 55%|█████▍    | 3726/6779 [2:18:09<1:46:03,  2.08s/it]                                                       {'loss': 1.6466, 'learning_rate': 0.0001733158290838825, 'epoch': 0.55}
+ 55%|█████▍    | 3726/6779 [2:18:09<1:46:03,  2.08s/it] 55%|█████▍    | 3727/6779 [2:18:11<1:52:25,  2.21s/it]                                                       {'loss': 1.6625, 'learning_rate': 0.00017322259936503542, 'epoch': 0.55}
+ 55%|█████▍    | 3727/6779 [2:18:11<1:52:25,  2.21s/it] 55%|█████▍    | 3728/6779 [2:18:13<1:52:38,  2.22s/it]                                                       {'loss': 1.5899, 'learning_rate': 0.00017312937557060058, 'epoch': 0.55}
+ 55%|█████▍    | 3728/6779 [2:18:13<1:52:38,  2.22s/it] 55%|█████▌    | 3729/6779 [2:18:16<1:55:42,  2.28s/it]                                                       {'loss': 1.5508, 'learning_rate': 0.0001730361577212033, 'epoch': 0.55}
+ 55%|█████▌    | 3729/6779 [2:18:16<1:55:42,  2.28s/it] 55%|█████▌    | 3730/6779 [2:18:18<1:57:26,  2.31s/it]                                                       {'loss': 1.8108, 'learning_rate': 0.00017294294583746788, 'epoch': 0.55}
+ 55%|█████▌    | 3730/6779 [2:18:18<1:57:26,  2.31s/it] 55%|█████▌    | 3731/6779 [2:18:21<2:04:19,  2.45s/it]                                                       {'loss': 1.6601, 'learning_rate': 0.00017284973994001707, 'epoch': 0.55}
+ 55%|█████▌    | 3731/6779 [2:18:21<2:04:19,  2.45s/it] 55%|█████▌    | 3732/6779 [2:18:24<2:10:40,  2.57s/it]                                                       {'loss': 1.7437, 'learning_rate': 0.00017275654004947238, 'epoch': 0.55}
+ 55%|█████▌    | 3732/6779 [2:18:24<2:10:40,  2.57s/it] 55%|█████▌    | 3733/6779 [2:18:26<2:08:01,  2.52s/it]                                                       {'loss': 1.8229, 'learning_rate': 0.00017266334618645397, 'epoch': 0.55}
+ 55%|█████▌    | 3733/6779 [2:18:26<2:08:01,  2.52s/it] 55%|█████▌    | 3734/6779 [2:18:28<2:01:17,  2.39s/it]                                                       {'loss': 1.7992, 'learning_rate': 0.0001725701583715807, 'epoch': 0.55}
+ 55%|█████▌    | 3734/6779 [2:18:28<2:01:17,  2.39s/it] 55%|█████▌    | 3735/6779 [2:18:31<2:01:32,  2.40s/it]                                                       {'loss': 1.7918, 'learning_rate': 0.00017247697662547008, 'epoch': 0.55}
+ 55%|█████▌    | 3735/6779 [2:18:31<2:01:32,  2.40s/it] 55%|█████▌    | 3736/6779 [2:18:33<2:02:18,  2.41s/it]                                                       {'loss': 1.5437, 'learning_rate': 0.00017238380096873813, 'epoch': 0.55}
+ 55%|█████▌    | 3736/6779 [2:18:33<2:02:18,  2.41s/it] 55%|█████▌    | 3737/6779 [2:18:36<2:01:03,  2.39s/it]                                                       {'loss': 1.7633, 'learning_rate': 0.00017229063142199986, 'epoch': 0.55}
+ 55%|█████▌    | 3737/6779 [2:18:36<2:01:03,  2.39s/it] 55%|█████▌    | 3738/6779 [2:18:38<2:07:55,  2.52s/it]                                                       {'loss': 1.5654, 'learning_rate': 0.00017219746800586862, 'epoch': 0.55}
+ 55%|█████▌    | 3738/6779 [2:18:38<2:07:55,  2.52s/it] 55%|█████▌    | 3739/6779 [2:18:41<2:04:40,  2.46s/it]                                                       {'loss': 1.7682, 'learning_rate': 0.00017210431074095653, 'epoch': 0.55}
+ 55%|█████▌    | 3739/6779 [2:18:41<2:04:40,  2.46s/it] 55%|█████▌    | 3740/6779 [2:18:43<2:01:03,  2.39s/it]                                                       {'loss': 1.5802, 'learning_rate': 0.0001720111596478743, 'epoch': 0.55}
+ 55%|█████▌    | 3740/6779 [2:18:43<2:01:03,  2.39s/it] 55%|█████▌    | 3741/6779 [2:18:45<1:59:53,  2.37s/it]                                                       {'loss': 1.613, 'learning_rate': 0.00017191801474723137, 'epoch': 0.55}
+ 55%|█████▌    | 3741/6779 [2:18:45<1:59:53,  2.37s/it] 55%|█████▌    | 3742/6779 [2:18:48<2:00:12,  2.37s/it]                                                       {'loss': 1.791, 'learning_rate': 0.0001718248760596357, 'epoch': 0.55}
+ 55%|█████▌    | 3742/6779 [2:18:48<2:00:12,  2.37s/it] 55%|█████▌    | 3743/6779 [2:18:50<1:57:33,  2.32s/it]                                                       {'loss': 1.7321, 'learning_rate': 0.00017173174360569387, 'epoch': 0.55}
+ 55%|█████▌    | 3743/6779 [2:18:50<1:57:33,  2.32s/it] 55%|█████▌    | 3744/6779 [2:18:52<1:54:30,  2.26s/it]                                                       {'loss': 1.6406, 'learning_rate': 0.00017163861740601122, 'epoch': 0.55}
+ 55%|█████▌    | 3744/6779 [2:18:52<1:54:30,  2.26s/it] 55%|█████▌    | 3745/6779 [2:18:54<1:51:36,  2.21s/it]                                                       {'loss': 1.7007, 'learning_rate': 0.00017154549748119157, 'epoch': 0.55}
+ 55%|█████▌    | 3745/6779 [2:18:54<1:51:36,  2.21s/it] 55%|█████▌    | 3746/6779 [2:18:56<1:51:45,  2.21s/it]                                                       {'loss': 1.7539, 'learning_rate': 0.00017145238385183744, 'epoch': 0.55}
+ 55%|█████▌    | 3746/6779 [2:18:56<1:51:45,  2.21s/it] 55%|█████▌    | 3747/6779 [2:18:59<1:53:28,  2.25s/it]                                                       {'loss': 1.657, 'learning_rate': 0.00017135927653854987, 'epoch': 0.55}
+ 55%|█████▌    | 3747/6779 [2:18:59<1:53:28,  2.25s/it] 55%|█████▌    | 3748/6779 [2:19:01<1:49:02,  2.16s/it]                                                       {'loss': 1.7308, 'learning_rate': 0.00017126617556192857, 'epoch': 0.55}
+ 55%|█████▌    | 3748/6779 [2:19:01<1:49:02,  2.16s/it] 55%|█████▌    | 3749/6779 [2:19:03<1:48:43,  2.15s/it]                                                       {'loss': 1.556, 'learning_rate': 0.0001711730809425718, 'epoch': 0.55}
+ 55%|█████▌    | 3749/6779 [2:19:03<1:48:43,  2.15s/it] 55%|█████▌    | 3750/6779 [2:19:05<1:49:22,  2.17s/it]                                                       {'loss': 1.5569, 'learning_rate': 0.00017107999270107643, 'epoch': 0.55}
+ 55%|█████▌    | 3750/6779 [2:19:05<1:49:22,  2.17s/it] 55%|█████▌    | 3751/6779 [2:19:07<1:50:27,  2.19s/it]                                                       {'loss': 1.6564, 'learning_rate': 0.00017098691085803798, 'epoch': 0.55}
+ 55%|█████▌    | 3751/6779 [2:19:07<1:50:27,  2.19s/it] 55%|█████▌    | 3752/6779 [2:19:09<1:49:14,  2.17s/it]                                                       {'loss': 1.6595, 'learning_rate': 0.0001708938354340505, 'epoch': 0.55}
+ 55%|█████▌    | 3752/6779 [2:19:09<1:49:14,  2.17s/it] 55%|█████▌    | 3753/6779 [2:19:12<1:53:36,  2.25s/it]                                                       {'loss': 1.8333, 'learning_rate': 0.0001708007664497066, 'epoch': 0.55}
+ 55%|█████▌    | 3753/6779 [2:19:12<1:53:36,  2.25s/it] 55%|█████▌    | 3754/6779 [2:19:14<1:54:27,  2.27s/it]                                                       {'loss': 1.742, 'learning_rate': 0.0001707077039255975, 'epoch': 0.55}
+ 55%|█████▌    | 3754/6779 [2:19:14<1:54:27,  2.27s/it] 55%|█████▌    | 3755/6779 [2:19:16<1:53:01,  2.24s/it]                                                       {'loss': 1.6576, 'learning_rate': 0.00017061464788231293, 'epoch': 0.55}
+ 55%|█████▌    | 3755/6779 [2:19:16<1:53:01,  2.24s/it] 55%|█████▌    | 3756/6779 [2:19:19<1:59:00,  2.36s/it]                                                       {'loss': 1.5764, 'learning_rate': 0.00017052159834044132, 'epoch': 0.55}
+ 55%|█████▌    | 3756/6779 [2:19:19<1:59:00,  2.36s/it] 55%|█████▌    | 3757/6779 [2:19:21<2:03:31,  2.45s/it]                                                       {'loss': 1.8141, 'learning_rate': 0.0001704285553205695, 'epoch': 0.55}
+ 55%|█████▌    | 3757/6779 [2:19:21<2:03:31,  2.45s/it] 55%|█████▌    | 3758/6779 [2:19:24<2:02:12,  2.43s/it]                                                       {'loss': 1.7375, 'learning_rate': 0.00017033551884328293, 'epoch': 0.55}
+ 55%|█████▌    | 3758/6779 [2:19:24<2:02:12,  2.43s/it] 55%|█████▌    | 3759/6779 [2:19:26<1:56:42,  2.32s/it]                                                       {'loss': 1.8571, 'learning_rate': 0.0001702424889291657, 'epoch': 0.55}
+ 55%|█████▌    | 3759/6779 [2:19:26<1:56:42,  2.32s/it] 55%|█████▌    | 3760/6779 [2:19:28<1:55:40,  2.30s/it]                                                       {'loss': 1.7386, 'learning_rate': 0.00017014946559880037, 'epoch': 0.55}
+ 55%|█████▌    | 3760/6779 [2:19:28<1:55:40,  2.30s/it] 55%|█████▌    | 3761/6779 [2:19:30<1:52:14,  2.23s/it]                                                       {'loss': 1.7738, 'learning_rate': 0.00017005644887276797, 'epoch': 0.55}
+ 55%|█████▌    | 3761/6779 [2:19:30<1:52:14,  2.23s/it] 55%|█████▌    | 3762/6779 [2:19:32<1:48:58,  2.17s/it]                                                       {'loss': 1.7545, 'learning_rate': 0.0001699634387716482, 'epoch': 0.55}
+ 55%|█████▌    | 3762/6779 [2:19:32<1:48:58,  2.17s/it] 56%|█████▌    | 3763/6779 [2:19:35<1:52:41,  2.24s/it]                                                       {'loss': 1.6802, 'learning_rate': 0.00016987043531601923, 'epoch': 0.56}
+ 56%|█████▌    | 3763/6779 [2:19:35<1:52:41,  2.24s/it] 56%|█████▌    | 3764/6779 [2:19:37<1:52:39,  2.24s/it]                                                       {'loss': 1.6668, 'learning_rate': 0.00016977743852645777, 'epoch': 0.56}
+ 56%|█████▌    | 3764/6779 [2:19:37<1:52:39,  2.24s/it] 56%|█████▌    | 3765/6779 [2:19:39<1:52:28,  2.24s/it]                                                       {'loss': 1.9679, 'learning_rate': 0.000169684448423539, 'epoch': 0.56}
+ 56%|█████▌    | 3765/6779 [2:19:39<1:52:28,  2.24s/it] 56%|█████▌    | 3766/6779 [2:19:41<1:49:44,  2.19s/it]                                                       {'loss': 1.613, 'learning_rate': 0.00016959146502783676, 'epoch': 0.56}
+ 56%|█████▌    | 3766/6779 [2:19:41<1:49:44,  2.19s/it] 56%|█████▌    | 3767/6779 [2:19:44<1:52:17,  2.24s/it]                                                       {'loss': 1.819, 'learning_rate': 0.0001694984883599233, 'epoch': 0.56}
+ 56%|█████▌    | 3767/6779 [2:19:44<1:52:17,  2.24s/it] 56%|█████▌    | 3768/6779 [2:19:46<1:52:06,  2.23s/it]                                                       {'loss': 1.6844, 'learning_rate': 0.00016940551844036938, 'epoch': 0.56}
+ 56%|█████▌    | 3768/6779 [2:19:46<1:52:06,  2.23s/it] 56%|█████▌    | 3769/6779 [2:19:48<1:52:57,  2.25s/it]                                                       {'loss': 1.6557, 'learning_rate': 0.00016931255528974433, 'epoch': 0.56}
+ 56%|█████▌    | 3769/6779 [2:19:48<1:52:57,  2.25s/it] 56%|█████▌    | 3770/6779 [2:19:50<1:52:35,  2.25s/it]                                                       {'loss': 1.5945, 'learning_rate': 0.0001692195989286159, 'epoch': 0.56}
+ 56%|█████▌    | 3770/6779 [2:19:50<1:52:35,  2.25s/it] 56%|█████▌    | 3771/6779 [2:19:52<1:49:40,  2.19s/it]                                                       {'loss': 1.6748, 'learning_rate': 0.0001691266493775504, 'epoch': 0.56}
+ 56%|█████▌    | 3771/6779 [2:19:52<1:49:40,  2.19s/it] 56%|█████▌    | 3772/6779 [2:19:54<1:48:11,  2.16s/it]                                                       {'loss': 1.6592, 'learning_rate': 0.00016903370665711257, 'epoch': 0.56}
+ 56%|█████▌    | 3772/6779 [2:19:54<1:48:11,  2.16s/it] 56%|█████▌    | 3773/6779 [2:19:57<1:50:20,  2.20s/it]                                                       {'loss': 1.7025, 'learning_rate': 0.00016894077078786574, 'epoch': 0.56}
+ 56%|█████▌    | 3773/6779 [2:19:57<1:50:20,  2.20s/it] 56%|█████▌    | 3774/6779 [2:19:59<1:49:50,  2.19s/it]                                                       {'loss': 1.6613, 'learning_rate': 0.00016884784179037167, 'epoch': 0.56}
+ 56%|█████▌    | 3774/6779 [2:19:59<1:49:50,  2.19s/it] 56%|█████▌    | 3775/6779 [2:20:01<1:51:59,  2.24s/it]                                                       {'loss': 1.6383, 'learning_rate': 0.00016875491968519057, 'epoch': 0.56}
+ 56%|█████▌    | 3775/6779 [2:20:01<1:51:59,  2.24s/it] 56%|█████▌    | 3776/6779 [2:20:03<1:48:14,  2.16s/it]                                                       {'loss': 1.679, 'learning_rate': 0.00016866200449288117, 'epoch': 0.56}
+ 56%|█████▌    | 3776/6779 [2:20:03<1:48:14,  2.16s/it] 56%|█████▌    | 3777/6779 [2:20:06<1:52:04,  2.24s/it]                                                       {'loss': 1.5669, 'learning_rate': 0.00016856909623400065, 'epoch': 0.56}
+ 56%|█████▌    | 3777/6779 [2:20:06<1:52:04,  2.24s/it] 56%|█████▌    | 3778/6779 [2:20:08<1:49:50,  2.20s/it]                                                       {'loss': 1.7882, 'learning_rate': 0.0001684761949291046, 'epoch': 0.56}
+ 56%|█████▌    | 3778/6779 [2:20:08<1:49:50,  2.20s/it] 56%|█████▌    | 3779/6779 [2:20:10<1:49:31,  2.19s/it]                                                       {'loss': 1.7655, 'learning_rate': 0.00016838330059874712, 'epoch': 0.56}
+ 56%|█████▌    | 3779/6779 [2:20:10<1:49:31,  2.19s/it] 56%|█████▌    | 3780/6779 [2:20:12<1:51:04,  2.22s/it]                                                       {'loss': 1.7013, 'learning_rate': 0.00016829041326348098, 'epoch': 0.56}
+ 56%|█████▌    | 3780/6779 [2:20:12<1:51:04,  2.22s/it] 56%|█████▌    | 3781/6779 [2:20:15<1:53:02,  2.26s/it]                                                       {'loss': 1.6023, 'learning_rate': 0.00016819753294385696, 'epoch': 0.56}
+ 56%|█████▌    | 3781/6779 [2:20:15<1:53:02,  2.26s/it] 56%|█████▌    | 3782/6779 [2:20:17<1:55:20,  2.31s/it]                                                       {'loss': 1.68, 'learning_rate': 0.00016810465966042465, 'epoch': 0.56}
+ 56%|█████▌    | 3782/6779 [2:20:17<1:55:20,  2.31s/it] 56%|█████▌    | 3783/6779 [2:20:19<1:52:19,  2.25s/it]                                                       {'loss': 1.743, 'learning_rate': 0.0001680117934337319, 'epoch': 0.56}
+ 56%|█████▌    | 3783/6779 [2:20:19<1:52:19,  2.25s/it] 56%|█████▌    | 3784/6779 [2:20:21<1:48:46,  2.18s/it]                                                       {'loss': 1.5717, 'learning_rate': 0.00016791893428432512, 'epoch': 0.56}
+ 56%|█████▌    | 3784/6779 [2:20:21<1:48:46,  2.18s/it] 56%|█████▌    | 3785/6779 [2:20:23<1:46:28,  2.13s/it]                                                       {'loss': 1.6605, 'learning_rate': 0.00016782608223274905, 'epoch': 0.56}
+ 56%|█████▌    | 3785/6779 [2:20:23<1:46:28,  2.13s/it] 56%|█████▌    | 3786/6779 [2:20:25<1:45:24,  2.11s/it]                                                       {'loss': 1.7118, 'learning_rate': 0.0001677332372995468, 'epoch': 0.56}
+ 56%|█████▌    | 3786/6779 [2:20:25<1:45:24,  2.11s/it] 56%|█████▌    | 3787/6779 [2:20:28<1:50:08,  2.21s/it]                                                       {'loss': 1.6662, 'learning_rate': 0.00016764039950526024, 'epoch': 0.56}
+ 56%|█████▌    | 3787/6779 [2:20:28<1:50:08,  2.21s/it] 56%|█████▌    | 3788/6779 [2:20:30<1:52:37,  2.26s/it]                                                       {'loss': 1.5542, 'learning_rate': 0.0001675475688704293, 'epoch': 0.56}
+ 56%|█████▌    | 3788/6779 [2:20:30<1:52:37,  2.26s/it] 56%|█████▌    | 3789/6779 [2:20:33<1:55:58,  2.33s/it]                                                       {'loss': 1.5678, 'learning_rate': 0.0001674547454155925, 'epoch': 0.56}
+ 56%|█████▌    | 3789/6779 [2:20:33<1:55:58,  2.33s/it] 56%|█████▌    | 3790/6779 [2:20:35<1:56:35,  2.34s/it]                                                       {'loss': 1.6359, 'learning_rate': 0.00016736192916128663, 'epoch': 0.56}
+ 56%|█████▌    | 3790/6779 [2:20:35<1:56:35,  2.34s/it] 56%|█████▌    | 3791/6779 [2:20:37<1:53:50,  2.29s/it]                                                       {'loss': 1.7963, 'learning_rate': 0.00016726912012804705, 'epoch': 0.56}
+ 56%|█████▌    | 3791/6779 [2:20:37<1:53:50,  2.29s/it] 56%|█████▌    | 3792/6779 [2:20:40<1:58:42,  2.38s/it]                                                       {'loss': 1.8207, 'learning_rate': 0.00016717631833640745, 'epoch': 0.56}
+ 56%|█████▌    | 3792/6779 [2:20:40<1:58:42,  2.38s/it] 56%|█████▌    | 3793/6779 [2:20:43<2:05:08,  2.51s/it]                                                       {'loss': 1.4832, 'learning_rate': 0.0001670835238068998, 'epoch': 0.56}
+ 56%|█████▌    | 3793/6779 [2:20:43<2:05:08,  2.51s/it] 56%|█████▌    | 3794/6779 [2:20:45<2:01:33,  2.44s/it]                                                       {'loss': 1.6565, 'learning_rate': 0.0001669907365600548, 'epoch': 0.56}
+ 56%|█████▌    | 3794/6779 [2:20:45<2:01:33,  2.44s/it] 56%|█████▌    | 3795/6779 [2:20:47<1:55:36,  2.32s/it]                                                       {'loss': 1.7798, 'learning_rate': 0.00016689795661640124, 'epoch': 0.56}
+ 56%|█████▌    | 3795/6779 [2:20:47<1:55:36,  2.32s/it] 56%|█████▌    | 3796/6779 [2:20:49<1:53:59,  2.29s/it]                                                       {'loss': 1.6702, 'learning_rate': 0.00016680518399646635, 'epoch': 0.56}
+ 56%|█████▌    | 3796/6779 [2:20:49<1:53:59,  2.29s/it] 56%|█████▌    | 3797/6779 [2:20:52<1:59:07,  2.40s/it]                                                       {'loss': 1.6784, 'learning_rate': 0.00016671241872077584, 'epoch': 0.56}
+ 56%|█████▌    | 3797/6779 [2:20:52<1:59:07,  2.40s/it] 56%|█████▌    | 3798/6779 [2:20:54<1:57:39,  2.37s/it]                                                       {'loss': 1.617, 'learning_rate': 0.0001666196608098536, 'epoch': 0.56}
+ 56%|█████▌    | 3798/6779 [2:20:54<1:57:39,  2.37s/it] 56%|█████▌    | 3799/6779 [2:20:56<1:58:09,  2.38s/it]                                                       {'loss': 1.7438, 'learning_rate': 0.0001665269102842221, 'epoch': 0.56}
+ 56%|█████▌    | 3799/6779 [2:20:56<1:58:09,  2.38s/it] 56%|█████▌    | 3800/6779 [2:20:59<1:54:41,  2.31s/it]                                                       {'loss': 1.7516, 'learning_rate': 0.00016643416716440198, 'epoch': 0.56}
+ 56%|█████▌    | 3800/6779 [2:20:59<1:54:41,  2.31s/it] 56%|█████▌    | 3801/6779 [2:21:01<1:52:00,  2.26s/it]                                                       {'loss': 1.5853, 'learning_rate': 0.0001663414314709125, 'epoch': 0.56}
+ 56%|█████▌    | 3801/6779 [2:21:01<1:52:00,  2.26s/it] 56%|█████▌    | 3802/6779 [2:21:03<1:50:19,  2.22s/it]                                                       {'loss': 1.6743, 'learning_rate': 0.00016624870322427108, 'epoch': 0.56}
+ 56%|█████▌    | 3802/6779 [2:21:03<1:50:19,  2.22s/it] 56%|█████▌    | 3803/6779 [2:21:05<1:49:36,  2.21s/it]                                                       {'loss': 1.6018, 'learning_rate': 0.00016615598244499355, 'epoch': 0.56}
+ 56%|█████▌    | 3803/6779 [2:21:05<1:49:36,  2.21s/it] 56%|█████▌    | 3804/6779 [2:21:07<1:48:55,  2.20s/it]                                                       {'loss': 1.6411, 'learning_rate': 0.00016606326915359406, 'epoch': 0.56}
+ 56%|█████▌    | 3804/6779 [2:21:07<1:48:55,  2.20s/it] 56%|█████▌    | 3805/6779 [2:21:09<1:48:06,  2.18s/it]                                                       {'loss': 1.6982, 'learning_rate': 0.0001659705633705851, 'epoch': 0.56}
+ 56%|█████▌    | 3805/6779 [2:21:09<1:48:06,  2.18s/it] 56%|█████▌    | 3806/6779 [2:21:12<1:48:17,  2.19s/it]                                                       {'loss': 1.6509, 'learning_rate': 0.0001658778651164776, 'epoch': 0.56}
+ 56%|█████▌    | 3806/6779 [2:21:12<1:48:17,  2.19s/it] 56%|█████▌    | 3807/6779 [2:21:14<1:47:41,  2.17s/it]                                                       {'loss': 1.7915, 'learning_rate': 0.00016578517441178056, 'epoch': 0.56}
+ 56%|█████▌    | 3807/6779 [2:21:14<1:47:41,  2.17s/it] 56%|█████▌    | 3808/6779 [2:21:16<1:49:36,  2.21s/it]                                                       {'loss': 1.4705, 'learning_rate': 0.00016569249127700172, 'epoch': 0.56}
+ 56%|█████▌    | 3808/6779 [2:21:16<1:49:36,  2.21s/it] 56%|█████▌    | 3809/6779 [2:21:18<1:50:00,  2.22s/it]                                                       {'loss': 1.5907, 'learning_rate': 0.00016559981573264677, 'epoch': 0.56}
+ 56%|█████▌    | 3809/6779 [2:21:18<1:50:00,  2.22s/it] 56%|█████▌    | 3810/6779 [2:21:21<1:51:44,  2.26s/it]                                                       {'loss': 1.6731, 'learning_rate': 0.00016550714779921995, 'epoch': 0.56}
+ 56%|█████▌    | 3810/6779 [2:21:21<1:51:44,  2.26s/it] 56%|█████▌    | 3811/6779 [2:21:23<1:56:54,  2.36s/it]                                                       {'loss': 1.5746, 'learning_rate': 0.00016541448749722375, 'epoch': 0.56}
+ 56%|█████▌    | 3811/6779 [2:21:23<1:56:54,  2.36s/it] 56%|█████▌    | 3812/6779 [2:21:26<2:02:56,  2.49s/it]                                                       {'loss': 1.7512, 'learning_rate': 0.0001653218348471589, 'epoch': 0.56}
+ 56%|█████▌    | 3812/6779 [2:21:26<2:02:56,  2.49s/it] 56%|█████▌    | 3813/6779 [2:21:28<1:57:06,  2.37s/it]                                                       {'loss': 1.6402, 'learning_rate': 0.00016522918986952448, 'epoch': 0.56}
+ 56%|█████▌    | 3813/6779 [2:21:28<1:57:06,  2.37s/it] 56%|█████▋    | 3814/6779 [2:21:30<1:53:33,  2.30s/it]                                                       {'loss': 1.5801, 'learning_rate': 0.0001651365525848179, 'epoch': 0.56}
+ 56%|█████▋    | 3814/6779 [2:21:30<1:53:33,  2.30s/it] 56%|█████▋    | 3815/6779 [2:21:32<1:50:23,  2.23s/it]                                                       {'loss': 1.7761, 'learning_rate': 0.0001650439230135349, 'epoch': 0.56}
+ 56%|█████▋    | 3815/6779 [2:21:32<1:50:23,  2.23s/it] 56%|█████▋    | 3816/6779 [2:21:34<1:49:00,  2.21s/it]                                                       {'loss': 1.645, 'learning_rate': 0.00016495130117616947, 'epoch': 0.56}
+ 56%|█████▋    | 3816/6779 [2:21:34<1:49:00,  2.21s/it] 56%|█████▋    | 3817/6779 [2:21:36<1:47:24,  2.18s/it]                                                       {'loss': 1.6941, 'learning_rate': 0.00016485868709321385, 'epoch': 0.56}
+ 56%|█████▋    | 3817/6779 [2:21:36<1:47:24,  2.18s/it] 56%|█████▋    | 3818/6779 [2:21:39<1:47:00,  2.17s/it]                                                       {'loss': 1.7038, 'learning_rate': 0.00016476608078515862, 'epoch': 0.56}
+ 56%|█████▋    | 3818/6779 [2:21:39<1:47:00,  2.17s/it] 56%|█████▋    | 3819/6779 [2:21:41<1:47:26,  2.18s/it]                                                       {'loss': 1.9026, 'learning_rate': 0.00016467348227249264, 'epoch': 0.56}
+ 56%|█████▋    | 3819/6779 [2:21:41<1:47:26,  2.18s/it] 56%|█████▋    | 3820/6779 [2:21:43<1:48:26,  2.20s/it]                                                       {'loss': 1.8071, 'learning_rate': 0.00016458089157570297, 'epoch': 0.56}
+ 56%|█████▋    | 3820/6779 [2:21:43<1:48:26,  2.20s/it] 56%|█████▋    | 3821/6779 [2:21:46<1:51:32,  2.26s/it]                                                       {'loss': 1.8001, 'learning_rate': 0.00016448830871527504, 'epoch': 0.56}
+ 56%|█████▋    | 3821/6779 [2:21:46<1:51:32,  2.26s/it] 56%|█████▋    | 3822/6779 [2:21:48<1:53:44,  2.31s/it]                                                       {'loss': 1.4896, 'learning_rate': 0.0001643957337116925, 'epoch': 0.56}
+ 56%|█████▋    | 3822/6779 [2:21:48<1:53:44,  2.31s/it] 56%|█████▋    | 3823/6779 [2:21:50<1:51:45,  2.27s/it]                                                       {'loss': 1.6505, 'learning_rate': 0.0001643031665854373, 'epoch': 0.56}
+ 56%|█████▋    | 3823/6779 [2:21:50<1:51:45,  2.27s/it] 56%|█████▋    | 3824/6779 [2:21:52<1:49:53,  2.23s/it]                                                       {'loss': 1.8316, 'learning_rate': 0.00016421060735698955, 'epoch': 0.56}
+ 56%|█████▋    | 3824/6779 [2:21:52<1:49:53,  2.23s/it] 56%|█████▋    | 3825/6779 [2:21:54<1:47:37,  2.19s/it]                                                       {'loss': 1.7625, 'learning_rate': 0.0001641180560468277, 'epoch': 0.56}
+ 56%|█████▋    | 3825/6779 [2:21:54<1:47:37,  2.19s/it] 56%|█████▋    | 3826/6779 [2:21:57<1:47:52,  2.19s/it]                                                       {'loss': 1.6417, 'learning_rate': 0.00016402551267542847, 'epoch': 0.56}
+ 56%|█████▋    | 3826/6779 [2:21:57<1:47:52,  2.19s/it] 56%|█████▋    | 3827/6779 [2:21:59<1:49:00,  2.22s/it]                                                       {'loss': 1.7122, 'learning_rate': 0.00016393297726326672, 'epoch': 0.56}
+ 56%|█████▋    | 3827/6779 [2:21:59<1:49:00,  2.22s/it] 56%|█████▋    | 3828/6779 [2:22:01<1:48:47,  2.21s/it]                                                       {'loss': 1.6129, 'learning_rate': 0.00016384044983081556, 'epoch': 0.56}
+ 56%|█████▋    | 3828/6779 [2:22:01<1:48:47,  2.21s/it] 56%|█████▋    | 3829/6779 [2:22:04<1:58:44,  2.42s/it]                                                       {'loss': 1.5925, 'learning_rate': 0.0001637479303985465, 'epoch': 0.56}
+ 56%|█████▋    | 3829/6779 [2:22:04<1:58:44,  2.42s/it] 56%|█████▋    | 3830/6779 [2:22:06<1:56:36,  2.37s/it]                                                       {'loss': 1.7123, 'learning_rate': 0.00016365541898692913, 'epoch': 0.56}
+ 56%|█████▋    | 3830/6779 [2:22:06<1:56:36,  2.37s/it] 57%|█████▋    | 3831/6779 [2:22:08<1:53:43,  2.31s/it]                                                       {'loss': 1.578, 'learning_rate': 0.00016356291561643124, 'epoch': 0.57}
+ 57%|█████▋    | 3831/6779 [2:22:08<1:53:43,  2.31s/it] 57%|█████▋    | 3832/6779 [2:22:11<1:51:40,  2.27s/it]                                                       {'loss': 1.7856, 'learning_rate': 0.000163470420307519, 'epoch': 0.57}
+ 57%|█████▋    | 3832/6779 [2:22:11<1:51:40,  2.27s/it] 57%|█████▋    | 3833/6779 [2:22:13<1:52:38,  2.29s/it]                                                       {'loss': 1.6174, 'learning_rate': 0.00016337793308065655, 'epoch': 0.57}
+ 57%|█████▋    | 3833/6779 [2:22:13<1:52:38,  2.29s/it] 57%|█████▋    | 3834/6779 [2:22:15<1:52:59,  2.30s/it]                                                       {'loss': 1.7285, 'learning_rate': 0.00016328545395630648, 'epoch': 0.57}
+ 57%|█████▋    | 3834/6779 [2:22:15<1:52:59,  2.30s/it] 57%|█████▋    | 3835/6779 [2:22:17<1:49:33,  2.23s/it]                                                       {'loss': 1.6172, 'learning_rate': 0.0001631929829549295, 'epoch': 0.57}
+ 57%|█████▋    | 3835/6779 [2:22:17<1:49:33,  2.23s/it] 57%|█████▋    | 3836/6779 [2:22:19<1:47:46,  2.20s/it]                                                       {'loss': 1.7266, 'learning_rate': 0.00016310052009698442, 'epoch': 0.57}
+ 57%|█████▋    | 3836/6779 [2:22:19<1:47:46,  2.20s/it] 57%|█████▋    | 3837/6779 [2:22:21<1:45:30,  2.15s/it]                                                       {'loss': 1.4922, 'learning_rate': 0.00016300806540292848, 'epoch': 0.57}
+ 57%|█████▋    | 3837/6779 [2:22:21<1:45:30,  2.15s/it] 57%|█████▋    | 3838/6779 [2:22:24<1:46:10,  2.17s/it]                                                       {'loss': 1.6995, 'learning_rate': 0.00016291561889321692, 'epoch': 0.57}
+ 57%|█████▋    | 3838/6779 [2:22:24<1:46:10,  2.17s/it] 57%|█████▋    | 3839/6779 [2:22:26<1:45:12,  2.15s/it]                                                       {'loss': 1.787, 'learning_rate': 0.0001628231805883032, 'epoch': 0.57}
+ 57%|█████▋    | 3839/6779 [2:22:26<1:45:12,  2.15s/it] 57%|█████▋    | 3840/6779 [2:22:28<1:48:57,  2.22s/it]                                                       {'loss': 1.7694, 'learning_rate': 0.00016273075050863902, 'epoch': 0.57}
+ 57%|█████▋    | 3840/6779 [2:22:28<1:48:57,  2.22s/it] 57%|█████▋    | 3841/6779 [2:22:30<1:50:37,  2.26s/it]                                                       {'loss': 1.6285, 'learning_rate': 0.00016263832867467423, 'epoch': 0.57}
+ 57%|█████▋    | 3841/6779 [2:22:30<1:50:37,  2.26s/it] 57%|█████▋    | 3842/6779 [2:22:33<1:49:17,  2.23s/it]                                                       {'loss': 1.6496, 'learning_rate': 0.00016254591510685685, 'epoch': 0.57}
+ 57%|█████▋    | 3842/6779 [2:22:33<1:49:17,  2.23s/it] 57%|█████▋    | 3843/6779 [2:22:35<1:50:20,  2.26s/it]                                                       {'loss': 1.8033, 'learning_rate': 0.00016245350982563306, 'epoch': 0.57}
+ 57%|█████▋    | 3843/6779 [2:22:35<1:50:20,  2.26s/it] 57%|█████▋    | 3844/6779 [2:22:37<1:49:03,  2.23s/it]                                                       {'loss': 1.7068, 'learning_rate': 0.0001623611128514473, 'epoch': 0.57}
+ 57%|█████▋    | 3844/6779 [2:22:37<1:49:03,  2.23s/it] 57%|█████▋    | 3845/6779 [2:22:39<1:49:33,  2.24s/it]                                                       {'loss': 1.6097, 'learning_rate': 0.00016226872420474202, 'epoch': 0.57}
+ 57%|█████▋    | 3845/6779 [2:22:39<1:49:33,  2.24s/it] 57%|█████▋    | 3846/6779 [2:22:42<1:48:26,  2.22s/it]                                                       {'loss': 1.7817, 'learning_rate': 0.00016217634390595795, 'epoch': 0.57}
+ 57%|█████▋    | 3846/6779 [2:22:42<1:48:26,  2.22s/it] 57%|█████▋    | 3847/6779 [2:22:44<1:46:36,  2.18s/it]                                                       {'loss': 1.7735, 'learning_rate': 0.0001620839719755339, 'epoch': 0.57}
+ 57%|█████▋    | 3847/6779 [2:22:44<1:46:36,  2.18s/it] 57%|█████▋    | 3848/6779 [2:22:46<1:45:50,  2.17s/it]                                                       {'loss': 1.7143, 'learning_rate': 0.00016199160843390686, 'epoch': 0.57}
+ 57%|█████▋    | 3848/6779 [2:22:46<1:45:50,  2.17s/it] 57%|█████▋    | 3849/6779 [2:22:48<1:47:42,  2.21s/it]                                                       {'loss': 1.8393, 'learning_rate': 0.000161899253301512, 'epoch': 0.57}
+ 57%|█████▋    | 3849/6779 [2:22:48<1:47:42,  2.21s/it] 57%|█████▋    | 3850/6779 [2:22:50<1:47:22,  2.20s/it]                                                       {'loss': 1.6384, 'learning_rate': 0.00016180690659878247, 'epoch': 0.57}
+ 57%|█████▋    | 3850/6779 [2:22:50<1:47:22,  2.20s/it] 57%|█████▋    | 3851/6779 [2:22:53<1:50:39,  2.27s/it]                                                       {'loss': 1.7242, 'learning_rate': 0.00016171456834614985, 'epoch': 0.57}
+ 57%|█████▋    | 3851/6779 [2:22:53<1:50:39,  2.27s/it] 57%|█████▋    | 3852/6779 [2:22:55<1:48:07,  2.22s/it]                                                       {'loss': 1.5543, 'learning_rate': 0.00016162223856404362, 'epoch': 0.57}
+ 57%|█████▋    | 3852/6779 [2:22:55<1:48:07,  2.22s/it] 57%|█████▋    | 3853/6779 [2:22:57<1:50:24,  2.26s/it]                                                       {'loss': 1.6558, 'learning_rate': 0.00016152991727289137, 'epoch': 0.57}
+ 57%|█████▋    | 3853/6779 [2:22:57<1:50:24,  2.26s/it] 57%|█████▋    | 3854/6779 [2:22:59<1:47:03,  2.20s/it]                                                       {'loss': 1.6619, 'learning_rate': 0.00016143760449311892, 'epoch': 0.57}
+ 57%|█████▋    | 3854/6779 [2:22:59<1:47:03,  2.20s/it] 57%|█████▋    | 3855/6779 [2:23:02<1:50:40,  2.27s/it]                                                       {'loss': 1.6561, 'learning_rate': 0.0001613453002451502, 'epoch': 0.57}
+ 57%|█████▋    | 3855/6779 [2:23:02<1:50:40,  2.27s/it] 57%|█████▋    | 3856/6779 [2:23:04<1:47:53,  2.21s/it]                                                       {'loss': 1.7858, 'learning_rate': 0.0001612530045494072, 'epoch': 0.57}
+ 57%|█████▋    | 3856/6779 [2:23:04<1:47:53,  2.21s/it] 57%|█████▋    | 3857/6779 [2:23:06<1:48:15,  2.22s/it]                                                       {'loss': 1.7349, 'learning_rate': 0.00016116071742630994, 'epoch': 0.57}
+ 57%|█████▋    | 3857/6779 [2:23:06<1:48:15,  2.22s/it] 57%|█████▋    | 3858/6779 [2:23:08<1:50:31,  2.27s/it]                                                       {'loss': 1.837, 'learning_rate': 0.00016106843889627682, 'epoch': 0.57}
+ 57%|█████▋    | 3858/6779 [2:23:08<1:50:31,  2.27s/it] 57%|█████▋    | 3859/6779 [2:23:10<1:47:16,  2.20s/it]                                                       {'loss': 1.6907, 'learning_rate': 0.0001609761689797241, 'epoch': 0.57}
+ 57%|█████▋    | 3859/6779 [2:23:10<1:47:16,  2.20s/it] 57%|█████▋    | 3860/6779 [2:23:12<1:45:48,  2.17s/it]                                                       {'loss': 1.6969, 'learning_rate': 0.00016088390769706626, 'epoch': 0.57}
+ 57%|█████▋    | 3860/6779 [2:23:12<1:45:48,  2.17s/it] 57%|█████▋    | 3861/6779 [2:23:15<1:49:49,  2.26s/it]                                                       {'loss': 1.6144, 'learning_rate': 0.00016079165506871566, 'epoch': 0.57}
+ 57%|█████▋    | 3861/6779 [2:23:15<1:49:49,  2.26s/it] 57%|█████▋    | 3862/6779 [2:23:17<1:46:44,  2.20s/it]                                                       {'loss': 1.7497, 'learning_rate': 0.00016069941111508296, 'epoch': 0.57}
+ 57%|█████▋    | 3862/6779 [2:23:17<1:46:44,  2.20s/it] 57%|█████▋    | 3863/6779 [2:23:19<1:46:38,  2.19s/it]                                                       {'loss': 1.6269, 'learning_rate': 0.00016060717585657683, 'epoch': 0.57}
+ 57%|█████▋    | 3863/6779 [2:23:19<1:46:38,  2.19s/it] 57%|█████▋    | 3864/6779 [2:23:21<1:45:15,  2.17s/it]                                                       {'loss': 1.7669, 'learning_rate': 0.00016051494931360394, 'epoch': 0.57}
+ 57%|█████▋    | 3864/6779 [2:23:21<1:45:15,  2.17s/it] 57%|█████▋    | 3865/6779 [2:23:24<1:50:33,  2.28s/it]                                                       {'loss': 1.561, 'learning_rate': 0.00016042273150656928, 'epoch': 0.57}
+ 57%|█████▋    | 3865/6779 [2:23:24<1:50:33,  2.28s/it] 57%|█████▋    | 3866/6779 [2:23:26<1:47:28,  2.21s/it]                                                       {'loss': 1.6912, 'learning_rate': 0.00016033052245587566, 'epoch': 0.57}
+ 57%|█████▋    | 3866/6779 [2:23:26<1:47:28,  2.21s/it] 57%|█████▋    | 3867/6779 [2:23:28<1:47:42,  2.22s/it]                                                       {'loss': 1.7228, 'learning_rate': 0.000160238322181924, 'epoch': 0.57}
+ 57%|█████▋    | 3867/6779 [2:23:28<1:47:42,  2.22s/it] 57%|█████▋    | 3868/6779 [2:23:30<1:44:36,  2.16s/it]                                                       {'loss': 1.8597, 'learning_rate': 0.0001601461307051134, 'epoch': 0.57}
+ 57%|█████▋    | 3868/6779 [2:23:30<1:44:36,  2.16s/it] 57%|█████▋    | 3869/6779 [2:23:32<1:43:55,  2.14s/it]                                                       {'loss': 1.6388, 'learning_rate': 0.0001600539480458408, 'epoch': 0.57}
+ 57%|█████▋    | 3869/6779 [2:23:32<1:43:55,  2.14s/it] 57%|█████▋    | 3870/6779 [2:23:35<1:45:52,  2.18s/it]                                                       {'loss': 1.7857, 'learning_rate': 0.00015996177422450137, 'epoch': 0.57}
+ 57%|█████▋    | 3870/6779 [2:23:35<1:45:52,  2.18s/it] 57%|█████▋    | 3871/6779 [2:23:37<1:44:57,  2.17s/it]                                                       {'loss': 1.562, 'learning_rate': 0.00015986960926148817, 'epoch': 0.57}
+ 57%|█████▋    | 3871/6779 [2:23:37<1:44:57,  2.17s/it] 57%|█████▋    | 3872/6779 [2:23:39<1:44:29,  2.16s/it]                                                       {'loss': 1.6999, 'learning_rate': 0.00015977745317719257, 'epoch': 0.57}
+ 57%|█████▋    | 3872/6779 [2:23:39<1:44:29,  2.16s/it] 57%|█████▋    | 3873/6779 [2:23:41<1:42:22,  2.11s/it]                                                       {'loss': 1.628, 'learning_rate': 0.00015968530599200372, 'epoch': 0.57}
+ 57%|█████▋    | 3873/6779 [2:23:41<1:42:22,  2.11s/it] 57%|█████▋    | 3874/6779 [2:23:43<1:44:26,  2.16s/it]                                                       {'loss': 1.7358, 'learning_rate': 0.0001595931677263089, 'epoch': 0.57}
+ 57%|█████▋    | 3874/6779 [2:23:43<1:44:26,  2.16s/it] 57%|█████▋    | 3875/6779 [2:23:45<1:44:08,  2.15s/it]                                                       {'loss': 1.7952, 'learning_rate': 0.00015950103840049336, 'epoch': 0.57}
+ 57%|█████▋    | 3875/6779 [2:23:45<1:44:08,  2.15s/it] 57%|█████▋    | 3876/6779 [2:23:47<1:41:35,  2.10s/it]                                                       {'loss': 1.5446, 'learning_rate': 0.00015940891803494045, 'epoch': 0.57}
+ 57%|█████▋    | 3876/6779 [2:23:47<1:41:35,  2.10s/it] 57%|█████▋    | 3877/6779 [2:23:49<1:40:00,  2.07s/it]                                                       {'loss': 1.6055, 'learning_rate': 0.0001593168066500315, 'epoch': 0.57}
+ 57%|█████▋    | 3877/6779 [2:23:49<1:40:00,  2.07s/it] 57%|█████▋    | 3878/6779 [2:23:51<1:41:00,  2.09s/it]                                                       {'loss': 1.7879, 'learning_rate': 0.00015922470426614572, 'epoch': 0.57}
+ 57%|█████▋    | 3878/6779 [2:23:51<1:41:00,  2.09s/it] 57%|█████▋    | 3879/6779 [2:23:54<1:43:24,  2.14s/it]                                                       {'loss': 1.5521, 'learning_rate': 0.00015913261090366065, 'epoch': 0.57}
+ 57%|█████▋    | 3879/6779 [2:23:54<1:43:24,  2.14s/it] 57%|█████▋    | 3880/6779 [2:23:56<1:48:09,  2.24s/it]                                                       {'loss': 1.6959, 'learning_rate': 0.00015904052658295158, 'epoch': 0.57}
+ 57%|█████▋    | 3880/6779 [2:23:56<1:48:09,  2.24s/it] 57%|█████▋    | 3881/6779 [2:23:58<1:49:36,  2.27s/it]                                                       {'loss': 1.6298, 'learning_rate': 0.00015894845132439188, 'epoch': 0.57}
+ 57%|█████▋    | 3881/6779 [2:23:58<1:49:36,  2.27s/it] 57%|█████▋    | 3882/6779 [2:24:01<1:50:46,  2.29s/it]                                                       {'loss': 1.5385, 'learning_rate': 0.00015885638514835282, 'epoch': 0.57}
+ 57%|█████▋    | 3882/6779 [2:24:01<1:50:46,  2.29s/it] 57%|█████▋    | 3883/6779 [2:24:03<1:48:47,  2.25s/it]                                                       {'loss': 1.6012, 'learning_rate': 0.00015876432807520384, 'epoch': 0.57}
+ 57%|█████▋    | 3883/6779 [2:24:03<1:48:47,  2.25s/it] 57%|█████▋    | 3884/6779 [2:24:05<1:52:33,  2.33s/it]                                                       {'loss': 1.7709, 'learning_rate': 0.00015867228012531222, 'epoch': 0.57}
+ 57%|█████▋    | 3884/6779 [2:24:05<1:52:33,  2.33s/it] 57%|█████▋    | 3885/6779 [2:24:08<1:50:11,  2.28s/it]                                                       {'loss': 1.7103, 'learning_rate': 0.0001585802413190432, 'epoch': 0.57}
+ 57%|█████▋    | 3885/6779 [2:24:08<1:50:11,  2.28s/it] 57%|█████▋    | 3886/6779 [2:24:10<1:47:51,  2.24s/it]                                                       {'loss': 1.4825, 'learning_rate': 0.0001584882116767602, 'epoch': 0.57}
+ 57%|█████▋    | 3886/6779 [2:24:10<1:47:51,  2.24s/it] 57%|█████▋    | 3887/6779 [2:24:12<1:45:33,  2.19s/it]                                                       {'loss': 1.5618, 'learning_rate': 0.00015839619121882435, 'epoch': 0.57}
+ 57%|█████▋    | 3887/6779 [2:24:12<1:45:33,  2.19s/it] 57%|█████▋    | 3888/6779 [2:24:14<1:43:25,  2.15s/it]                                                       {'loss': 1.6544, 'learning_rate': 0.00015830417996559498, 'epoch': 0.57}
+ 57%|█████▋    | 3888/6779 [2:24:14<1:43:25,  2.15s/it] 57%|█████▋    | 3889/6779 [2:24:16<1:43:08,  2.14s/it]                                                       {'loss': 1.8, 'learning_rate': 0.00015821217793742922, 'epoch': 0.57}
+ 57%|█████▋    | 3889/6779 [2:24:16<1:43:08,  2.14s/it] 57%|█████▋    | 3890/6779 [2:24:18<1:42:59,  2.14s/it]                                                       {'loss': 1.6667, 'learning_rate': 0.00015812018515468226, 'epoch': 0.57}
+ 57%|█████▋    | 3890/6779 [2:24:18<1:42:59,  2.14s/it] 57%|█████▋    | 3891/6779 [2:24:20<1:43:45,  2.16s/it]                                                       {'loss': 1.7898, 'learning_rate': 0.00015802820163770713, 'epoch': 0.57}
+ 57%|█████▋    | 3891/6779 [2:24:20<1:43:45,  2.16s/it] 57%|█████▋    | 3892/6779 [2:24:22<1:42:19,  2.13s/it]                                                       {'loss': 1.7317, 'learning_rate': 0.0001579362274068549, 'epoch': 0.57}
+ 57%|█████▋    | 3892/6779 [2:24:22<1:42:19,  2.13s/it] 57%|█████▋    | 3893/6779 [2:24:25<1:47:09,  2.23s/it]                                                       {'loss': 1.6113, 'learning_rate': 0.00015784426248247461, 'epoch': 0.57}
+ 57%|█████▋    | 3893/6779 [2:24:25<1:47:09,  2.23s/it] 57%|█████▋    | 3894/6779 [2:24:27<1:45:48,  2.20s/it]                                                       {'loss': 1.6988, 'learning_rate': 0.0001577523068849132, 'epoch': 0.57}
+ 57%|█████▋    | 3894/6779 [2:24:27<1:45:48,  2.20s/it] 57%|█████▋    | 3895/6779 [2:24:29<1:50:15,  2.29s/it]                                                       {'loss': 1.5355, 'learning_rate': 0.00015766036063451553, 'epoch': 0.57}
+ 57%|█████▋    | 3895/6779 [2:24:29<1:50:15,  2.29s/it] 57%|█████▋    | 3896/6779 [2:24:32<1:49:21,  2.28s/it]                                                       {'loss': 1.6465, 'learning_rate': 0.00015756842375162439, 'epoch': 0.57}
+ 57%|█████▋    | 3896/6779 [2:24:32<1:49:21,  2.28s/it] 57%|█████▋    | 3897/6779 [2:24:34<1:49:27,  2.28s/it]                                                       {'loss': 1.753, 'learning_rate': 0.00015747649625658051, 'epoch': 0.57}
+ 57%|█████▋    | 3897/6779 [2:24:34<1:49:27,  2.28s/it] 58%|█████▊    | 3898/6779 [2:24:36<1:48:10,  2.25s/it]                                                       {'loss': 1.5979, 'learning_rate': 0.0001573845781697226, 'epoch': 0.58}
+ 58%|█████▊    | 3898/6779 [2:24:36<1:48:10,  2.25s/it] 58%|█████▊    | 3899/6779 [2:24:38<1:47:00,  2.23s/it]                                                       {'loss': 1.7814, 'learning_rate': 0.00015729266951138712, 'epoch': 0.58}
+ 58%|█████▊    | 3899/6779 [2:24:38<1:47:00,  2.23s/it] 58%|█████▊    | 3900/6779 [2:24:40<1:45:35,  2.20s/it]                                                       {'loss': 1.7811, 'learning_rate': 0.00015720077030190868, 'epoch': 0.58}
+ 58%|█████▊    | 3900/6779 [2:24:40<1:45:35,  2.20s/it] 58%|█████▊    | 3901/6779 [2:24:43<1:44:01,  2.17s/it]                                                       {'loss': 1.7432, 'learning_rate': 0.00015710888056161965, 'epoch': 0.58}
+ 58%|█████▊    | 3901/6779 [2:24:43<1:44:01,  2.17s/it] 58%|█████▊    | 3902/6779 [2:24:45<1:42:57,  2.15s/it]                                                       {'loss': 1.6296, 'learning_rate': 0.00015701700031085032, 'epoch': 0.58}
+ 58%|█████▊    | 3902/6779 [2:24:45<1:42:57,  2.15s/it] 58%|█████▊    | 3903/6779 [2:24:47<1:42:13,  2.13s/it]                                                       {'loss': 1.794, 'learning_rate': 0.00015692512956992888, 'epoch': 0.58}
+ 58%|█████▊    | 3903/6779 [2:24:47<1:42:13,  2.13s/it] 58%|█████▊    | 3904/6779 [2:24:49<1:42:08,  2.13s/it]                                                       {'loss': 1.7391, 'learning_rate': 0.00015683326835918147, 'epoch': 0.58}
+ 58%|█████▊    | 3904/6779 [2:24:49<1:42:08,  2.13s/it] 58%|█████▊    | 3905/6779 [2:24:51<1:45:51,  2.21s/it]                                                       {'loss': 1.71, 'learning_rate': 0.00015674141669893204, 'epoch': 0.58}
+ 58%|█████▊    | 3905/6779 [2:24:51<1:45:51,  2.21s/it] 58%|█████▊    | 3906/6779 [2:24:53<1:45:19,  2.20s/it]                                                       {'loss': 1.6887, 'learning_rate': 0.00015664957460950245, 'epoch': 0.58}
+ 58%|█████▊    | 3906/6779 [2:24:53<1:45:19,  2.20s/it] 58%|█████▊    | 3907/6779 [2:24:56<1:46:16,  2.22s/it]                                                       {'loss': 1.6526, 'learning_rate': 0.00015655774211121253, 'epoch': 0.58}
+ 58%|█████▊    | 3907/6779 [2:24:56<1:46:16,  2.22s/it] 58%|█████▊    | 3908/6779 [2:24:58<1:45:33,  2.21s/it]                                                       {'loss': 1.7562, 'learning_rate': 0.0001564659192243799, 'epoch': 0.58}
+ 58%|█████▊    | 3908/6779 [2:24:58<1:45:33,  2.21s/it] 58%|█████▊    | 3909/6779 [2:25:00<1:42:05,  2.13s/it]                                                       {'loss': 1.5703, 'learning_rate': 0.00015637410596932005, 'epoch': 0.58}
+ 58%|█████▊    | 3909/6779 [2:25:00<1:42:05,  2.13s/it] 58%|█████▊    | 3910/6779 [2:25:03<1:49:31,  2.29s/it]                                                       {'loss': 1.4714, 'learning_rate': 0.0001562823023663464, 'epoch': 0.58}
+ 58%|█████▊    | 3910/6779 [2:25:03<1:49:31,  2.29s/it] 58%|█████▊    | 3911/6779 [2:25:05<1:46:51,  2.24s/it]                                                       {'loss': 1.8114, 'learning_rate': 0.0001561905084357701, 'epoch': 0.58}
+ 58%|█████▊    | 3911/6779 [2:25:05<1:46:51,  2.24s/it] 58%|█████▊    | 3912/6779 [2:25:07<1:51:19,  2.33s/it]                                                       {'loss': 1.7821, 'learning_rate': 0.0001560987241979004, 'epoch': 0.58}
+ 58%|█████▊    | 3912/6779 [2:25:07<1:51:19,  2.33s/it] 58%|█████▊    | 3913/6779 [2:25:09<1:48:12,  2.27s/it]                                                       {'loss': 1.762, 'learning_rate': 0.00015600694967304415, 'epoch': 0.58}
+ 58%|█████▊    | 3913/6779 [2:25:09<1:48:12,  2.27s/it] 58%|█████▊    | 3914/6779 [2:25:12<1:47:58,  2.26s/it]                                                       {'loss': 1.72, 'learning_rate': 0.00015591518488150617, 'epoch': 0.58}
+ 58%|█████▊    | 3914/6779 [2:25:12<1:47:58,  2.26s/it] 58%|█████▊    | 3915/6779 [2:25:14<1:46:50,  2.24s/it]                                                       {'loss': 1.6285, 'learning_rate': 0.00015582342984358916, 'epoch': 0.58}
+ 58%|█████▊    | 3915/6779 [2:25:14<1:46:50,  2.24s/it] 58%|█████▊    | 3916/6779 [2:25:16<1:46:15,  2.23s/it]                                                       {'loss': 1.7916, 'learning_rate': 0.00015573168457959366, 'epoch': 0.58}
+ 58%|█████▊    | 3916/6779 [2:25:16<1:46:15,  2.23s/it] 58%|█████▊    | 3917/6779 [2:25:18<1:49:28,  2.30s/it]                                                       {'loss': 1.6249, 'learning_rate': 0.00015563994910981795, 'epoch': 0.58}
+ 58%|█████▊    | 3917/6779 [2:25:18<1:49:28,  2.30s/it] 58%|█████▊    | 3918/6779 [2:25:21<1:49:40,  2.30s/it]                                                       {'loss': 1.7417, 'learning_rate': 0.0001555482234545582, 'epoch': 0.58}
+ 58%|█████▊    | 3918/6779 [2:25:21<1:49:40,  2.30s/it] 58%|█████▊    | 3919/6779 [2:25:23<1:45:53,  2.22s/it]                                                       {'loss': 1.5843, 'learning_rate': 0.0001554565076341084, 'epoch': 0.58}
+ 58%|█████▊    | 3919/6779 [2:25:23<1:45:53,  2.22s/it] 58%|█████▊    | 3920/6779 [2:25:25<1:46:40,  2.24s/it]                                                       {'loss': 1.5469, 'learning_rate': 0.00015536480166876044, 'epoch': 0.58}
+ 58%|█████▊    | 3920/6779 [2:25:25<1:46:40,  2.24s/it] 58%|█████▊    | 3921/6779 [2:25:27<1:45:57,  2.22s/it]                                                       {'loss': 1.703, 'learning_rate': 0.00015527310557880383, 'epoch': 0.58}
+ 58%|█████▊    | 3921/6779 [2:25:27<1:45:57,  2.22s/it] 58%|█████▊    | 3922/6779 [2:25:29<1:46:18,  2.23s/it]                                                       {'loss': 1.6534, 'learning_rate': 0.00015518141938452624, 'epoch': 0.58}
+ 58%|█████▊    | 3922/6779 [2:25:29<1:46:18,  2.23s/it] 58%|█████▊    | 3923/6779 [2:25:32<1:47:40,  2.26s/it]                                                       {'loss': 1.5231, 'learning_rate': 0.00015508974310621279, 'epoch': 0.58}
+ 58%|█████▊    | 3923/6779 [2:25:32<1:47:40,  2.26s/it] 58%|█████▊    | 3924/6779 [2:25:34<1:47:48,  2.27s/it]                                                       {'loss': 1.637, 'learning_rate': 0.00015499807676414658, 'epoch': 0.58}
+ 58%|█████▊    | 3924/6779 [2:25:34<1:47:48,  2.27s/it] 58%|█████▊    | 3925/6779 [2:25:36<1:45:07,  2.21s/it]                                                       {'loss': 1.8051, 'learning_rate': 0.0001549064203786085, 'epoch': 0.58}
+ 58%|█████▊    | 3925/6779 [2:25:36<1:45:07,  2.21s/it] 58%|█████▊    | 3926/6779 [2:25:39<1:48:01,  2.27s/it]                                                       {'loss': 1.6812, 'learning_rate': 0.0001548147739698772, 'epoch': 0.58}
+ 58%|█████▊    | 3926/6779 [2:25:39<1:48:01,  2.27s/it] 58%|█████▊    | 3927/6779 [2:25:41<1:50:05,  2.32s/it]                                                       {'loss': 1.748, 'learning_rate': 0.00015472313755822921, 'epoch': 0.58}
+ 58%|█████▊    | 3927/6779 [2:25:41<1:50:05,  2.32s/it] 58%|█████▊    | 3928/6779 [2:25:43<1:48:37,  2.29s/it]                                                       {'loss': 1.7377, 'learning_rate': 0.00015463151116393864, 'epoch': 0.58}
+ 58%|█████▊    | 3928/6779 [2:25:43<1:48:37,  2.29s/it] 58%|█████▊    | 3929/6779 [2:25:45<1:48:20,  2.28s/it]                                                       {'loss': 1.5566, 'learning_rate': 0.0001545398948072777, 'epoch': 0.58}
+ 58%|█████▊    | 3929/6779 [2:25:45<1:48:20,  2.28s/it] 58%|█████▊    | 3930/6779 [2:25:48<1:46:02,  2.23s/it]                                                       {'loss': 1.6635, 'learning_rate': 0.00015444828850851619, 'epoch': 0.58}
+ 58%|█████▊    | 3930/6779 [2:25:48<1:46:02,  2.23s/it] 58%|█████▊    | 3931/6779 [2:25:50<1:45:18,  2.22s/it]                                                       {'loss': 1.7338, 'learning_rate': 0.00015435669228792167, 'epoch': 0.58}
+ 58%|█████▊    | 3931/6779 [2:25:50<1:45:18,  2.22s/it] 58%|█████▊    | 3932/6779 [2:25:52<1:48:44,  2.29s/it]                                                       {'loss': 1.6605, 'learning_rate': 0.00015426510616575945, 'epoch': 0.58}
+ 58%|█████▊    | 3932/6779 [2:25:52<1:48:44,  2.29s/it] 58%|█████▊    | 3933/6779 [2:25:54<1:47:17,  2.26s/it]                                                       {'loss': 1.7191, 'learning_rate': 0.00015417353016229272, 'epoch': 0.58}
+ 58%|█████▊    | 3933/6779 [2:25:54<1:47:17,  2.26s/it] 58%|█████▊    | 3934/6779 [2:25:57<1:48:37,  2.29s/it]                                                       {'loss': 1.6188, 'learning_rate': 0.00015408196429778233, 'epoch': 0.58}
+ 58%|█████▊    | 3934/6779 [2:25:57<1:48:37,  2.29s/it] 58%|█████▊    | 3935/6779 [2:25:59<1:50:19,  2.33s/it]                                                       {'loss': 1.5223, 'learning_rate': 0.00015399040859248687, 'epoch': 0.58}
+ 58%|█████▊    | 3935/6779 [2:25:59<1:50:19,  2.33s/it] 58%|█████▊    | 3936/6779 [2:26:01<1:47:14,  2.26s/it]                                                       {'loss': 1.8333, 'learning_rate': 0.0001538988630666629, 'epoch': 0.58}
+ 58%|█████▊    | 3936/6779 [2:26:01<1:47:14,  2.26s/it] 58%|█████▊    | 3937/6779 [2:26:04<1:46:56,  2.26s/it]                                                       {'loss': 1.7444, 'learning_rate': 0.0001538073277405645, 'epoch': 0.58}
+ 58%|█████▊    | 3937/6779 [2:26:04<1:46:56,  2.26s/it] 58%|█████▊    | 3938/6779 [2:26:06<1:48:30,  2.29s/it]                                                       {'loss': 1.7499, 'learning_rate': 0.00015371580263444357, 'epoch': 0.58}
+ 58%|█████▊    | 3938/6779 [2:26:06<1:48:30,  2.29s/it] 58%|█████▊    | 3939/6779 [2:26:08<1:43:51,  2.19s/it]                                                       {'loss': 1.6976, 'learning_rate': 0.00015362428776854973, 'epoch': 0.58}
+ 58%|█████▊    | 3939/6779 [2:26:08<1:43:51,  2.19s/it] 58%|█████▊    | 3940/6779 [2:26:10<1:45:38,  2.23s/it]                                                       {'loss': 1.742, 'learning_rate': 0.0001535327831631303, 'epoch': 0.58}
+ 58%|█████▊    | 3940/6779 [2:26:10<1:45:38,  2.23s/it] 58%|█████▊    | 3941/6779 [2:26:12<1:44:20,  2.21s/it]                                                       {'loss': 1.7179, 'learning_rate': 0.0001534412888384304, 'epoch': 0.58}
+ 58%|█████▊    | 3941/6779 [2:26:12<1:44:20,  2.21s/it] 58%|█████▊    | 3942/6779 [2:26:14<1:42:06,  2.16s/it]                                                       {'loss': 1.7309, 'learning_rate': 0.00015334980481469275, 'epoch': 0.58}
+ 58%|█████▊    | 3942/6779 [2:26:14<1:42:06,  2.16s/it] 58%|█████▊    | 3943/6779 [2:26:17<1:42:23,  2.17s/it]                                                       {'loss': 1.6823, 'learning_rate': 0.00015325833111215812, 'epoch': 0.58}
+ 58%|█████▊    | 3943/6779 [2:26:17<1:42:23,  2.17s/it] 58%|█████▊    | 3944/6779 [2:26:19<1:43:40,  2.19s/it]                                                       {'loss': 1.829, 'learning_rate': 0.00015316686775106462, 'epoch': 0.58}
+ 58%|█████▊    | 3944/6779 [2:26:19<1:43:40,  2.19s/it] 58%|█████▊    | 3945/6779 [2:26:21<1:42:04,  2.16s/it]                                                       {'loss': 1.5933, 'learning_rate': 0.00015307541475164828, 'epoch': 0.58}
+ 58%|█████▊    | 3945/6779 [2:26:21<1:42:04,  2.16s/it] 58%|█████▊    | 3946/6779 [2:26:23<1:46:36,  2.26s/it]                                                       {'loss': 1.6096, 'learning_rate': 0.0001529839721341427, 'epoch': 0.58}
+ 58%|█████▊    | 3946/6779 [2:26:23<1:46:36,  2.26s/it] 58%|█████▊    | 3947/6779 [2:26:26<1:48:20,  2.30s/it]                                                       {'loss': 1.7923, 'learning_rate': 0.00015289253991877932, 'epoch': 0.58}
+ 58%|█████▊    | 3947/6779 [2:26:26<1:48:20,  2.30s/it] 58%|█████▊    | 3948/6779 [2:26:28<1:44:28,  2.21s/it]                                                       {'loss': 1.741, 'learning_rate': 0.00015280111812578724, 'epoch': 0.58}
+ 58%|█████▊    | 3948/6779 [2:26:28<1:44:28,  2.21s/it] 58%|█████▊    | 3949/6779 [2:26:30<1:44:13,  2.21s/it]                                                       {'loss': 1.7607, 'learning_rate': 0.00015270970677539307, 'epoch': 0.58}
+ 58%|█████▊    | 3949/6779 [2:26:30<1:44:13,  2.21s/it] 58%|█████▊    | 3950/6779 [2:26:32<1:46:17,  2.25s/it]                                                       {'loss': 1.7591, 'learning_rate': 0.00015261830588782146, 'epoch': 0.58}
+ 58%|█████▊    | 3950/6779 [2:26:32<1:46:17,  2.25s/it] 58%|█████▊    | 3951/6779 [2:26:35<1:46:51,  2.27s/it]                                                       {'loss': 1.6634, 'learning_rate': 0.0001525269154832945, 'epoch': 0.58}
+ 58%|█████▊    | 3951/6779 [2:26:35<1:46:51,  2.27s/it] 58%|█████▊    | 3952/6779 [2:26:37<1:42:55,  2.18s/it]                                                       {'loss': 1.6827, 'learning_rate': 0.000152435535582032, 'epoch': 0.58}
+ 58%|█████▊    | 3952/6779 [2:26:37<1:42:55,  2.18s/it] 58%|█████▊    | 3953/6779 [2:26:39<1:40:41,  2.14s/it]                                                       {'loss': 1.611, 'learning_rate': 0.00015234416620425148, 'epoch': 0.58}
+ 58%|█████▊    | 3953/6779 [2:26:39<1:40:41,  2.14s/it] 58%|█████▊    | 3954/6779 [2:26:41<1:41:10,  2.15s/it]                                                       {'loss': 1.7012, 'learning_rate': 0.0001522528073701681, 'epoch': 0.58}
+ 58%|████��▊    | 3954/6779 [2:26:41<1:41:10,  2.15s/it] 58%|█████▊    | 3955/6779 [2:26:43<1:44:24,  2.22s/it]                                                       {'loss': 1.761, 'learning_rate': 0.00015216145909999472, 'epoch': 0.58}
+ 58%|█████▊    | 3955/6779 [2:26:43<1:44:24,  2.22s/it] 58%|█████▊    | 3956/6779 [2:26:45<1:43:30,  2.20s/it]                                                       {'loss': 1.65, 'learning_rate': 0.00015207012141394178, 'epoch': 0.58}
+ 58%|█████▊    | 3956/6779 [2:26:45<1:43:30,  2.20s/it] 58%|█████▊    | 3957/6779 [2:26:48<1:43:59,  2.21s/it]                                                       {'loss': 1.6352, 'learning_rate': 0.00015197879433221756, 'epoch': 0.58}
+ 58%|█████▊    | 3957/6779 [2:26:48<1:43:59,  2.21s/it] 58%|█████▊    | 3958/6779 [2:26:50<1:43:33,  2.20s/it]                                                       {'loss': 1.7081, 'learning_rate': 0.0001518874778750278, 'epoch': 0.58}
+ 58%|█████▊    | 3958/6779 [2:26:50<1:43:33,  2.20s/it] 58%|█████▊    | 3959/6779 [2:26:52<1:44:24,  2.22s/it]                                                       {'loss': 1.7408, 'learning_rate': 0.00015179617206257596, 'epoch': 0.58}
+ 58%|█████▊    | 3959/6779 [2:26:52<1:44:24,  2.22s/it] 58%|█████▊    | 3960/6779 [2:26:54<1:46:41,  2.27s/it]                                                       {'loss': 1.5687, 'learning_rate': 0.0001517048769150632, 'epoch': 0.58}
+ 58%|█████▊    | 3960/6779 [2:26:54<1:46:41,  2.27s/it] 58%|█████▊    | 3961/6779 [2:26:57<1:46:11,  2.26s/it]                                                       {'loss': 1.6746, 'learning_rate': 0.00015161359245268824, 'epoch': 0.58}
+ 58%|█████▊    | 3961/6779 [2:26:57<1:46:11,  2.26s/it] 58%|█████▊    | 3962/6779 [2:26:59<1:45:11,  2.24s/it]                                                       {'loss': 1.7347, 'learning_rate': 0.0001515223186956475, 'epoch': 0.58}
+ 58%|█████▊    | 3962/6779 [2:26:59<1:45:11,  2.24s/it] 58%|█████▊    | 3963/6779 [2:27:02<1:51:16,  2.37s/it]                                                       {'loss': 1.6771, 'learning_rate': 0.00015143105566413492, 'epoch': 0.58}
+ 58%|█████▊    | 3963/6779 [2:27:02<1:51:16,  2.37s/it] 58%|█████▊    | 3964/6779 [2:27:04<1:46:16,  2.27s/it]                                                       {'loss': 1.7928, 'learning_rate': 0.00015133980337834224, 'epoch': 0.58}
+ 58%|█████▊    | 3964/6779 [2:27:04<1:46:16,  2.27s/it] 58%|█████▊    | 3965/6779 [2:27:06<1:44:50,  2.24s/it]                                                       {'loss': 1.7139, 'learning_rate': 0.0001512485618584587, 'epoch': 0.58}
+ 58%|█████▊    | 3965/6779 [2:27:06<1:44:50,  2.24s/it] 59%|█████▊    | 3966/6779 [2:27:08<1:47:45,  2.30s/it]                                                       {'loss': 1.6153, 'learning_rate': 0.00015115733112467116, 'epoch': 0.59}
+ 59%|█████▊    | 3966/6779 [2:27:08<1:47:45,  2.30s/it] 59%|█████▊    | 3967/6779 [2:27:10<1:45:43,  2.26s/it]                                                       {'loss': 1.6403, 'learning_rate': 0.00015106611119716415, 'epoch': 0.59}
+ 59%|█████▊    | 3967/6779 [2:27:10<1:45:43,  2.26s/it] 59%|█████▊    | 3968/6779 [2:27:13<1:50:20,  2.36s/it]                                                       {'loss': 1.7294, 'learning_rate': 0.0001509749020961198, 'epoch': 0.59}
+ 59%|█████▊    | 3968/6779 [2:27:13<1:50:20,  2.36s/it] 59%|█████▊    | 3969/6779 [2:27:15<1:50:12,  2.35s/it]                                                       {'loss': 1.5862, 'learning_rate': 0.00015088370384171778, 'epoch': 0.59}
+ 59%|█████▊    | 3969/6779 [2:27:15<1:50:12,  2.35s/it] 59%|█████▊    | 3970/6779 [2:27:17<1:44:30,  2.23s/it]                                                       {'loss': 1.6618, 'learning_rate': 0.00015079251645413536, 'epoch': 0.59}
+ 59%|█████▊    | 3970/6779 [2:27:17<1:44:30,  2.23s/it] 59%|█████▊    | 3971/6779 [2:27:19<1:42:08,  2.18s/it]                                                       {'loss': 1.7447, 'learning_rate': 0.00015070133995354756, 'epoch': 0.59}
+ 59%|█████▊    | 3971/6779 [2:27:19<1:42:08,  2.18s/it] 59%|█████▊    | 3972/6779 [2:27:22<1:44:15,  2.23s/it]                                                       {'loss': 1.6517, 'learning_rate': 0.00015061017436012684, 'epoch': 0.59}
+ 59%|█████▊    | 3972/6779 [2:27:22<1:44:15,  2.23s/it] 59%|█████▊    | 3973/6779 [2:27:24<1:46:58,  2.29s/it]                                                       {'loss': 1.7993, 'learning_rate': 0.00015051901969404327, 'epoch': 0.59}
+ 59%|█████▊    | 3973/6779 [2:27:24<1:46:58,  2.29s/it] 59%|���████▊    | 3974/6779 [2:27:26<1:48:22,  2.32s/it]                                                       {'loss': 1.6079, 'learning_rate': 0.00015042787597546454, 'epoch': 0.59}
+ 59%|█████▊    | 3974/6779 [2:27:26<1:48:22,  2.32s/it] 59%|█████▊    | 3975/6779 [2:27:29<1:49:33,  2.34s/it]                                                       {'loss': 1.6019, 'learning_rate': 0.00015033674322455592, 'epoch': 0.59}
+ 59%|█████▊    | 3975/6779 [2:27:29<1:49:33,  2.34s/it] 59%|█████▊    | 3976/6779 [2:27:31<1:51:47,  2.39s/it]                                                       {'loss': 1.678, 'learning_rate': 0.00015024562146148017, 'epoch': 0.59}
+ 59%|█████▊    | 3976/6779 [2:27:31<1:51:47,  2.39s/it] 59%|█████▊    | 3977/6779 [2:27:34<1:49:55,  2.35s/it]                                                       {'loss': 1.7168, 'learning_rate': 0.0001501545107063977, 'epoch': 0.59}
+ 59%|█████▊    | 3977/6779 [2:27:34<1:49:55,  2.35s/it] 59%|█████▊    | 3978/6779 [2:27:36<1:44:32,  2.24s/it]                                                       {'loss': 1.7463, 'learning_rate': 0.0001500634109794665, 'epoch': 0.59}
+ 59%|█████▊    | 3978/6779 [2:27:36<1:44:32,  2.24s/it] 59%|█████▊    | 3979/6779 [2:27:38<1:42:10,  2.19s/it]                                                       {'loss': 1.7612, 'learning_rate': 0.0001499723223008421, 'epoch': 0.59}
+ 59%|█████▊    | 3979/6779 [2:27:38<1:42:10,  2.19s/it] 59%|█████▊    | 3980/6779 [2:27:40<1:43:46,  2.22s/it]                                                       {'loss': 1.5439, 'learning_rate': 0.00014988124469067753, 'epoch': 0.59}
+ 59%|█████▊    | 3980/6779 [2:27:40<1:43:46,  2.22s/it] 59%|█████▊    | 3981/6779 [2:27:42<1:41:35,  2.18s/it]                                                       {'loss': 1.7452, 'learning_rate': 0.00014979017816912343, 'epoch': 0.59}
+ 59%|█████▊    | 3981/6779 [2:27:42<1:41:35,  2.18s/it] 59%|█████▊    | 3982/6779 [2:27:44<1:39:28,  2.13s/it]                                                       {'loss': 1.6816, 'learning_rate': 0.00014969912275632793, 'epoch': 0.59}
+ 59%|█████▊    | 3982/6779 [2:27:44<1:39:28,  2.13s/it] 59%|█████▉    | 3983/6779 [2:27:47<1:45:31,  2.26s/it]                                                       {'loss': 1.5676, 'learning_rate': 0.00014960807847243682, 'epoch': 0.59}
+ 59%|█████▉    | 3983/6779 [2:27:47<1:45:31,  2.26s/it] 59%|█████▉    | 3984/6779 [2:27:49<1:45:19,  2.26s/it]                                                       {'loss': 1.709, 'learning_rate': 0.00014951704533759324, 'epoch': 0.59}
+ 59%|█████▉    | 3984/6779 [2:27:49<1:45:19,  2.26s/it] 59%|█████▉    | 3985/6779 [2:27:51<1:42:10,  2.19s/it]                                                       {'loss': 1.7048, 'learning_rate': 0.0001494260233719381, 'epoch': 0.59}
+ 59%|█████▉    | 3985/6779 [2:27:51<1:42:10,  2.19s/it] 59%|█████▉    | 3986/6779 [2:27:53<1:40:44,  2.16s/it]                                                       {'loss': 1.5792, 'learning_rate': 0.00014933501259560962, 'epoch': 0.59}
+ 59%|█████▉    | 3986/6779 [2:27:53<1:40:44,  2.16s/it] 59%|█████▉    | 3987/6779 [2:27:55<1:41:28,  2.18s/it]                                                       {'loss': 1.7306, 'learning_rate': 0.0001492440130287437, 'epoch': 0.59}
+ 59%|█████▉    | 3987/6779 [2:27:55<1:41:28,  2.18s/it] 59%|█████▉    | 3988/6779 [2:27:57<1:39:08,  2.13s/it]                                                       {'loss': 1.6388, 'learning_rate': 0.00014915302469147362, 'epoch': 0.59}
+ 59%|█████▉    | 3988/6779 [2:27:57<1:39:08,  2.13s/it] 59%|█████▉    | 3989/6779 [2:27:59<1:39:03,  2.13s/it]                                                       {'loss': 1.5687, 'learning_rate': 0.00014906204760393034, 'epoch': 0.59}
+ 59%|█████▉    | 3989/6779 [2:27:59<1:39:03,  2.13s/it] 59%|█████▉    | 3990/6779 [2:28:02<1:39:02,  2.13s/it]                                                       {'loss': 1.8389, 'learning_rate': 0.0001489710817862422, 'epoch': 0.59}
+ 59%|█████▉    | 3990/6779 [2:28:02<1:39:02,  2.13s/it] 59%|█████▉    | 3991/6779 [2:28:04<1:42:13,  2.20s/it]                                                       {'loss': 1.6817, 'learning_rate': 0.00014888012725853498, 'epoch': 0.59}
+ 59%|█████▉    | 3991/6779 [2:28:04<1:42:13,  2.20s/it] 59%|█████▉    | 3992/6779 [2:28:06<1:40:32,  2.16s/it]                                                       {'loss': 1.7476, 'learning_rate': 0.00014878918404093226, 'epoch': 0.59}
+ 59%|█████▉    | 3992/6779 [2:28:06<1:40:32,  2.16s/it] 59%|█████▉    | 3993/6779 [2:28:08<1:41:16,  2.18s/it]                                                       {'loss': 1.6785, 'learning_rate': 0.00014869825215355488, 'epoch': 0.59}
+ 59%|█████▉    | 3993/6779 [2:28:08<1:41:16,  2.18s/it] 59%|█████▉    | 3994/6779 [2:28:10<1:40:55,  2.17s/it]                                                       {'loss': 1.6818, 'learning_rate': 0.00014860733161652117, 'epoch': 0.59}
+ 59%|█████▉    | 3994/6779 [2:28:10<1:40:55,  2.17s/it] 59%|█████▉    | 3995/6779 [2:28:13<1:41:05,  2.18s/it]                                                       {'loss': 1.4718, 'learning_rate': 0.00014851642244994703, 'epoch': 0.59}
+ 59%|█████▉    | 3995/6779 [2:28:13<1:41:05,  2.18s/it] 59%|█████▉    | 3996/6779 [2:28:16<1:54:46,  2.47s/it]                                                       {'loss': 1.4172, 'learning_rate': 0.00014842552467394577, 'epoch': 0.59}
+ 59%|█████▉    | 3996/6779 [2:28:16<1:54:46,  2.47s/it] 59%|█████▉    | 3997/6779 [2:28:18<1:49:51,  2.37s/it]                                                       {'loss': 1.6319, 'learning_rate': 0.00014833463830862828, 'epoch': 0.59}
+ 59%|█████▉    | 3997/6779 [2:28:18<1:49:51,  2.37s/it] 59%|█████▉    | 3998/6779 [2:28:20<1:47:15,  2.31s/it]                                                       {'loss': 1.6955, 'learning_rate': 0.00014824376337410283, 'epoch': 0.59}
+ 59%|█████▉    | 3998/6779 [2:28:20<1:47:15,  2.31s/it] 59%|█████▉    | 3999/6779 [2:28:22<1:44:12,  2.25s/it]                                                       {'loss': 1.6735, 'learning_rate': 0.00014815289989047518, 'epoch': 0.59}
+ 59%|█████▉    | 3999/6779 [2:28:22<1:44:12,  2.25s/it] 59%|█████▉    | 4000/6779 [2:28:24<1:42:02,  2.20s/it]                                                       {'loss': 1.8226, 'learning_rate': 0.00014806204787784868, 'epoch': 0.59}
+ 59%|█████▉    | 4000/6779 [2:28:24<1:42:02,  2.20s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+ 59%|█████▉    | 4001/6779 [2:28:27<1:47:54,  2.33s/it]                                                       {'loss': 1.5954, 'learning_rate': 0.00014797120735632398, 'epoch': 0.59}
+ 59%|█████▉    | 4001/6779 [2:28:27<1:47:54,  2.33s/it] 59%|█████▉    | 4002/6779 [2:28:29<1:48:25,  2.34s/it]                                                       {'loss': 1.594, 'learning_rate': 0.0001478803783459993, 'epoch': 0.59}
+ 59%|█████▉    | 4002/6779 [2:28:29<1:48:25,  2.34s/it] 59%|█████▉    | 4003/6779 [2:28:31<1:47:23,  2.32s/it]                                                       {'loss': 1.739, 'learning_rate': 0.00014778956086697017, 'epoch': 0.59}
+ 59%|█████▉    | 4003/6779 [2:28:32<1:47:23,  2.32s/it] 59%|█████▉    | 4004/6779 [2:28:34<1:46:06,  2.29s/it]                                                       {'loss': 1.6224, 'learning_rate': 0.0001476987549393297, 'epoch': 0.59}
+ 59%|█████▉    | 4004/6779 [2:28:34<1:46:06,  2.29s/it] 59%|█████▉    | 4005/6779 [2:28:36<1:46:06,  2.30s/it]                                                       {'loss': 1.7411, 'learning_rate': 0.00014760796058316839, 'epoch': 0.59}
+ 59%|█████▉    | 4005/6779 [2:28:36<1:46:06,  2.30s/it] 59%|█████▉    | 4006/6779 [2:28:38<1:41:23,  2.19s/it]                                                       {'loss': 1.5782, 'learning_rate': 0.00014751717781857413, 'epoch': 0.59}
+ 59%|█████▉    | 4006/6779 [2:28:38<1:41:23,  2.19s/it] 59%|█████▉    | 4007/6779 [2:28:40<1:43:49,  2.25s/it]                                                       {'loss': 1.9473, 'learning_rate': 0.00014742640666563246, 'epoch': 0.59}
+ 59%|█████▉    | 4007/6779 [2:28:40<1:43:49,  2.25s/it] 59%|█████▉    | 4008/6779 [2:28:43<1:43:22,  2.24s/it]                                                       {'loss': 1.4968, 'learning_rate': 0.00014733564714442617, 'epoch': 0.59}
+ 59%|█████▉    | 4008/6779 [2:28:43<1:43:22,  2.24s/it] 59%|█████▉    | 4009/6779 [2:28:45<1:44:02,  2.25s/it]                                                       {'loss': 1.601, 'learning_rate': 0.00014724489927503542, 'epoch': 0.59}
+ 59%|█████▉    | 4009/6779 [2:28:45<1:44:02,  2.25s/it] 59%|█████▉    | 4010/6779 [2:28:47<1:42:16,  2.22s/it]                                                       {'loss': 1.7732, 'learning_rate': 0.00014715416307753797, 'epoch': 0.59}
+ 59%|█████▉    | 4010/6779 [2:28:47<1:42:16,  2.22s/it] 59%|█████▉    | 4011/6779 [2:28:49<1:43:11,  2.24s/it]                                                       {'loss': 1.6121, 'learning_rate': 0.00014706343857200883, 'epoch': 0.59}
+ 59%|█████▉    | 4011/6779 [2:28:49<1:43:11,  2.24s/it] 59%|█████▉    | 4012/6779 [2:28:52<1:44:27,  2.26s/it]                                                       {'loss': 1.6525, 'learning_rate': 0.00014697272577852055, 'epoch': 0.59}
+ 59%|█████▉    | 4012/6779 [2:28:52<1:44:27,  2.26s/it] 59%|█████▉    | 4013/6779 [2:28:54<1:43:04,  2.24s/it]                                                       {'loss': 1.6828, 'learning_rate': 0.00014688202471714292, 'epoch': 0.59}
+ 59%|█████▉    | 4013/6779 [2:28:54<1:43:04,  2.24s/it] 59%|█████▉    | 4014/6779 [2:28:56<1:41:44,  2.21s/it]                                                       {'loss': 1.5331, 'learning_rate': 0.0001467913354079434, 'epoch': 0.59}
+ 59%|█████▉    | 4014/6779 [2:28:56<1:41:44,  2.21s/it] 59%|█████▉    | 4015/6779 [2:28:58<1:41:21,  2.20s/it]                                                       {'loss': 1.5904, 'learning_rate': 0.0001467006578709867, 'epoch': 0.59}
+ 59%|█████▉    | 4015/6779 [2:28:58<1:41:21,  2.20s/it] 59%|█████▉    | 4016/6779 [2:29:00<1:39:55,  2.17s/it]                                                       {'loss': 1.7232, 'learning_rate': 0.00014660999212633485, 'epoch': 0.59}
+ 59%|█████▉    | 4016/6779 [2:29:00<1:39:55,  2.17s/it] 59%|█████▉    | 4017/6779 [2:29:02<1:38:48,  2.15s/it]                                                       {'loss': 1.6127, 'learning_rate': 0.00014651933819404743, 'epoch': 0.59}
+ 59%|█████▉    | 4017/6779 [2:29:02<1:38:48,  2.15s/it] 59%|█████▉    | 4018/6779 [2:29:04<1:38:14,  2.13s/it]                                                       {'loss': 1.8082, 'learning_rate': 0.00014642869609418123, 'epoch': 0.59}
+ 59%|█████▉    | 4018/6779 [2:29:04<1:38:14,  2.13s/it] 59%|█████▉    | 4019/6779 [2:29:07<1:39:36,  2.17s/it]                                                       {'loss': 1.5863, 'learning_rate': 0.00014633806584679062, 'epoch': 0.59}
+ 59%|█████▉    | 4019/6779 [2:29:07<1:39:36,  2.17s/it] 59%|█████▉    | 4020/6779 [2:29:09<1:48:42,  2.36s/it]                                                       {'loss': 1.8597, 'learning_rate': 0.00014624744747192704, 'epoch': 0.59}
+ 59%|█████▉    | 4020/6779 [2:29:09<1:48:42,  2.36s/it] 59%|█████▉    | 4021/6779 [2:29:11<1:42:32,  2.23s/it]                                                       {'loss': 1.613, 'learning_rate': 0.00014615684098963979, 'epoch': 0.59}
+ 59%|█████▉    | 4021/6779 [2:29:11<1:42:32,  2.23s/it] 59%|█████▉    | 4022/6779 [2:29:13<1:39:58,  2.18s/it]                                                       {'loss': 1.585, 'learning_rate': 0.0001460662464199751, 'epoch': 0.59}
+ 59%|█████▉    | 4022/6779 [2:29:13<1:39:58,  2.18s/it] 59%|█████▉    | 4023/6779 [2:29:16<1:43:14,  2.25s/it]                                                       {'loss': 1.6306, 'learning_rate': 0.00014597566378297673, 'epoch': 0.59}
+ 59%|█████▉    | 4023/6779 [2:29:16<1:43:14,  2.25s/it] 59%|█████▉    | 4024/6779 [2:29:18<1:43:15,  2.25s/it]                                                       {'loss': 1.6741, 'learning_rate': 0.00014588509309868583, 'epoch': 0.59}
+ 59%|█████▉    | 4024/6779 [2:29:18<1:43:15,  2.25s/it] 59%|█████▉    | 4025/6779 [2:29:20<1:41:58,  2.22s/it]                                                       {'loss': 1.8019, 'learning_rate': 0.00014579453438714083, 'epoch': 0.59}
+ 59%|█████▉    | 4025/6779 [2:29:20<1:41:58,  2.22s/it] 59%|█████▉    | 4026/6779 [2:29:22<1:40:58,  2.20s/it]                                                       {'loss': 1.631, 'learning_rate': 0.0001457039876683776, 'epoch': 0.59}
+ 59%|█████▉    | 4026/6779 [2:29:22<1:40:58,  2.20s/it] 59%|█████▉    | 4027/6779 [2:29:25<1:43:43,  2.26s/it]                                                       {'loss': 1.6822, 'learning_rate': 0.0001456134529624292, 'epoch': 0.59}
+ 59%|█████▉    | 4027/6779 [2:29:25<1:43:43,  2.26s/it] 59%|█████▉    | 4028/6779 [2:29:27<1:43:37,  2.26s/it]                                                       {'loss': 1.6158, 'learning_rate': 0.00014552293028932627, 'epoch': 0.59}
+ 59%|█████▉    | 4028/6779 [2:29:27<1:43:37,  2.26s/it] 59%|█████▉    | 4029/6779 [2:29:29<1:40:40,  2.20s/it]                                                       {'loss': 1.7164, 'learning_rate': 0.00014543241966909657, 'epoch': 0.59}
+ 59%|█████▉    | 4029/6779 [2:29:29<1:40:40,  2.20s/it] 59%|█████▉    | 4030/6779 [2:29:32<1:50:18,  2.41s/it]                                                       {'loss': 1.6281, 'learning_rate': 0.0001453419211217653, 'epoch': 0.59}
+ 59%|█████▉    | 4030/6779 [2:29:32<1:50:18,  2.41s/it] 59%|█████▉    | 4031/6779 [2:29:34<1:47:08,  2.34s/it]                                                       {'loss': 1.6396, 'learning_rate': 0.00014525143466735497, 'epoch': 0.59}
+ 59%|█████▉    | 4031/6779 [2:29:34<1:47:08,  2.34s/it] 59%|█████▉    | 4032/6779 [2:29:37<1:47:18,  2.34s/it]                                                       {'loss': 1.6129, 'learning_rate': 0.0001451609603258854, 'epoch': 0.59}
+ 59%|█████▉    | 4032/6779 [2:29:37<1:47:18,  2.34s/it] 59%|█████▉    | 4033/6779 [2:29:39<1:43:40,  2.27s/it]                                                       {'loss': 1.6679, 'learning_rate': 0.00014507049811737378, 'epoch': 0.59}
+ 59%|█████▉    | 4033/6779 [2:29:39<1:43:40,  2.27s/it] 60%|█████▉    | 4034/6779 [2:29:41<1:45:10,  2.30s/it]                                                       {'loss': 1.6472, 'learning_rate': 0.0001449800480618345, 'epoch': 0.6}
+ 60%|█████▉    | 4034/6779 [2:29:41<1:45:10,  2.30s/it] 60%|█████▉    | 4035/6779 [2:29:43<1:45:15,  2.30s/it]                                                       {'loss': 1.7998, 'learning_rate': 0.00014488961017927943, 'epoch': 0.6}
+ 60%|█████▉    | 4035/6779 [2:29:43<1:45:15,  2.30s/it] 60%|█████▉    | 4036/6779 [2:29:45<1:43:22,  2.26s/it]                                                       {'loss': 1.8147, 'learning_rate': 0.0001447991844897176, 'epoch': 0.6}
+ 60%|█████▉    | 4036/6779 [2:29:45<1:43:22,  2.26s/it] 60%|█████▉    | 4037/6779 [2:29:48<1:43:32,  2.27s/it]                                                       {'loss': 1.8575, 'learning_rate': 0.00014470877101315538, 'epoch': 0.6}
+ 60%|█████▉    | 4037/6779 [2:29:48<1:43:32,  2.27s/it] 60%|█████▉    | 4038/6779 [2:29:50<1:42:02,  2.23s/it]                                                       {'loss': 1.6102, 'learning_rate': 0.00014461836976959654, 'epoch': 0.6}
+ 60%|█████▉    | 4038/6779 [2:29:50<1:42:02,  2.23s/it] 60%|█████▉    | 4039/6779 [2:29:52<1:43:01,  2.26s/it]                                                       {'loss': 1.625, 'learning_rate': 0.00014452798077904197, 'epoch': 0.6}
+ 60%|█████▉    | 4039/6779 [2:29:52<1:43:01,  2.26s/it] 60%|█████▉    | 4040/6779 [2:29:54<1:40:56,  2.21s/it]                                                       {'loss': 1.7526, 'learning_rate': 0.00014443760406148996, 'epoch': 0.6}
+ 60%|█████▉    | 4040/6779 [2:29:54<1:40:56,  2.21s/it] 60%|█████▉    | 4041/6779 [2:29:57<1:40:54,  2.21s/it]                                                       {'loss': 1.5441, 'learning_rate': 0.00014434723963693607, 'epoch': 0.6}
+ 60%|█████▉    | 4041/6779 [2:29:57<1:40:54,  2.21s/it] 60%|█████▉    | 4042/6779 [2:29:59<1:40:14,  2.20s/it]                                                       {'loss': 1.6391, 'learning_rate': 0.00014425688752537315, 'epoch': 0.6}
+ 60%|█████▉    | 4042/6779 [2:29:59<1:40:14,  2.20s/it] 60%|█████▉    | 4043/6779 [2:30:01<1:41:37,  2.23s/it]                                                       {'loss': 1.6833, 'learning_rate': 0.00014416654774679133, 'epoch': 0.6}
+ 60%|█████▉    | 4043/6779 [2:30:01<1:41:37,  2.23s/it] 60%|█████▉    | 4044/6779 [2:30:03<1:39:22,  2.18s/it]                                                       {'loss': 1.6702, 'learning_rate': 0.00014407622032117792, 'epoch': 0.6}
+ 60%|█████▉    | 4044/6779 [2:30:03<1:39:22,  2.18s/it] 60%|█████▉    | 4045/6779 [2:30:05<1:40:06,  2.20s/it]                                                       {'loss': 1.567, 'learning_rate': 0.00014398590526851766, 'epoch': 0.6}
+ 60%|█████▉    | 4045/6779 [2:30:05<1:40:06,  2.20s/it] 60%|█████▉    | 4046/6779 [2:30:07<1:38:47,  2.17s/it]                                                       {'loss': 1.6884, 'learning_rate': 0.00014389560260879235, 'epoch': 0.6}
+ 60%|█████▉    | 4046/6779 [2:30:07<1:38:47,  2.17s/it] 60%|█████▉    | 4047/6779 [2:30:09<1:37:00,  2.13s/it]                                                       {'loss': 1.6138, 'learning_rate': 0.00014380531236198122, 'epoch': 0.6}
+ 60%|█████▉    | 4047/6779 [2:30:09<1:37:00,  2.13s/it] 60%|█████▉    | 4048/6779 [2:30:12<1:39:43,  2.19s/it]                                                       {'loss': 1.5257, 'learning_rate': 0.00014371503454806066, 'epoch': 0.6}
+ 60%|█████▉    | 4048/6779 [2:30:12<1:39:43,  2.19s/it] 60%|█████▉    | 4049/6779 [2:30:14<1:39:22,  2.18s/it]                                                       {'loss': 1.7083, 'learning_rate': 0.0001436247691870044, 'epoch': 0.6}
+ 60%|█████▉    | 4049/6779 [2:30:14<1:39:22,  2.18s/it] 60%|█████▉    | 4050/6779 [2:30:16<1:39:03,  2.18s/it]                                                       {'loss': 1.7437, 'learning_rate': 0.0001435345162987833, 'epoch': 0.6}
+ 60%|█████▉    | 4050/6779 [2:30:16<1:39:03,  2.18s/it] 60%|█████▉    | 4051/6779 [2:30:18<1:38:22,  2.16s/it]                                                       {'loss': 1.9665, 'learning_rate': 0.00014344427590336556, 'epoch': 0.6}
+ 60%|█████▉    | 4051/6779 [2:30:18<1:38:22,  2.16s/it] 60%|█████▉    | 4052/6779 [2:30:20<1:38:49,  2.17s/it]                                                       {'loss': 1.5301, 'learning_rate': 0.00014335404802071655, 'epoch': 0.6}
+ 60%|█████▉    | 4052/6779 [2:30:20<1:38:49,  2.17s/it] 60%|█████▉    | 4053/6779 [2:30:23<1:37:13,  2.14s/it]                                                       {'loss': 1.7462, 'learning_rate': 0.00014326383267079885, 'epoch': 0.6}
+ 60%|█████▉    | 4053/6779 [2:30:23<1:37:13,  2.14s/it] 60%|█████▉    | 4054/6779 [2:30:25<1:43:15,  2.27s/it]                                                       {'loss': 1.7714, 'learning_rate': 0.0001431736298735724, 'epoch': 0.6}
+ 60%|█████▉    | 4054/6779 [2:30:25<1:43:15,  2.27s/it] 60%|█████▉    | 4055/6779 [2:30:27<1:44:09,  2.29s/it]                                                       {'loss': 1.5211, 'learning_rate': 0.00014308343964899414, 'epoch': 0.6}
+ 60%|█████▉    | 4055/6779 [2:30:27<1:44:09,  2.29s/it] 60%|█████▉    | 4056/6779 [2:30:30<1:42:43,  2.26s/it]                                                       {'loss': 1.8166, 'learning_rate': 0.0001429932620170185, 'epoch': 0.6}
+ 60%|█████▉    | 4056/6779 [2:30:30<1:42:43,  2.26s/it] 60%|█████▉    | 4057/6779 [2:30:32<1:40:36,  2.22s/it]                                                       {'loss': 1.6243, 'learning_rate': 0.00014290309699759694, 'epoch': 0.6}
+ 60%|█████▉    | 4057/6779 [2:30:32<1:40:36,  2.22s/it] 60%|█████▉    | 4058/6779 [2:30:34<1:39:38,  2.20s/it]                                                       {'loss': 1.7519, 'learning_rate': 0.00014281294461067817, 'epoch': 0.6}
+ 60%|█████▉    | 4058/6779 [2:30:34<1:39:38,  2.20s/it] 60%|█████▉    | 4059/6779 [2:30:36<1:38:11,  2.17s/it]                                                       {'loss': 1.7504, 'learning_rate': 0.0001427228048762081, 'epoch': 0.6}
+ 60%|█████▉    | 4059/6779 [2:30:36<1:38:11,  2.17s/it] 60%|█████▉    | 4060/6779 [2:30:38<1:38:43,  2.18s/it]                                                       {'loss': 1.7038, 'learning_rate': 0.00014263267781412987, 'epoch': 0.6}
+ 60%|█████▉    | 4060/6779 [2:30:38<1:38:43,  2.18s/it] 60%|█████▉    | 4061/6779 [2:30:40<1:37:53,  2.16s/it]                                                       {'loss': 1.7446, 'learning_rate': 0.0001425425634443838, 'epoch': 0.6}
+ 60%|█████▉    | 4061/6779 [2:30:40<1:37:53,  2.16s/it] 60%|█████▉    | 4062/6779 [2:30:42<1:37:44,  2.16s/it]                                                       {'loss': 1.7653, 'learning_rate': 0.00014245246178690727, 'epoch': 0.6}
+ 60%|█████▉    | 4062/6779 [2:30:42<1:37:44,  2.16s/it] 60%|█████▉    | 4063/6779 [2:30:45<1:39:47,  2.20s/it]                                                       {'loss': 1.7723, 'learning_rate': 0.0001423623728616352, 'epoch': 0.6}
+ 60%|█████▉    | 4063/6779 [2:30:45<1:39:47,  2.20s/it] 60%|█████▉    | 4064/6779 [2:30:47<1:40:10,  2.21s/it]                                                       {'loss': 1.6568, 'learning_rate': 0.00014227229668849938, 'epoch': 0.6}
+ 60%|█████▉    | 4064/6779 [2:30:47<1:40:10,  2.21s/it] 60%|█████▉    | 4065/6779 [2:30:49<1:39:33,  2.20s/it]                                                       {'loss': 1.5526, 'learning_rate': 0.00014218223328742885, 'epoch': 0.6}
+ 60%|█████▉    | 4065/6779 [2:30:49<1:39:33,  2.20s/it] 60%|█████▉    | 4066/6779 [2:30:51<1:38:46,  2.18s/it]                                                       {'loss': 1.5646, 'learning_rate': 0.0001420921826783498, 'epoch': 0.6}
+ 60%|█████▉    | 4066/6779 [2:30:51<1:38:46,  2.18s/it] 60%|█████▉    | 4067/6779 [2:30:53<1:37:57,  2.17s/it]                                                       {'loss': 1.6087, 'learning_rate': 0.00014200214488118565, 'epoch': 0.6}
+ 60%|█████▉    | 4067/6779 [2:30:53<1:37:57,  2.17s/it] 60%|██████    | 4068/6779 [2:30:55<1:35:58,  2.12s/it]                                                       {'loss': 1.668, 'learning_rate': 0.00014191211991585704, 'epoch': 0.6}
+ 60%|██████    | 4068/6779 [2:30:55<1:35:58,  2.12s/it] 60%|██████    | 4069/6779 [2:30:58<1:34:32,  2.09s/it]                                                       {'loss': 1.5887, 'learning_rate': 0.00014182210780228156, 'epoch': 0.6}
+ 60%|██████    | 4069/6779 [2:30:58<1:34:32,  2.09s/it] 60%|██████    | 4070/6779 [2:31:00<1:36:45,  2.14s/it]                                                       {'loss': 1.7061, 'learning_rate': 0.00014173210856037428, 'epoch': 0.6}
+ 60%|██████    | 4070/6779 [2:31:00<1:36:45,  2.14s/it] 60%|██████    | 4071/6779 [2:31:02<1:36:13,  2.13s/it]                                                       {'loss': 1.6819, 'learning_rate': 0.0001416421222100471, 'epoch': 0.6}
+ 60%|██████    | 4071/6779 [2:31:02<1:36:13,  2.13s/it] 60%|██████    | 4072/6779 [2:31:04<1:36:53,  2.15s/it]                                                       {'loss': 1.5917, 'learning_rate': 0.00014155214877120928, 'epoch': 0.6}
+ 60%|██████    | 4072/6779 [2:31:04<1:36:53,  2.15s/it] 60%|██████    | 4073/6779 [2:31:06<1:37:17,  2.16s/it]                                                       {'loss': 1.7417, 'learning_rate': 0.00014146218826376715, 'epoch': 0.6}
+ 60%|██████    | 4073/6779 [2:31:06<1:37:17,  2.16s/it] 60%|██████    | 4074/6779 [2:31:09<1:39:02,  2.20s/it]                                                       {'loss': 1.6556, 'learning_rate': 0.00014137224070762412, 'epoch': 0.6}
+ 60%|██████    | 4074/6779 [2:31:09<1:39:02,  2.20s/it] 60%|██████    | 4075/6779 [2:31:11<1:37:39,  2.17s/it]                                                       {'loss': 1.6784, 'learning_rate': 0.00014128230612268081, 'epoch': 0.6}
+ 60%|██████    | 4075/6779 [2:31:11<1:37:39,  2.17s/it] 60%|██████    | 4076/6779 [2:31:13<1:36:05,  2.13s/it]                                                       {'loss': 1.608, 'learning_rate': 0.00014119238452883496, 'epoch': 0.6}
+ 60%|██████    | 4076/6779 [2:31:13<1:36:05,  2.13s/it] 60%|██████    | 4077/6779 [2:31:15<1:39:14,  2.20s/it]                                                       {'loss': 1.6466, 'learning_rate': 0.00014110247594598135, 'epoch': 0.6}
+ 60%|██████    | 4077/6779 [2:31:15<1:39:14,  2.20s/it] 60%|██████    | 4078/6779 [2:31:17<1:40:04,  2.22s/it]                                                       {'loss': 1.7322, 'learning_rate': 0.0001410125803940121, 'epoch': 0.6}
+ 60%|██████    | 4078/6779 [2:31:17<1:40:04,  2.22s/it] 60%|██████    | 4079/6779 [2:31:20<1:43:05,  2.29s/it]                                                       {'loss': 1.7129, 'learning_rate': 0.00014092269789281627, 'epoch': 0.6}
+ 60%|██████    | 4079/6779 [2:31:20<1:43:05,  2.29s/it] 60%|██████    | 4080/6779 [2:31:22<1:42:16,  2.27s/it]                                                       {'loss': 1.6496, 'learning_rate': 0.00014083282846228003, 'epoch': 0.6}
+ 60%|██████    | 4080/6779 [2:31:22<1:42:16,  2.27s/it] 60%|██████    | 4081/6779 [2:31:24<1:38:55,  2.20s/it]                                                       {'loss': 1.6766, 'learning_rate': 0.00014074297212228676, 'epoch': 0.6}
+ 60%|██████    | 4081/6779 [2:31:24<1:38:55,  2.20s/it] 60%|██████    | 4082/6779 [2:31:26<1:39:52,  2.22s/it]                                                       {'loss': 1.8497, 'learning_rate': 0.00014065312889271678, 'epoch': 0.6}
+ 60%|██████    | 4082/6779 [2:31:26<1:39:52,  2.22s/it] 60%|██████    | 4083/6779 [2:31:29<1:42:00,  2.27s/it]                                                       {'loss': 1.7482, 'learning_rate': 0.00014056329879344768, 'epoch': 0.6}
+ 60%|██████    | 4083/6779 [2:31:29<1:42:00,  2.27s/it] 60%|██████    | 4084/6779 [2:31:31<1:43:03,  2.29s/it]                                                       {'loss': 1.7584, 'learning_rate': 0.00014047348184435395, 'epoch': 0.6}
+ 60%|██████    | 4084/6779 [2:31:31<1:43:03,  2.29s/it] 60%|██████    | 4085/6779 [2:31:33<1:38:07,  2.19s/it]                                                       {'loss': 1.6763, 'learning_rate': 0.0001403836780653075, 'epoch': 0.6}
+ 60%|██████    | 4085/6779 [2:31:33<1:38:07,  2.19s/it] 60%|██████    | 4086/6779 [2:31:35<1:36:12,  2.14s/it]                                                       {'loss': 1.7161, 'learning_rate': 0.00014029388747617699, 'epoch': 0.6}
+ 60%|██████    | 4086/6779 [2:31:35<1:36:12,  2.14s/it] 60%|██████    | 4087/6779 [2:31:37<1:37:01,  2.16s/it]                                                       {'loss': 1.7801, 'learning_rate': 0.00014020411009682836, 'epoch': 0.6}
+ 60%|██████    | 4087/6779 [2:31:37<1:37:01,  2.16s/it] 60%|██████    | 4088/6779 [2:31:40<1:39:29,  2.22s/it]                                                       {'loss': 1.5082, 'learning_rate': 0.00014011434594712454, 'epoch': 0.6}
+ 60%|██████    | 4088/6779 [2:31:40<1:39:29,  2.22s/it] 60%|██████    | 4089/6779 [2:31:42<1:39:59,  2.23s/it]                                                       {'loss': 1.5808, 'learning_rate': 0.00014002459504692554, 'epoch': 0.6}
+ 60%|██████    | 4089/6779 [2:31:42<1:39:59,  2.23s/it] 60%|██████    | 4090/6779 [2:31:44<1:42:06,  2.28s/it]                                                       {'loss': 1.8052, 'learning_rate': 0.00013993485741608844, 'epoch': 0.6}
+ 60%|██████    | 4090/6779 [2:31:44<1:42:06,  2.28s/it] 60%|██████    | 4091/6779 [2:31:46<1:37:46,  2.18s/it]                                                       {'loss': 1.6708, 'learning_rate': 0.00013984513307446737, 'epoch': 0.6}
+ 60%|██████    | 4091/6779 [2:31:46<1:37:46,  2.18s/it] 60%|██████    | 4092/6779 [2:31:48<1:37:28,  2.18s/it]                                                       {'loss': 1.8493, 'learning_rate': 0.00013975542204191363, 'epoch': 0.6}
+ 60%|██████    | 4092/6779 [2:31:48<1:37:28,  2.18s/it] 60%|██████    | 4093/6779 [2:31:51<1:42:38,  2.29s/it]                                                       {'loss': 1.7331, 'learning_rate': 0.00013966572433827547, 'epoch': 0.6}
+ 60%|██████    | 4093/6779 [2:31:51<1:42:38,  2.29s/it] 60%|██████    | 4094/6779 [2:31:53<1:40:11,  2.24s/it]                                                       {'loss': 1.7174, 'learning_rate': 0.00013957603998339816, 'epoch': 0.6}
+ 60%|██████    | 4094/6779 [2:31:53<1:40:11,  2.24s/it] 60%|██████    | 4095/6779 [2:31:55<1:41:19,  2.27s/it]                                                       {'loss': 1.7221, 'learning_rate': 0.00013948636899712414, 'epoch': 0.6}
+ 60%|██████    | 4095/6779 [2:31:55<1:41:19,  2.27s/it] 60%|██████    | 4096/6779 [2:31:58<1:42:46,  2.30s/it]                                                       {'loss': 1.6295, 'learning_rate': 0.0001393967113992928, 'epoch': 0.6}
+ 60%|██████    | 4096/6779 [2:31:58<1:42:46,  2.30s/it] 60%|██████    | 4097/6779 [2:32:00<1:41:23,  2.27s/it]                                                       {'loss': 1.7681, 'learning_rate': 0.00013930706720974054, 'epoch': 0.6}
+ 60%|██████    | 4097/6779 [2:32:00<1:41:23,  2.27s/it] 60%|██████    | 4098/6779 [2:32:02<1:38:45,  2.21s/it]                                                       {'loss': 1.6097, 'learning_rate': 0.00013921743644830086, 'epoch': 0.6}
+ 60%|██████    | 4098/6779 [2:32:02<1:38:45,  2.21s/it] 60%|██████    | 4099/6779 [2:32:04<1:39:41,  2.23s/it]                                                       {'loss': 1.7801, 'learning_rate': 0.0001391278191348043, 'epoch': 0.6}
+ 60%|██████    | 4099/6779 [2:32:04<1:39:41,  2.23s/it] 60%|██████    | 4100/6779 [2:32:07<1:39:45,  2.23s/it]                                                       {'loss': 1.7029, 'learning_rate': 0.00013903821528907844, 'epoch': 0.6}
+ 60%|██████    | 4100/6779 [2:32:07<1:39:45,  2.23s/it] 60%|██████    | 4101/6779 [2:32:09<1:36:57,  2.17s/it]                                                       {'loss': 1.7299, 'learning_rate': 0.00013894862493094777, 'epoch': 0.6}
+ 60%|██████    | 4101/6779 [2:32:09<1:36:57,  2.17s/it] 61%|██████    | 4102/6779 [2:32:11<1:39:49,  2.24s/it]                                                       {'loss': 1.8923, 'learning_rate': 0.00013885904808023388, 'epoch': 0.61}
+ 61%|██████    | 4102/6779 [2:32:11<1:39:49,  2.24s/it] 61%|██████    | 4103/6779 [2:32:13<1:37:52,  2.19s/it]                                                       {'loss': 1.6911, 'learning_rate': 0.00013876948475675534, 'epoch': 0.61}
+ 61%|██████    | 4103/6779 [2:32:13<1:37:52,  2.19s/it] 61%|██████    | 4104/6779 [2:32:16<1:46:48,  2.40s/it]                                                       {'loss': 1.7039, 'learning_rate': 0.00013867993498032776, 'epoch': 0.61}
+ 61%|██████    | 4104/6779 [2:32:16<1:46:48,  2.40s/it] 61%|██████    | 4105/6779 [2:32:18<1:44:07,  2.34s/it]                                                       {'loss': 1.7673, 'learning_rate': 0.00013859039877076368, 'epoch': 0.61}
+ 61%|██████    | 4105/6779 [2:32:18<1:44:07,  2.34s/it] 61%|██████    | 4106/6779 [2:32:20<1:41:06,  2.27s/it]                                                       {'loss': 1.5532, 'learning_rate': 0.00013850087614787282, 'epoch': 0.61}
+ 61%|██████    | 4106/6779 [2:32:20<1:41:06,  2.27s/it] 61%|██████    | 4107/6779 [2:32:23<1:42:26,  2.30s/it]                                                       {'loss': 1.6937, 'learning_rate': 0.0001384113671314617, 'epoch': 0.61}
+ 61%|██████    | 4107/6779 [2:32:23<1:42:26,  2.30s/it] 61%|██████    | 4108/6779 [2:32:25<1:40:11,  2.25s/it]                                                       {'loss': 1.8529, 'learning_rate': 0.00013832187174133383, 'epoch': 0.61}
+ 61%|██████    | 4108/6779 [2:32:25<1:40:11,  2.25s/it] 61%|██████    | 4109/6779 [2:32:27<1:39:00,  2.22s/it]                                                       {'loss': 1.7513, 'learning_rate': 0.0001382323899972899, 'epoch': 0.61}
+ 61%|██████    | 4109/6779 [2:32:27<1:39:00,  2.22s/it] 61%|██████    | 4110/6779 [2:32:29<1:43:21,  2.32s/it]                                                       {'loss': 1.4289, 'learning_rate': 0.00013814292191912734, 'epoch': 0.61}
+ 61%|██████    | 4110/6779 [2:32:29<1:43:21,  2.32s/it] 61%|██████    | 4111/6779 [2:32:32<1:41:21,  2.28s/it]                                                       {'loss': 1.6652, 'learning_rate': 0.00013805346752664073, 'epoch': 0.61}
+ 61%|██████    | 4111/6779 [2:32:32<1:41:21,  2.28s/it] 61%|██████    | 4112/6779 [2:32:34<1:39:46,  2.24s/it]                                                       {'loss': 1.5702, 'learning_rate': 0.00013796402683962148, 'epoch': 0.61}
+ 61%|██████    | 4112/6779 [2:32:34<1:39:46,  2.24s/it] 61%|██████    | 4113/6779 [2:32:36<1:38:33,  2.22s/it]                                                       {'loss': 1.732, 'learning_rate': 0.0001378745998778582, 'epoch': 0.61}
+ 61%|██████    | 4113/6779 [2:32:36<1:38:33,  2.22s/it] 61%|██████    | 4114/6779 [2:32:38<1:35:46,  2.16s/it]                                                       {'loss': 1.6129, 'learning_rate': 0.0001377851866611362, 'epoch': 0.61}
+ 61%|██████    | 4114/6779 [2:32:38<1:35:46,  2.16s/it] 61%|██████    | 4115/6779 [2:32:40<1:35:19,  2.15s/it]                                                       {'loss': 1.6679, 'learning_rate': 0.0001376957872092379, 'epoch': 0.61}
+ 61%|██████    | 4115/6779 [2:32:40<1:35:19,  2.15s/it] 61%|██████    | 4116/6779 [2:32:42<1:38:06,  2.21s/it]                                                       {'loss': 1.7868, 'learning_rate': 0.00013760640154194257, 'epoch': 0.61}
+ 61%|██████    | 4116/6779 [2:32:42<1:38:06,  2.21s/it] 61%|██████    | 4117/6779 [2:32:45<1:38:05,  2.21s/it]                                                       {'loss': 1.5779, 'learning_rate': 0.0001375170296790266, 'epoch': 0.61}
+ 61%|██████    | 4117/6779 [2:32:45<1:38:05,  2.21s/it] 61%|██████    | 4118/6779 [2:32:47<1:35:50,  2.16s/it]                                                       {'loss': 1.5982, 'learning_rate': 0.00013742767164026315, 'epoch': 0.61}
+ 61%|██████    | 4118/6779 [2:32:47<1:35:50,  2.16s/it] 61%|██████    | 4119/6779 [2:32:49<1:38:21,  2.22s/it]                                                       {'loss': 1.6694, 'learning_rate': 0.0001373383274454224, 'epoch': 0.61}
+ 61%|██████    | 4119/6779 [2:32:49<1:38:21,  2.22s/it] 61%|██████    | 4120/6779 [2:32:51<1:37:03,  2.19s/it]                                                       {'loss': 1.7002, 'learning_rate': 0.0001372489971142715, 'epoch': 0.61}
+ 61%|██████    | 4120/6779 [2:32:51<1:37:03,  2.19s/it] 61%|██████    | 4121/6779 [2:32:53<1:37:09,  2.19s/it]                                                       {'loss': 1.6621, 'learning_rate': 0.00013715968066657446, 'epoch': 0.61}
+ 61%|██████    | 4121/6779 [2:32:53<1:37:09,  2.19s/it] 61%|██████    | 4122/6779 [2:32:55<1:36:16,  2.17s/it]                                                       {'loss': 1.6866, 'learning_rate': 0.00013707037812209225, 'epoch': 0.61}
+ 61%|██████    | 4122/6779 [2:32:55<1:36:16,  2.17s/it] 61%|██████    | 4123/6779 [2:32:58<1:35:36,  2.16s/it]                                                       {'loss': 1.6254, 'learning_rate': 0.0001369810895005828, 'epoch': 0.61}
+ 61%|██████    | 4123/6779 [2:32:58<1:35:36,  2.16s/it] 61%|██████    | 4124/6779 [2:33:00<1:39:36,  2.25s/it]                                                       {'loss': 1.7647, 'learning_rate': 0.0001368918148218009, 'epoch': 0.61}
+ 61%|██████    | 4124/6779 [2:33:00<1:39:36,  2.25s/it] 61%|██████    | 4125/6779 [2:33:02<1:39:46,  2.26s/it]                                                       {'loss': 1.7637, 'learning_rate': 0.00013680255410549827, 'epoch': 0.61}
+ 61%|██████    | 4125/6779 [2:33:02<1:39:46,  2.26s/it] 61%|██████    | 4126/6779 [2:33:05<1:40:21,  2.27s/it]                                                       {'loss': 1.7081, 'learning_rate': 0.0001367133073714235, 'epoch': 0.61}
+ 61%|██████    | 4126/6779 [2:33:05<1:40:21,  2.27s/it] 61%|██████    | 4127/6779 [2:33:07<1:39:41,  2.26s/it]                                                       {'loss': 1.6076, 'learning_rate': 0.00013662407463932227, 'epoch': 0.61}
+ 61%|██████    | 4127/6779 [2:33:07<1:39:41,  2.26s/it] 61%|██████    | 4128/6779 [2:33:09<1:39:15,  2.25s/it]                                                       {'loss': 1.762, 'learning_rate': 0.00013653485592893697, 'epoch': 0.61}
+ 61%|██████    | 4128/6779 [2:33:09<1:39:15,  2.25s/it] 61%|██████    | 4129/6779 [2:33:11<1:39:04,  2.24s/it]                                                       {'loss': 1.7541, 'learning_rate': 0.00013644565126000693, 'epoch': 0.61}
+ 61%|██████    | 4129/6779 [2:33:11<1:39:04,  2.24s/it] 61%|██████    | 4130/6779 [2:33:13<1:36:29,  2.19s/it]                                                       {'loss': 1.6995, 'learning_rate': 0.00013635646065226839, 'epoch': 0.61}
+ 61%|██████    | 4130/6779 [2:33:13<1:36:29,  2.19s/it] 61%|██████    | 4131/6779 [2:33:15<1:35:00,  2.15s/it]                                                       {'loss': 1.6225, 'learning_rate': 0.00013626728412545448, 'epoch': 0.61}
+ 61%|██████    | 4131/6779 [2:33:15<1:35:00,  2.15s/it] 61%|██████    | 4132/6779 [2:33:17<1:32:32,  2.10s/it]                                                       {'loss': 1.6962, 'learning_rate': 0.00013617812169929524, 'epoch': 0.61}
+ 61%|██████    | 4132/6779 [2:33:17<1:32:32,  2.10s/it] 61%|██████    | 4133/6779 [2:33:20<1:34:06,  2.13s/it]                                                       {'loss': 1.6735, 'learning_rate': 0.00013608897339351743, 'epoch': 0.61}
+ 61%|██████    | 4133/6779 [2:33:20<1:34:06,  2.13s/it] 61%|██████    | 4134/6779 [2:33:22<1:34:03,  2.13s/it]                                                       {'loss': 1.7076, 'learning_rate': 0.00013599983922784505, 'epoch': 0.61}
+ 61%|██████    | 4134/6779 [2:33:22<1:34:03,  2.13s/it] 61%|██████    | 4135/6779 [2:33:24<1:35:32,  2.17s/it]                                                       {'loss': 1.6231, 'learning_rate': 0.00013591071922199865, 'epoch': 0.61}
+ 61%|██████    | 4135/6779 [2:33:24<1:35:32,  2.17s/it] 61%|██████    | 4136/6779 [2:33:26<1:36:21,  2.19s/it]                                                       {'loss': 1.7813, 'learning_rate': 0.0001358216133956957, 'epoch': 0.61}
+ 61%|██████    | 4136/6779 [2:33:26<1:36:21,  2.19s/it] 61%|██████    | 4137/6779 [2:33:28<1:36:56,  2.20s/it]                                                       {'loss': 1.8397, 'learning_rate': 0.0001357325217686506, 'epoch': 0.61}
+ 61%|██████    | 4137/6779 [2:33:28<1:36:56,  2.20s/it] 61%|██████    | 4138/6779 [2:33:31<1:37:04,  2.21s/it]                                                       {'loss': 1.8431, 'learning_rate': 0.00013564344436057453, 'epoch': 0.61}
+ 61%|██████    | 4138/6779 [2:33:31<1:37:04,  2.21s/it] 61%|██████    | 4139/6779 [2:33:33<1:37:22,  2.21s/it]                                                       {'loss': 1.5871, 'learning_rate': 0.00013555438119117565, 'epoch': 0.61}
+ 61%|██████    | 4139/6779 [2:33:33<1:37:22,  2.21s/it] 61%|██████    | 4140/6779 [2:33:35<1:37:48,  2.22s/it]                                                       {'loss': 1.5993, 'learning_rate': 0.00013546533228015877, 'epoch': 0.61}
+ 61%|██████    | 4140/6779 [2:33:35<1:37:48,  2.22s/it] 61%|██████    | 4141/6779 [2:33:38<1:40:19,  2.28s/it]                                                       {'loss': 1.7251, 'learning_rate': 0.00013537629764722584, 'epoch': 0.61}
+ 61%|██████    | 4141/6779 [2:33:38<1:40:19,  2.28s/it] 61%|██████    | 4142/6779 [2:33:40<1:38:46,  2.25s/it]                                                       {'loss': 1.8669, 'learning_rate': 0.0001352872773120754, 'epoch': 0.61}
+ 61%|██████    | 4142/6779 [2:33:40<1:38:46,  2.25s/it] 61%|██████    | 4143/6779 [2:33:42<1:36:03,  2.19s/it]                                                       {'loss': 1.665, 'learning_rate': 0.00013519827129440293, 'epoch': 0.61}
+ 61%|██████    | 4143/6779 [2:33:42<1:36:03,  2.19s/it] 61%|██████    | 4144/6779 [2:33:44<1:34:57,  2.16s/it]                                                       {'loss': 1.7537, 'learning_rate': 0.00013510927961390073, 'epoch': 0.61}
+ 61%|██████    | 4144/6779 [2:33:44<1:34:57,  2.16s/it] 61%|██████    | 4145/6779 [2:33:46<1:37:45,  2.23s/it]                                                       {'loss': 1.8529, 'learning_rate': 0.0001350203022902578, 'epoch': 0.61}
+ 61%|██████    | 4145/6779 [2:33:46<1:37:45,  2.23s/it] 61%|██████    | 4146/6779 [2:33:48<1:37:14,  2.22s/it]                                                       {'loss': 1.5546, 'learning_rate': 0.00013493133934316023, 'epoch': 0.61}
+ 61%|██████    | 4146/6779 [2:33:48<1:37:14,  2.22s/it] 61%|██████    | 4147/6779 [2:33:51<1:37:54,  2.23s/it]                                                       {'loss': 1.5319, 'learning_rate': 0.00013484239079229063, 'epoch': 0.61}
+ 61%|██████    | 4147/6779 [2:33:51<1:37:54,  2.23s/it] 61%|██████    | 4148/6779 [2:33:53<1:38:00,  2.24s/it]                                                       {'loss': 1.7547, 'learning_rate': 0.0001347534566573287, 'epoch': 0.61}
+ 61%|██████    | 4148/6779 [2:33:53<1:38:00,  2.24s/it] 61%|██████    | 4149/6779 [2:33:55<1:40:29,  2.29s/it]                                                       {'loss': 1.6145, 'learning_rate': 0.00013466453695795084, 'epoch': 0.61}
+ 61%|██████    | 4149/6779 [2:33:55<1:40:29,  2.29s/it] 61%|██████    | 4150/6779 [2:33:58<1:39:40,  2.27s/it]                                                       {'loss': 1.5142, 'learning_rate': 0.00013457563171383018, 'epoch': 0.61}
+ 61%|██████    | 4150/6779 [2:33:58<1:39:40,  2.27s/it] 61%|██████    | 4151/6779 [2:34:00<1:36:27,  2.20s/it]                                                       {'loss': 1.8191, 'learning_rate': 0.00013448674094463674, 'epoch': 0.61}
+ 61%|██████    | 4151/6779 [2:34:00<1:36:27,  2.20s/it] 61%|██████    | 4152/6779 [2:34:02<1:36:10,  2.20s/it]                                                       {'loss': 1.5198, 'learning_rate': 0.00013439786467003733, 'epoch': 0.61}
+ 61%|██████    | 4152/6779 [2:34:02<1:36:10,  2.20s/it] 61%|██████▏   | 4153/6779 [2:34:04<1:38:40,  2.25s/it]                                                       {'loss': 1.7793, 'learning_rate': 0.00013430900290969542, 'epoch': 0.61}
+ 61%|██████▏   | 4153/6779 [2:34:04<1:38:40,  2.25s/it] 61%|██████▏   | 4154/6779 [2:34:06<1:38:02,  2.24s/it]                                                       {'loss': 1.6401, 'learning_rate': 0.00013422015568327153, 'epoch': 0.61}
+ 61%|██████▏   | 4154/6779 [2:34:06<1:38:02,  2.24s/it] 61%|██████▏   | 4155/6779 [2:34:09<1:36:32,  2.21s/it]                                                       {'loss': 1.601, 'learning_rate': 0.00013413132301042264, 'epoch': 0.61}
+ 61%|██████▏   | 4155/6779 [2:34:09<1:36:32,  2.21s/it] 61%|██████▏   | 4156/6779 [2:34:11<1:35:56,  2.19s/it]                                                       {'loss': 1.6082, 'learning_rate': 0.0001340425049108029, 'epoch': 0.61}
+ 61%|██████▏   | 4156/6779 [2:34:11<1:35:56,  2.19s/it] 61%|██████▏   | 4157/6779 [2:34:13<1:35:02,  2.17s/it]                                                       {'loss': 1.6804, 'learning_rate': 0.00013395370140406292, 'epoch': 0.61}
+ 61%|██████▏   | 4157/6779 [2:34:13<1:35:02,  2.17s/it] 61%|██████▏   | 4158/6779 [2:34:15<1:33:40,  2.14s/it]                                                       {'loss': 1.6311, 'learning_rate': 0.0001338649125098502, 'epoch': 0.61}
+ 61%|██████▏   | 4158/6779 [2:34:15<1:33:40,  2.14s/it] 61%|██████▏   | 4159/6779 [2:34:17<1:34:18,  2.16s/it]                                                       {'loss': 1.6219, 'learning_rate': 0.00013377613824780898, 'epoch': 0.61}
+ 61%|██████▏   | 4159/6779 [2:34:17<1:34:18,  2.16s/it] 61%|██████▏   | 4160/6779 [2:34:20<1:38:18,  2.25s/it]                                                       {'loss': 1.5817, 'learning_rate': 0.00013368737863758026, 'epoch': 0.61}
+ 61%|██████▏   | 4160/6779 [2:34:20<1:38:18,  2.25s/it] 61%|██████▏   | 4161/6779 [2:34:22<1:37:20,  2.23s/it]                                                       {'loss': 1.7396, 'learning_rate': 0.0001335986336988019, 'epoch': 0.61}
+ 61%|██████▏   | 4161/6779 [2:34:22<1:37:20,  2.23s/it] 61%|██████▏   | 4162/6779 [2:34:24<1:37:47,  2.24s/it]                                                       {'loss': 1.6014, 'learning_rate': 0.00013350990345110822, 'epoch': 0.61}
+ 61%|██████▏   | 4162/6779 [2:34:24<1:37:47,  2.24s/it] 61%|██████▏   | 4163/6779 [2:34:27<1:42:21,  2.35s/it]                                                       {'loss': 1.6561, 'learning_rate': 0.00013342118791413073, 'epoch': 0.61}
+ 61%|██████▏   | 4163/6779 [2:34:27<1:42:21,  2.35s/it] 61%|██████▏   | 4164/6779 [2:34:29<1:42:57,  2.36s/it]                                                       {'loss': 1.8762, 'learning_rate': 0.00013333248710749733, 'epoch': 0.61}
+ 61%|██████▏   | 4164/6779 [2:34:29<1:42:57,  2.36s/it] 61%|██████▏   | 4165/6779 [2:34:31<1:40:34,  2.31s/it]                                                       {'loss': 1.7378, 'learning_rate': 0.00013324380105083283, 'epoch': 0.61}
+ 61%|██████▏   | 4165/6779 [2:34:31<1:40:34,  2.31s/it] 61%|██████▏   | 4166/6779 [2:34:33<1:37:37,  2.24s/it]                                                       {'loss': 1.794, 'learning_rate': 0.0001331551297637587, 'epoch': 0.61}
+ 61%|██████▏   | 4166/6779 [2:34:33<1:37:37,  2.24s/it] 61%|██████▏   | 4167/6779 [2:34:36<1:37:28,  2.24s/it]                                                       {'loss': 1.6116, 'learning_rate': 0.00013306647326589318, 'epoch': 0.61}
+ 61%|██████▏   | 4167/6779 [2:34:36<1:37:28,  2.24s/it] 61%|██████▏   | 4168/6779 [2:34:38<1:39:06,  2.28s/it]                                                       {'loss': 1.6169, 'learning_rate': 0.00013297783157685124, 'epoch': 0.61}
+ 61%|██████▏   | 4168/6779 [2:34:38<1:39:06,  2.28s/it] 61%|██████▏   | 4169/6779 [2:34:40<1:39:00,  2.28s/it]                                                       {'loss': 1.6949, 'learning_rate': 0.00013288920471624452, 'epoch': 0.61}
+ 61%|██████▏   | 4169/6779 [2:34:40<1:39:00,  2.28s/it] 62%|██████▏   | 4170/6779 [2:34:42<1:36:44,  2.22s/it]                                                       {'loss': 1.7108, 'learning_rate': 0.0001328005927036815, 'epoch': 0.62}
+ 62%|██████▏   | 4170/6779 [2:34:42<1:36:44,  2.22s/it] 62%|██████▏   | 4171/6779 [2:34:44<1:36:06,  2.21s/it]                                                       {'loss': 1.5767, 'learning_rate': 0.00013271199555876724, 'epoch': 0.62}
+ 62%|██████▏   | 4171/6779 [2:34:44<1:36:06,  2.21s/it] 62%|██████▏   | 4172/6779 [2:34:47<1:33:43,  2.16s/it]                                                       {'loss': 1.6459, 'learning_rate': 0.00013262341330110358, 'epoch': 0.62}
+ 62%|██████▏   | 4172/6779 [2:34:47<1:33:43,  2.16s/it] 62%|██████▏   | 4173/6779 [2:34:49<1:33:59,  2.16s/it]                                                       {'loss': 1.6956, 'learning_rate': 0.00013253484595028906, 'epoch': 0.62}
+ 62%|██████▏   | 4173/6779 [2:34:49<1:33:59,  2.16s/it] 62%|██████▏   | 4174/6779 [2:34:51<1:31:19,  2.10s/it]                                                       {'loss': 1.8315, 'learning_rate': 0.00013244629352591894, 'epoch': 0.62}
+ 62%|██████▏   | 4174/6779 [2:34:51<1:31:19,  2.10s/it] 62%|██████▏   | 4175/6779 [2:34:53<1:34:08,  2.17s/it]                                                       {'loss': 1.7702, 'learning_rate': 0.0001323577560475851, 'epoch': 0.62}
+ 62%|██████▏   | 4175/6779 [2:34:53<1:34:08,  2.17s/it] 62%|██████▏   | 4176/6779 [2:34:55<1:30:57,  2.10s/it]                                                       {'loss': 1.7114, 'learning_rate': 0.00013226923353487616, 'epoch': 0.62}
+ 62%|██████▏   | 4176/6779 [2:34:55<1:30:57,  2.10s/it] 62%|██████▏   | 4177/6779 [2:34:57<1:31:52,  2.12s/it]                                                       {'loss': 1.819, 'learning_rate': 0.00013218072600737753, 'epoch': 0.62}
+ 62%|██████▏   | 4177/6779 [2:34:57<1:31:52,  2.12s/it] 62%|██████▏   | 4178/6779 [2:34:59<1:33:04,  2.15s/it]                                                       {'loss': 1.6313, 'learning_rate': 0.00013209223348467113, 'epoch': 0.62}
+ 62%|██████▏   | 4178/6779 [2:34:59<1:33:04,  2.15s/it] 62%|██████▏   | 4179/6779 [2:35:01<1:33:25,  2.16s/it]                                                       {'loss': 1.8114, 'learning_rate': 0.00013200375598633566, 'epoch': 0.62}
+ 62%|██████▏   | 4179/6779 [2:35:01<1:33:25,  2.16s/it] 62%|██████▏   | 4180/6779 [2:35:04<1:32:04,  2.13s/it]                                                       {'loss': 1.6319, 'learning_rate': 0.00013191529353194647, 'epoch': 0.62}
+ 62%|██████▏   | 4180/6779 [2:35:04<1:32:04,  2.13s/it] 62%|██████▏   | 4181/6779 [2:35:06<1:31:16,  2.11s/it]                                                       {'loss': 1.7298, 'learning_rate': 0.00013182684614107562, 'epoch': 0.62}
+ 62%|██████▏   | 4181/6779 [2:35:06<1:31:16,  2.11s/it] 62%|██████▏   | 4182/6779 [2:35:08<1:35:11,  2.20s/it]                                                       {'loss': 1.6924, 'learning_rate': 0.00013173841383329178, 'epoch': 0.62}
+ 62%|██████▏   | 4182/6779 [2:35:08<1:35:11,  2.20s/it] 62%|██████▏   | 4183/6779 [2:35:10<1:35:14,  2.20s/it]                                                       {'loss': 1.5773, 'learning_rate': 0.00013164999662816027, 'epoch': 0.62}
+ 62%|██████▏   | 4183/6779 [2:35:10<1:35:14,  2.20s/it] 62%|██████▏   | 4184/6779 [2:35:12<1:33:19,  2.16s/it]                                                       {'loss': 1.5629, 'learning_rate': 0.00013156159454524318, 'epoch': 0.62}
+ 62%|██████▏   | 4184/6779 [2:35:12<1:33:19,  2.16s/it] 62%|██████▏   | 4185/6779 [2:35:15<1:34:27,  2.18s/it]                                                       {'loss': 1.7238, 'learning_rate': 0.00013147320760409915, 'epoch': 0.62}
+ 62%|██████▏   | 4185/6779 [2:35:15<1:34:27,  2.18s/it] 62%|██████▏   | 4186/6779 [2:35:17<1:35:41,  2.21s/it]                                                       {'loss': 1.7594, 'learning_rate': 0.00013138483582428352, 'epoch': 0.62}
+ 62%|██████▏   | 4186/6779 [2:35:17<1:35:41,  2.21s/it] 62%|██████▏   | 4187/6779 [2:35:19<1:34:12,  2.18s/it]                                                       {'loss': 1.5976, 'learning_rate': 0.0001312964792253482, 'epoch': 0.62}
+ 62%|██████▏   | 4187/6779 [2:35:19<1:34:12,  2.18s/it] 62%|██████▏   | 4188/6779 [2:35:21<1:32:25,  2.14s/it]                                                       {'loss': 1.6607, 'learning_rate': 0.00013120813782684185, 'epoch': 0.62}
+ 62%|██████▏   | 4188/6779 [2:35:21<1:32:25,  2.14s/it] 62%|██████▏   | 4189/6779 [2:35:23<1:34:14,  2.18s/it]                                                       {'loss': 1.5207, 'learning_rate': 0.00013111981164830972, 'epoch': 0.62}
+ 62%|██████▏   | 4189/6779 [2:35:23<1:34:14,  2.18s/it] 62%|██████▏   | 4190/6779 [2:35:25<1:34:21,  2.19s/it]                                                       {'loss': 1.4984, 'learning_rate': 0.00013103150070929362, 'epoch': 0.62}
+ 62%|██████▏   | 4190/6779 [2:35:25<1:34:21,  2.19s/it] 62%|██████▏   | 4191/6779 [2:35:28<1:35:12,  2.21s/it]                                                       {'loss': 1.6689, 'learning_rate': 0.00013094320502933212, 'epoch': 0.62}
+ 62%|██████▏   | 4191/6779 [2:35:28<1:35:12,  2.21s/it] 62%|██████▏   | 4192/6779 [2:35:30<1:34:55,  2.20s/it]                                                       {'loss': 1.6474, 'learning_rate': 0.00013085492462796037, 'epoch': 0.62}
+ 62%|██████▏   | 4192/6779 [2:35:30<1:34:55,  2.20s/it] 62%|██████▏   | 4193/6779 [2:35:32<1:36:30,  2.24s/it]                                                       {'loss': 1.6981, 'learning_rate': 0.0001307666595247101, 'epoch': 0.62}
+ 62%|██████▏   | 4193/6779 [2:35:32<1:36:30,  2.24s/it] 62%|██████▏   | 4194/6779 [2:35:34<1:35:46,  2.22s/it]                                                       {'loss': 1.9185, 'learning_rate': 0.0001306784097391096, 'epoch': 0.62}
+ 62%|██████▏   | 4194/6779 [2:35:34<1:35:46,  2.22s/it] 62%|██████▏   | 4195/6779 [2:35:36<1:34:03,  2.18s/it]                                                       {'loss': 1.7889, 'learning_rate': 0.00013059017529068397, 'epoch': 0.62}
+ 62%|██████▏   | 4195/6779 [2:35:36<1:34:03,  2.18s/it] 62%|██████▏   | 4196/6779 [2:35:39<1:38:42,  2.29s/it]                                                       {'loss': 1.7033, 'learning_rate': 0.00013050195619895467, 'epoch': 0.62}
+ 62%|██████▏   | 4196/6779 [2:35:39<1:38:42,  2.29s/it] 62%|██████▏   | 4197/6779 [2:35:41<1:37:05,  2.26s/it]                                                       {'loss': 1.6185, 'learning_rate': 0.0001304137524834399, 'epoch': 0.62}
+ 62%|██████▏   | 4197/6779 [2:35:41<1:37:05,  2.26s/it] 62%|██████▏   | 4198/6779 [2:35:44<1:38:11,  2.28s/it]                                                       {'loss': 1.7319, 'learning_rate': 0.00013032556416365458, 'epoch': 0.62}
+ 62%|██████▏   | 4198/6779 [2:35:44<1:38:11,  2.28s/it] 62%|██████▏   | 4199/6779 [2:35:46<1:38:12,  2.28s/it]                                                       {'loss': 1.7319, 'learning_rate': 0.00013023739125910997, 'epoch': 0.62}
+ 62%|██████▏   | 4199/6779 [2:35:46<1:38:12,  2.28s/it] 62%|██████▏   | 4200/6779 [2:35:48<1:35:09,  2.21s/it]                                                       {'loss': 1.6448, 'learning_rate': 0.00013014923378931406, 'epoch': 0.62}
+ 62%|██████▏   | 4200/6779 [2:35:48<1:35:09,  2.21s/it] 62%|██████▏   | 4201/6779 [2:35:50<1:35:48,  2.23s/it]                                                       {'loss': 1.7356, 'learning_rate': 0.0001300610917737714, 'epoch': 0.62}
+ 62%|██████▏   | 4201/6779 [2:35:50<1:35:48,  2.23s/it] 62%|██████▏   | 4202/6779 [2:35:52<1:35:16,  2.22s/it]                                                       {'loss': 1.7441, 'learning_rate': 0.00012997296523198314, 'epoch': 0.62}
+ 62%|██████▏   | 4202/6779 [2:35:52<1:35:16,  2.22s/it] 62%|██████▏   | 4203/6779 [2:35:55<1:38:37,  2.30s/it]                                                       {'loss': 1.7487, 'learning_rate': 0.00012988485418344693, 'epoch': 0.62}
+ 62%|██████▏   | 4203/6779 [2:35:55<1:38:37,  2.30s/it] 62%|██████▏   | 4204/6779 [2:35:57<1:36:34,  2.25s/it]                                                       {'loss': 1.6347, 'learning_rate': 0.00012979675864765704, 'epoch': 0.62}
+ 62%|██████▏   | 4204/6779 [2:35:57<1:36:34,  2.25s/it] 62%|██████▏   | 4205/6779 [2:35:59<1:35:32,  2.23s/it]                                                       {'loss': 1.6673, 'learning_rate': 0.00012970867864410445, 'epoch': 0.62}
+ 62%|██████▏   | 4205/6779 [2:35:59<1:35:32,  2.23s/it] 62%|██████▏   | 4206/6779 [2:36:01<1:35:11,  2.22s/it]                                                       {'loss': 1.7471, 'learning_rate': 0.00012962061419227654, 'epoch': 0.62}
+ 62%|██████▏   | 4206/6779 [2:36:01<1:35:11,  2.22s/it] 62%|██████▏   | 4207/6779 [2:36:04<1:34:59,  2.22s/it]                                                       {'loss': 1.6789, 'learning_rate': 0.00012953256531165715, 'epoch': 0.62}
+ 62%|██████▏   | 4207/6779 [2:36:04<1:34:59,  2.22s/it] 62%|██████▏   | 4208/6779 [2:36:06<1:43:18,  2.41s/it]                                                       {'loss': 1.7428, 'learning_rate': 0.00012944453202172696, 'epoch': 0.62}
+ 62%|██████▏   | 4208/6779 [2:36:06<1:43:18,  2.41s/it] 62%|██████▏   | 4209/6779 [2:36:09<1:42:19,  2.39s/it]                                                       {'loss': 1.7558, 'learning_rate': 0.00012935651434196291, 'epoch': 0.62}
+ 62%|██████▏   | 4209/6779 [2:36:09<1:42:19,  2.39s/it] 62%|██████▏   | 4210/6779 [2:36:11<1:39:49,  2.33s/it]                                                       {'loss': 1.7631, 'learning_rate': 0.00012926851229183876, 'epoch': 0.62}
+ 62%|██████▏   | 4210/6779 [2:36:11<1:39:49,  2.33s/it] 62%|██████▏   | 4211/6779 [2:36:13<1:36:30,  2.25s/it]                                                       {'loss': 1.7141, 'learning_rate': 0.00012918052589082447, 'epoch': 0.62}
+ 62%|██████▏   | 4211/6779 [2:36:13<1:36:30,  2.25s/it] 62%|██████▏   | 4212/6779 [2:36:15<1:31:50,  2.15s/it]                                                       {'loss': 1.5404, 'learning_rate': 0.00012909255515838704, 'epoch': 0.62}
+ 62%|██████▏   | 4212/6779 [2:36:15<1:31:50,  2.15s/it] 62%|██████▏   | 4213/6779 [2:36:17<1:33:24,  2.18s/it]                                                       {'loss': 1.7552, 'learning_rate': 0.00012900460011398948, 'epoch': 0.62}
+ 62%|██████▏   | 4213/6779 [2:36:17<1:33:24,  2.18s/it] 62%|██████▏   | 4214/6779 [2:36:20<1:35:23,  2.23s/it]                                                       {'loss': 1.8362, 'learning_rate': 0.00012891666077709162, 'epoch': 0.62}
+ 62%|██████▏   | 4214/6779 [2:36:20<1:35:23,  2.23s/it] 62%|██████▏   | 4215/6779 [2:36:22<1:36:01,  2.25s/it]                                                       {'loss': 1.761, 'learning_rate': 0.00012882873716714983, 'epoch': 0.62}
+ 62%|██████▏   | 4215/6779 [2:36:22<1:36:01,  2.25s/it] 62%|██████▏   | 4216/6779 [2:36:25<1:42:39,  2.40s/it]                                                       {'loss': 1.5561, 'learning_rate': 0.0001287408293036168, 'epoch': 0.62}
+ 62%|██████▏   | 4216/6779 [2:36:25<1:42:39,  2.40s/it] 62%|██████▏   | 4217/6779 [2:36:27<1:39:18,  2.33s/it]                                                       {'loss': 1.6907, 'learning_rate': 0.00012865293720594188, 'epoch': 0.62}
+ 62%|██████▏   | 4217/6779 [2:36:27<1:39:18,  2.33s/it] 62%|██████▏   | 4218/6779 [2:36:29<1:42:41,  2.41s/it]                                                       {'loss': 1.7334, 'learning_rate': 0.00012856506089357087, 'epoch': 0.62}
+ 62%|██████▏   | 4218/6779 [2:36:29<1:42:41,  2.41s/it] 62%|██████▏   | 4219/6779 [2:36:32<1:41:07,  2.37s/it]                                                       {'loss': 1.5092, 'learning_rate': 0.00012847720038594622, 'epoch': 0.62}
+ 62%|██████▏   | 4219/6779 [2:36:32<1:41:07,  2.37s/it] 62%|██████▏   | 4220/6779 [2:36:34<1:39:05,  2.32s/it]                                                       {'loss': 1.8634, 'learning_rate': 0.00012838935570250678, 'epoch': 0.62}
+ 62%|██████▏   | 4220/6779 [2:36:34<1:39:05,  2.32s/it] 62%|██████▏   | 4221/6779 [2:36:36<1:42:52,  2.41s/it]                                                       {'loss': 1.6322, 'learning_rate': 0.00012830152686268783, 'epoch': 0.62}
+ 62%|██████▏   | 4221/6779 [2:36:36<1:42:52,  2.41s/it] 62%|██████▏   | 4222/6779 [2:36:39<1:40:24,  2.36s/it]                                                       {'loss': 1.7091, 'learning_rate': 0.00012821371388592123, 'epoch': 0.62}
+ 62%|██████▏   | 4222/6779 [2:36:39<1:40:24,  2.36s/it] 62%|██████▏   | 4223/6779 [2:36:41<1:37:44,  2.29s/it]                                                       {'loss': 1.5219, 'learning_rate': 0.00012812591679163538, 'epoch': 0.62}
+ 62%|██████▏   | 4223/6779 [2:36:41<1:37:44,  2.29s/it] 62%|██████▏   | 4224/6779 [2:36:43<1:34:24,  2.22s/it]                                                       {'loss': 1.7601, 'learning_rate': 0.00012803813559925497, 'epoch': 0.62}
+ 62%|██████▏   | 4224/6779 [2:36:43<1:34:24,  2.22s/it] 62%|██████▏   | 4225/6779 [2:36:45<1:32:41,  2.18s/it]                                                       {'loss': 1.6105, 'learning_rate': 0.0001279503703282013, 'epoch': 0.62}
+ 62%|██████▏   | 4225/6779 [2:36:45<1:32:41,  2.18s/it] 62%|██████▏   | 4226/6779 [2:36:47<1:34:14,  2.21s/it]                                                       {'loss': 1.7529, 'learning_rate': 0.0001278626209978923, 'epoch': 0.62}
+ 62%|██████▏   | 4226/6779 [2:36:47<1:34:14,  2.21s/it] 62%|██████▏   | 4227/6779 [2:36:50<1:35:57,  2.26s/it]                                                       {'loss': 1.6255, 'learning_rate': 0.00012777488762774215, 'epoch': 0.62}
+ 62%|██████▏   | 4227/6779 [2:36:50<1:35:57,  2.26s/it] 62%|██████▏   | 4228/6779 [2:36:52<1:36:18,  2.27s/it]                                                       {'loss': 1.6465, 'learning_rate': 0.00012768717023716158, 'epoch': 0.62}
+ 62%|██████▏   | 4228/6779 [2:36:52<1:36:18,  2.27s/it] 62%|██████▏   | 4229/6779 [2:36:54<1:36:38,  2.27s/it]                                                       {'loss': 1.6793, 'learning_rate': 0.00012759946884555775, 'epoch': 0.62}
+ 62%|██████▏   | 4229/6779 [2:36:54<1:36:38,  2.27s/it] 62%|██████▏   | 4230/6779 [2:36:56<1:33:52,  2.21s/it]                                                       {'loss': 1.5892, 'learning_rate': 0.0001275117834723343, 'epoch': 0.62}
+ 62%|██████▏   | 4230/6779 [2:36:56<1:33:52,  2.21s/it] 62%|██████▏   | 4231/6779 [2:36:59<1:35:52,  2.26s/it]                                                       {'loss': 1.8042, 'learning_rate': 0.0001274241141368914, 'epoch': 0.62}
+ 62%|██████▏   | 4231/6779 [2:36:59<1:35:52,  2.26s/it] 62%|██████▏   | 4232/6779 [2:37:01<1:34:50,  2.23s/it]                                                       {'loss': 1.5212, 'learning_rate': 0.00012733646085862551, 'epoch': 0.62}
+ 62%|██████▏   | 4232/6779 [2:37:01<1:34:50,  2.23s/it] 62%|██████▏   | 4233/6779 [2:37:03<1:34:54,  2.24s/it]                                                       {'loss': 1.5418, 'learning_rate': 0.00012724882365692958, 'epoch': 0.62}
+ 62%|██████▏   | 4233/6779 [2:37:03<1:34:54,  2.24s/it] 62%|██████▏   | 4234/6779 [2:37:05<1:34:24,  2.23s/it]                                                       {'loss': 1.6734, 'learning_rate': 0.00012716120255119325, 'epoch': 0.62}
+ 62%|██████▏   | 4234/6779 [2:37:05<1:34:24,  2.23s/it] 62%|██████▏   | 4235/6779 [2:37:07<1:34:08,  2.22s/it]                                                       {'loss': 1.6402, 'learning_rate': 0.00012707359756080225, 'epoch': 0.62}
+ 62%|██████▏   | 4235/6779 [2:37:07<1:34:08,  2.22s/it] 62%|██████▏   | 4236/6779 [2:37:10<1:34:28,  2.23s/it]                                                       {'loss': 1.825, 'learning_rate': 0.00012698600870513898, 'epoch': 0.62}
+ 62%|██████▏   | 4236/6779 [2:37:10<1:34:28,  2.23s/it] 63%|██████▎   | 4237/6779 [2:37:12<1:36:18,  2.27s/it]                                                       {'loss': 1.6438, 'learning_rate': 0.00012689843600358213, 'epoch': 0.63}
+ 63%|██████▎   | 4237/6779 [2:37:12<1:36:18,  2.27s/it] 63%|██████▎   | 4238/6779 [2:37:14<1:37:22,  2.30s/it]                                                       {'loss': 1.6553, 'learning_rate': 0.00012681087947550692, 'epoch': 0.63}
+ 63%|██████▎   | 4238/6779 [2:37:14<1:37:22,  2.30s/it] 63%|██████▎   | 4239/6779 [2:37:17<1:34:53,  2.24s/it]                                                       {'loss': 1.6824, 'learning_rate': 0.0001267233391402849, 'epoch': 0.63}
+ 63%|██████▎   | 4239/6779 [2:37:17<1:34:53,  2.24s/it] 63%|██████▎   | 4240/6779 [2:37:19<1:31:49,  2.17s/it]                                                       {'loss': 1.5906, 'learning_rate': 0.00012663581501728405, 'epoch': 0.63}
+ 63%|██████▎   | 4240/6779 [2:37:19<1:31:49,  2.17s/it] 63%|██████▎   | 4241/6779 [2:37:21<1:30:12,  2.13s/it]                                                       {'loss': 1.6572, 'learning_rate': 0.00012654830712586888, 'epoch': 0.63}
+ 63%|██████▎   | 4241/6779 [2:37:21<1:30:12,  2.13s/it] 63%|██████▎   | 4242/6779 [2:37:23<1:30:40,  2.14s/it]                                                       {'loss': 1.5399, 'learning_rate': 0.00012646081548540024, 'epoch': 0.63}
+ 63%|██████▎   | 4242/6779 [2:37:23<1:30:40,  2.14s/it] 63%|██████▎   | 4243/6779 [2:37:25<1:29:45,  2.12s/it]                                                       {'loss': 1.7351, 'learning_rate': 0.00012637334011523528, 'epoch': 0.63}
+ 63%|██████▎   | 4243/6779 [2:37:25<1:29:45,  2.12s/it] 63%|██████▎   | 4244/6779 [2:37:27<1:28:18,  2.09s/it]                                                       {'loss': 1.5226, 'learning_rate': 0.0001262858810347277, 'epoch': 0.63}
+ 63%|██████▎   | 4244/6779 [2:37:27<1:28:18,  2.09s/it] 63%|██████▎   | 4245/6779 [2:37:29<1:29:36,  2.12s/it]                                                       {'loss': 1.6895, 'learning_rate': 0.00012619843826322752, 'epoch': 0.63}
+ 63%|██████▎   | 4245/6779 [2:37:29<1:29:36,  2.12s/it] 63%|██████▎   | 4246/6779 [2:37:31<1:31:20,  2.16s/it]                                                       {'loss': 1.8536, 'learning_rate': 0.00012611101182008114, 'epoch': 0.63}
+ 63%|██████▎   | 4246/6779 [2:37:31<1:31:20,  2.16s/it] 63%|██████▎   | 4247/6779 [2:37:33<1:31:10,  2.16s/it]                                                       {'loss': 1.6322, 'learning_rate': 0.00012602360172463137, 'epoch': 0.63}
+ 63%|██████▎   | 4247/6779 [2:37:33<1:31:10,  2.16s/it] 63%|██████▎   | 4248/6779 [2:37:36<1:31:59,  2.18s/it]                                                       {'loss': 1.5943, 'learning_rate': 0.00012593620799621747, 'epoch': 0.63}
+ 63%|██████▎   | 4248/6779 [2:37:36<1:31:59,  2.18s/it] 63%|██████▎   | 4249/6779 [2:37:38<1:32:04,  2.18s/it]                                                       {'loss': 1.6395, 'learning_rate': 0.00012584883065417497, 'epoch': 0.63}
+ 63%|██████▎   | 4249/6779 [2:37:38<1:32:04,  2.18s/it] 63%|██████▎   | 4250/6779 [2:37:40<1:33:06,  2.21s/it]                                                       {'loss': 1.8766, 'learning_rate': 0.00012576146971783584, 'epoch': 0.63}
+ 63%|██████▎   | 4250/6779 [2:37:40<1:33:06,  2.21s/it] 63%|██████▎   | 4251/6779 [2:37:42<1:35:09,  2.26s/it]                                                       {'loss': 1.7756, 'learning_rate': 0.00012567412520652838, 'epoch': 0.63}
+ 63%|██████▎   | 4251/6779 [2:37:43<1:35:09,  2.26s/it] 63%|██████▎   | 4252/6779 [2:37:45<1:34:50,  2.25s/it]                                                       {'loss': 1.7544, 'learning_rate': 0.00012558679713957731, 'epoch': 0.63}
+ 63%|██████▎   | 4252/6779 [2:37:45<1:34:50,  2.25s/it] 63%|██████▎   | 4253/6779 [2:37:47<1:34:42,  2.25s/it]                                                       {'loss': 1.613, 'learning_rate': 0.00012549948553630365, 'epoch': 0.63}
+ 63%|██████▎   | 4253/6779 [2:37:47<1:34:42,  2.25s/it] 63%|██████▎   | 4254/6779 [2:37:50<1:38:13,  2.33s/it]                                                       {'loss': 1.5076, 'learning_rate': 0.00012541219041602476, 'epoch': 0.63}
+ 63%|██████▎   | 4254/6779 [2:37:50<1:38:13,  2.33s/it] 63%|██████▎   | 4255/6779 [2:37:52<1:37:44,  2.32s/it]                                                       {'loss': 1.5072, 'learning_rate': 0.00012532491179805447, 'epoch': 0.63}
+ 63%|██████▎   | 4255/6779 [2:37:52<1:37:44,  2.32s/it] 63%|██████▎   | 4256/6779 [2:37:54<1:35:15,  2.27s/it]                                                       {'loss': 1.7121, 'learning_rate': 0.00012523764970170294, 'epoch': 0.63}
+ 63%|██████▎   | 4256/6779 [2:37:54<1:35:15,  2.27s/it] 63%|██████▎   | 4257/6779 [2:37:56<1:36:22,  2.29s/it]                                                       {'loss': 1.8431, 'learning_rate': 0.0001251504041462765, 'epoch': 0.63}
+ 63%|██████▎   | 4257/6779 [2:37:56<1:36:22,  2.29s/it] 63%|██████▎   | 4258/6779 [2:37:58<1:33:05,  2.22s/it]                                                       {'loss': 1.6695, 'learning_rate': 0.000125063175151078, 'epoch': 0.63}
+ 63%|██████▎   | 4258/6779 [2:37:58<1:33:05,  2.22s/it] 63%|██████▎   | 4259/6779 [2:38:01<1:32:44,  2.21s/it]                                                       {'loss': 1.7373, 'learning_rate': 0.0001249759627354066, 'epoch': 0.63}
+ 63%|██████▎   | 4259/6779 [2:38:01<1:32:44,  2.21s/it] 63%|██████▎   | 4260/6779 [2:38:03<1:33:03,  2.22s/it]                                                       {'loss': 1.7635, 'learning_rate': 0.0001248887669185577, 'epoch': 0.63}
+ 63%|██████▎   | 4260/6779 [2:38:03<1:33:03,  2.22s/it] 63%|██████▎   | 4261/6779 [2:38:05<1:32:12,  2.20s/it]                                                       {'loss': 1.6944, 'learning_rate': 0.0001248015877198231, 'epoch': 0.63}
+ 63%|██████▎   | 4261/6779 [2:38:05<1:32:12,  2.20s/it] 63%|██████▎   | 4262/6779 [2:38:07<1:31:59,  2.19s/it]                                                       {'loss': 1.5992, 'learning_rate': 0.00012471442515849093, 'epoch': 0.63}
+ 63%|██████▎   | 4262/6779 [2:38:07<1:31:59,  2.19s/it] 63%|██████▎   | 4263/6779 [2:38:09<1:31:06,  2.17s/it]                                                       {'loss': 1.6138, 'learning_rate': 0.00012462727925384564, 'epoch': 0.63}
+ 63%|██████▎   | 4263/6779 [2:38:09<1:31:06,  2.17s/it] 63%|██████▎   | 4264/6779 [2:38:11<1:30:44,  2.16s/it]                                                       {'loss': 1.6177, 'learning_rate': 0.00012454015002516799, 'epoch': 0.63}
+ 63%|██████▎   | 4264/6779 [2:38:11<1:30:44,  2.16s/it] 63%|██████▎   | 4265/6779 [2:38:13<1:29:35,  2.14s/it]                                                       {'loss': 1.5014, 'learning_rate': 0.00012445303749173499, 'epoch': 0.63}
+ 63%|██████▎   | 4265/6779 [2:38:13<1:29:35,  2.14s/it] 63%|██████▎   | 4266/6779 [2:38:16<1:31:12,  2.18s/it]                                                       {'loss': 1.6922, 'learning_rate': 0.00012436594167282, 'epoch': 0.63}
+ 63%|██████▎   | 4266/6779 [2:38:16<1:31:12,  2.18s/it] 63%|██████▎   | 4267/6779 [2:38:18<1:31:30,  2.19s/it]                                                       {'loss': 1.6909, 'learning_rate': 0.00012427886258769267, 'epoch': 0.63}
+ 63%|██████▎   | 4267/6779 [2:38:18<1:31:30,  2.19s/it] 63%|██████▎   | 4268/6779 [2:38:20<1:28:58,  2.13s/it]                                                       {'loss': 1.5111, 'learning_rate': 0.00012419180025561896, 'epoch': 0.63}
+ 63%|██████▎   | 4268/6779 [2:38:20<1:28:58,  2.13s/it] 63%|██████▎   | 4269/6779 [2:38:22<1:29:30,  2.14s/it]                                                       {'loss': 1.6402, 'learning_rate': 0.00012410475469586127, 'epoch': 0.63}
+ 63%|██████▎   | 4269/6779 [2:38:22<1:29:30,  2.14s/it] 63%|██████▎   | 4270/6779 [2:38:24<1:31:15,  2.18s/it]                                                       {'loss': 1.7014, 'learning_rate': 0.00012401772592767797, 'epoch': 0.63}
+ 63%|██████▎   | 4270/6779 [2:38:24<1:31:15,  2.18s/it] 63%|██████▎   | 4271/6779 [2:38:27<1:31:40,  2.19s/it]                                                       {'loss': 1.6495, 'learning_rate': 0.00012393071397032398, 'epoch': 0.63}
+ 63%|██████▎   | 4271/6779 [2:38:27<1:31:40,  2.19s/it] 63%|██████▎   | 4272/6779 [2:38:29<1:30:50,  2.17s/it]                                                       {'loss': 1.714, 'learning_rate': 0.0001238437188430504, 'epoch': 0.63}
+ 63%|██████▎   | 4272/6779 [2:38:29<1:30:50,  2.17s/it] 63%|██████▎   | 4273/6779 [2:38:31<1:31:24,  2.19s/it]                                                       {'loss': 1.6346, 'learning_rate': 0.00012375674056510456, 'epoch': 0.63}
+ 63%|██████▎   | 4273/6779 [2:38:31<1:31:24,  2.19s/it] 63%|██████▎   | 4274/6779 [2:38:33<1:32:26,  2.21s/it]                                                       {'loss': 1.5149, 'learning_rate': 0.0001236697791557302, 'epoch': 0.63}
+ 63%|██████▎   | 4274/6779 [2:38:33<1:32:26,  2.21s/it] 63%|██████▎   | 4275/6779 [2:38:35<1:31:37,  2.20s/it]                                                       {'loss': 1.738, 'learning_rate': 0.0001235828346341671, 'epoch': 0.63}
+ 63%|██████▎   | 4275/6779 [2:38:35<1:31:37,  2.20s/it] 63%|██████▎   | 4276/6779 [2:38:37<1:30:29,  2.17s/it]                                                       {'loss': 1.5509, 'learning_rate': 0.00012349590701965163, 'epoch': 0.63}
+ 63%|██████▎   | 4276/6779 [2:38:37<1:30:29,  2.17s/it] 63%|██████▎   | 4277/6779 [2:38:39<1:28:37,  2.13s/it]                                                       {'loss': 1.7182, 'learning_rate': 0.00012340899633141622, 'epoch': 0.63}
+ 63%|█���████▎   | 4277/6779 [2:38:39<1:28:37,  2.13s/it] 63%|██████▎   | 4278/6779 [2:38:42<1:27:23,  2.10s/it]                                                       {'loss': 1.746, 'learning_rate': 0.00012332210258868948, 'epoch': 0.63}
+ 63%|██████▎   | 4278/6779 [2:38:42<1:27:23,  2.10s/it] 63%|██████▎   | 4279/6779 [2:38:44<1:27:33,  2.10s/it]                                                       {'loss': 1.5621, 'learning_rate': 0.00012323522581069644, 'epoch': 0.63}
+ 63%|██████▎   | 4279/6779 [2:38:44<1:27:33,  2.10s/it] 63%|██████▎   | 4280/6779 [2:38:46<1:27:14,  2.09s/it]                                                       {'loss': 1.6669, 'learning_rate': 0.00012314836601665823, 'epoch': 0.63}
+ 63%|██████▎   | 4280/6779 [2:38:46<1:27:14,  2.09s/it] 63%|██████▎   | 4281/6779 [2:38:48<1:30:14,  2.17s/it]                                                       {'loss': 1.686, 'learning_rate': 0.00012306152322579236, 'epoch': 0.63}
+ 63%|██████▎   | 4281/6779 [2:38:48<1:30:14,  2.17s/it] 63%|██████▎   | 4282/6779 [2:38:50<1:30:40,  2.18s/it]                                                       {'loss': 1.6268, 'learning_rate': 0.0001229746974573124, 'epoch': 0.63}
+ 63%|██████▎   | 4282/6779 [2:38:50<1:30:40,  2.18s/it] 63%|██████▎   | 4283/6779 [2:38:53<1:32:33,  2.22s/it]                                                       {'loss': 1.6603, 'learning_rate': 0.00012288788873042843, 'epoch': 0.63}
+ 63%|██████▎   | 4283/6779 [2:38:53<1:32:33,  2.22s/it] 63%|██████▎   | 4284/6779 [2:38:55<1:31:01,  2.19s/it]                                                       {'loss': 1.7132, 'learning_rate': 0.00012280109706434654, 'epoch': 0.63}
+ 63%|██████▎   | 4284/6779 [2:38:55<1:31:01,  2.19s/it] 63%|██████▎   | 4285/6779 [2:38:57<1:29:44,  2.16s/it]                                                       {'loss': 1.5388, 'learning_rate': 0.00012271432247826908, 'epoch': 0.63}
+ 63%|██████▎   | 4285/6779 [2:38:57<1:29:44,  2.16s/it] 63%|██████▎   | 4286/6779 [2:38:59<1:31:14,  2.20s/it]                                                       {'loss': 1.625, 'learning_rate': 0.0001226275649913947, 'epoch': 0.63}
+ 63%|██████▎   | 4286/6779 [2:38:59<1:31:14,  2.20s/it] 63%|██████▎   | 4287/6779 [2:39:02<1:34:48,  2.28s/it]                                                       {'loss': 1.6606, 'learning_rate': 0.0001225408246229181, 'epoch': 0.63}
+ 63%|██████▎   | 4287/6779 [2:39:02<1:34:48,  2.28s/it] 63%|██████▎   | 4288/6779 [2:39:04<1:33:29,  2.25s/it]                                                       {'loss': 1.7649, 'learning_rate': 0.00012245410139203035, 'epoch': 0.63}
+ 63%|██████▎   | 4288/6779 [2:39:04<1:33:29,  2.25s/it] 63%|██████▎   | 4289/6779 [2:39:06<1:35:16,  2.30s/it]                                                       {'loss': 1.6419, 'learning_rate': 0.00012236739531791863, 'epoch': 0.63}
+ 63%|██████▎   | 4289/6779 [2:39:06<1:35:16,  2.30s/it] 63%|██████▎   | 4290/6779 [2:39:08<1:36:17,  2.32s/it]                                                       {'loss': 1.778, 'learning_rate': 0.0001222807064197665, 'epoch': 0.63}
+ 63%|██████▎   | 4290/6779 [2:39:09<1:36:17,  2.32s/it] 63%|██████▎   | 4291/6779 [2:39:11<1:35:40,  2.31s/it]                                                       {'loss': 1.6385, 'learning_rate': 0.00012219403471675356, 'epoch': 0.63}
+ 63%|██████▎   | 4291/6779 [2:39:11<1:35:40,  2.31s/it] 63%|██████▎   | 4292/6779 [2:39:13<1:33:58,  2.27s/it]                                                       {'loss': 1.6514, 'learning_rate': 0.0001221073802280556, 'epoch': 0.63}
+ 63%|██████▎   | 4292/6779 [2:39:13<1:33:58,  2.27s/it] 63%|██████▎   | 4293/6779 [2:39:15<1:33:15,  2.25s/it]                                                       {'loss': 1.6765, 'learning_rate': 0.00012202074297284465, 'epoch': 0.63}
+ 63%|██████▎   | 4293/6779 [2:39:15<1:33:15,  2.25s/it] 63%|██████▎   | 4294/6779 [2:39:17<1:33:32,  2.26s/it]                                                       {'loss': 1.824, 'learning_rate': 0.00012193412297028894, 'epoch': 0.63}
+ 63%|██████▎   | 4294/6779 [2:39:17<1:33:32,  2.26s/it] 63%|██████▎   | 4295/6779 [2:39:20<1:32:16,  2.23s/it]                                                       {'loss': 1.7888, 'learning_rate': 0.00012184752023955281, 'epoch': 0.63}
+ 63%|██████▎   | 4295/6779 [2:39:20<1:32:16,  2.23s/it] 63%|██████▎   | 4296/6779 [2:39:22<1:32:23,  2.23s/it]                                                       {'loss': 1.4818, 'learning_rate': 0.00012176093479979683, 'epoch': 0.63}
+ 63%|██████▎   | 4296/6779 [2:39:22<1:32:23,  2.23s/it] 63%|██████▎   | 4297/6779 [2:39:24<1:33:41,  2.27s/it]                                                       {'loss': 1.5906, 'learning_rate': 0.0001216743666701778, 'epoch': 0.63}
+ 63%|██████▎   | 4297/6779 [2:39:24<1:33:41,  2.27s/it] 63%|██████▎   | 4298/6779 [2:39:26<1:30:35,  2.19s/it]                                                       {'loss': 1.677, 'learning_rate': 0.00012158781586984864, 'epoch': 0.63}
+ 63%|██████▎   | 4298/6779 [2:39:26<1:30:35,  2.19s/it] 63%|██████▎   | 4299/6779 [2:39:28<1:29:24,  2.16s/it]                                                       {'loss': 1.6538, 'learning_rate': 0.00012150128241795842, 'epoch': 0.63}
+ 63%|██████▎   | 4299/6779 [2:39:28<1:29:24,  2.16s/it] 63%|██████▎   | 4300/6779 [2:39:30<1:29:52,  2.18s/it]                                                       {'loss': 1.6752, 'learning_rate': 0.00012141476633365237, 'epoch': 0.63}
+ 63%|██████▎   | 4300/6779 [2:39:30<1:29:52,  2.18s/it] 63%|██████▎   | 4301/6779 [2:39:33<1:28:51,  2.15s/it]                                                       {'loss': 1.6352, 'learning_rate': 0.00012132826763607186, 'epoch': 0.63}
+ 63%|██████▎   | 4301/6779 [2:39:33<1:28:51,  2.15s/it] 63%|██████▎   | 4302/6779 [2:39:35<1:29:18,  2.16s/it]                                                       {'loss': 1.5177, 'learning_rate': 0.00012124178634435449, 'epoch': 0.63}
+ 63%|██████▎   | 4302/6779 [2:39:35<1:29:18,  2.16s/it] 63%|██████▎   | 4303/6779 [2:39:37<1:29:18,  2.16s/it]                                                       {'loss': 1.7718, 'learning_rate': 0.00012115532247763389, 'epoch': 0.63}
+ 63%|██████▎   | 4303/6779 [2:39:37<1:29:18,  2.16s/it] 63%|██████▎   | 4304/6779 [2:39:39<1:27:50,  2.13s/it]                                                       {'loss': 1.6457, 'learning_rate': 0.00012106887605504002, 'epoch': 0.63}
+ 63%|██████▎   | 4304/6779 [2:39:39<1:27:50,  2.13s/it] 64%|██████▎   | 4305/6779 [2:39:41<1:27:15,  2.12s/it]                                                       {'loss': 1.5962, 'learning_rate': 0.00012098244709569879, 'epoch': 0.64}
+ 64%|██████▎   | 4305/6779 [2:39:41<1:27:15,  2.12s/it] 64%|██████▎   | 4306/6779 [2:39:43<1:28:44,  2.15s/it]                                                       {'loss': 1.7569, 'learning_rate': 0.00012089603561873237, 'epoch': 0.64}
+ 64%|██████▎   | 4306/6779 [2:39:43<1:28:44,  2.15s/it] 64%|██████▎   | 4307/6779 [2:39:46<1:30:38,  2.20s/it]                                                       {'loss': 1.5579, 'learning_rate': 0.00012080964164325897, 'epoch': 0.64}
+ 64%|██████▎   | 4307/6779 [2:39:46<1:30:38,  2.20s/it] 64%|██████▎   | 4308/6779 [2:39:48<1:29:29,  2.17s/it]                                                       {'loss': 1.622, 'learning_rate': 0.000120723265188393, 'epoch': 0.64}
+ 64%|██████▎   | 4308/6779 [2:39:48<1:29:29,  2.17s/it] 64%|██████▎   | 4309/6779 [2:39:50<1:31:01,  2.21s/it]                                                       {'loss': 1.5637, 'learning_rate': 0.00012063690627324498, 'epoch': 0.64}
+ 64%|██████▎   | 4309/6779 [2:39:50<1:31:01,  2.21s/it] 64%|██████▎   | 4310/6779 [2:39:54<1:50:01,  2.67s/it]                                                       {'loss': 1.7365, 'learning_rate': 0.0001205505649169215, 'epoch': 0.64}
+ 64%|██████▎   | 4310/6779 [2:39:54<1:50:01,  2.67s/it] 64%|██████▎   | 4311/6779 [2:39:56<1:43:38,  2.52s/it]                                                       {'loss': 1.6649, 'learning_rate': 0.00012046424113852528, 'epoch': 0.64}
+ 64%|██████▎   | 4311/6779 [2:39:56<1:43:38,  2.52s/it] 64%|██████▎   | 4312/6779 [2:39:58<1:37:47,  2.38s/it]                                                       {'loss': 1.7492, 'learning_rate': 0.00012037793495715526, 'epoch': 0.64}
+ 64%|██████▎   | 4312/6779 [2:39:58<1:37:47,  2.38s/it] 64%|██████▎   | 4313/6779 [2:40:00<1:33:54,  2.28s/it]                                                       {'loss': 1.6706, 'learning_rate': 0.00012029164639190638, 'epoch': 0.64}
+ 64%|██████▎   | 4313/6779 [2:40:00<1:33:54,  2.28s/it] 64%|██████▎   | 4314/6779 [2:40:02<1:35:08,  2.32s/it]                                                       {'loss': 1.5708, 'learning_rate': 0.00012020537546186964, 'epoch': 0.64}
+ 64%|██████▎   | 4314/6779 [2:40:02<1:35:08,  2.32s/it] 64%|██████▎   | 4315/6779 [2:40:05<1:36:25,  2.35s/it]                                                       {'loss': 1.8715, 'learning_rate': 0.00012011912218613224, 'epoch': 0.64}
+ 64%|██████▎   | 4315/6779 [2:40:05<1:36:25,  2.35s/it] 64%|██████▎   | 4316/6779 [2:40:07<1:36:45,  2.36s/it]                                                       {'loss': 1.6348, 'learning_rate': 0.00012003288658377747, 'epoch': 0.64}
+ 64%|██████▎   | 4316/6779 [2:40:07<1:36:45,  2.36s/it] 64%|██████▎   | 4317/6779 [2:40:09<1:32:59,  2.27s/it]                                                       {'loss': 1.5851, 'learning_rate': 0.0001199466686738846, 'epoch': 0.64}
+ 64%|██████▎   | 4317/6779 [2:40:09<1:32:59,  2.27s/it] 64%|██████▎   | 4318/6779 [2:40:12<1:35:33,  2.33s/it]                                                       {'loss': 1.8108, 'learning_rate': 0.00011986046847552908, 'epoch': 0.64}
+ 64%|██████▎   | 4318/6779 [2:40:12<1:35:33,  2.33s/it] 64%|██████▎   | 4319/6779 [2:40:14<1:34:20,  2.30s/it]                                                       {'loss': 1.7242, 'learning_rate': 0.00011977428600778246, 'epoch': 0.64}
+ 64%|██████▎   | 4319/6779 [2:40:14<1:34:20,  2.30s/it] 64%|██████▎   | 4320/6779 [2:40:16<1:33:29,  2.28s/it]                                                       {'loss': 1.6364, 'learning_rate': 0.00011968812128971232, 'epoch': 0.64}
+ 64%|██████▎   | 4320/6779 [2:40:16<1:33:29,  2.28s/it] 64%|██████▎   | 4321/6779 [2:40:18<1:31:43,  2.24s/it]                                                       {'loss': 1.7087, 'learning_rate': 0.00011960197434038231, 'epoch': 0.64}
+ 64%|██████▎   | 4321/6779 [2:40:18<1:31:43,  2.24s/it] 64%|██████▍   | 4322/6779 [2:40:21<1:32:50,  2.27s/it]                                                       {'loss': 1.6028, 'learning_rate': 0.00011951584517885215, 'epoch': 0.64}
+ 64%|██████▍   | 4322/6779 [2:40:21<1:32:50,  2.27s/it] 64%|██████▍   | 4323/6779 [2:40:23<1:31:12,  2.23s/it]                                                       {'loss': 1.6921, 'learning_rate': 0.00011942973382417766, 'epoch': 0.64}
+ 64%|██████▍   | 4323/6779 [2:40:23<1:31:12,  2.23s/it] 64%|██████▍   | 4324/6779 [2:40:25<1:31:23,  2.23s/it]                                                       {'loss': 1.6376, 'learning_rate': 0.00011934364029541067, 'epoch': 0.64}
+ 64%|██████▍   | 4324/6779 [2:40:25<1:31:23,  2.23s/it] 64%|██████▍   | 4325/6779 [2:40:27<1:31:31,  2.24s/it]                                                       {'loss': 1.7816, 'learning_rate': 0.00011925756461159907, 'epoch': 0.64}
+ 64%|██████▍   | 4325/6779 [2:40:27<1:31:31,  2.24s/it] 64%|██████▍   | 4326/6779 [2:40:30<1:30:43,  2.22s/it]                                                       {'loss': 1.7306, 'learning_rate': 0.0001191715067917869, 'epoch': 0.64}
+ 64%|██████▍   | 4326/6779 [2:40:30<1:30:43,  2.22s/it] 64%|██████▍   | 4327/6779 [2:40:32<1:30:59,  2.23s/it]                                                       {'loss': 1.6005, 'learning_rate': 0.0001190854668550141, 'epoch': 0.64}
+ 64%|██████▍   | 4327/6779 [2:40:32<1:30:59,  2.23s/it] 64%|██████▍   | 4328/6779 [2:40:34<1:29:25,  2.19s/it]                                                       {'loss': 1.7739, 'learning_rate': 0.00011899944482031675, 'epoch': 0.64}
+ 64%|██████▍   | 4328/6779 [2:40:34<1:29:25,  2.19s/it] 64%|██████▍   | 4329/6779 [2:40:36<1:29:52,  2.20s/it]                                                       {'loss': 1.6932, 'learning_rate': 0.00011891344070672699, 'epoch': 0.64}
+ 64%|██████▍   | 4329/6779 [2:40:36<1:29:52,  2.20s/it] 64%|██████▍   | 4330/6779 [2:40:38<1:28:56,  2.18s/it]                                                       {'loss': 1.6464, 'learning_rate': 0.00011882745453327287, 'epoch': 0.64}
+ 64%|██████▍   | 4330/6779 [2:40:38<1:28:56,  2.18s/it] 64%|██████▍   | 4331/6779 [2:40:41<1:30:02,  2.21s/it]                                                       {'loss': 1.8473, 'learning_rate': 0.00011874148631897857, 'epoch': 0.64}
+ 64%|██████▍   | 4331/6779 [2:40:41<1:30:02,  2.21s/it] 64%|██████▍   | 4332/6779 [2:40:43<1:29:01,  2.18s/it]                                                       {'loss': 1.6861, 'learning_rate': 0.00011865553608286424, 'epoch': 0.64}
+ 64%|██████▍   | 4332/6779 [2:40:43<1:29:01,  2.18s/it] 64%|██████▍   | 4333/6779 [2:40:45<1:27:01,  2.13s/it]                                                       {'loss': 1.6709, 'learning_rate': 0.0001185696038439462, 'epoch': 0.64}
+ 64%|██████▍   | 4333/6779 [2:40:45<1:27:01,  2.13s/it] 64%|██████▍   | 4334/6779 [2:40:47<1:27:18,  2.14s/it]                                                       {'loss': 1.5742, 'learning_rate': 0.00011848368962123659, 'epoch': 0.64}
+ 64%|██████▍   | 4334/6779 [2:40:47<1:27:18,  2.14s/it] 64%|██████▍   | 4335/6779 [2:40:49<1:27:11,  2.14s/it]                                                       {'loss': 1.5893, 'learning_rate': 0.00011839779343374369, 'epoch': 0.64}
+ 64%|██████▍   | 4335/6779 [2:40:49<1:27:11,  2.14s/it] 64%|██████▍   | 4336/6779 [2:40:51<1:27:17,  2.14s/it]                                                       {'loss': 1.6173, 'learning_rate': 0.00011831191530047174, 'epoch': 0.64}
+ 64%|██████▍   | 4336/6779 [2:40:51<1:27:17,  2.14s/it] 64%|██████▍   | 4337/6779 [2:40:53<1:28:05,  2.16s/it]                                                       {'loss': 1.7142, 'learning_rate': 0.00011822605524042096, 'epoch': 0.64}
+ 64%|██████▍   | 4337/6779 [2:40:53<1:28:05,  2.16s/it] 64%|██████▍   | 4338/6779 [2:40:55<1:26:52,  2.14s/it]                                                       {'loss': 1.7167, 'learning_rate': 0.00011814021327258764, 'epoch': 0.64}
+ 64%|██████▍   | 4338/6779 [2:40:55<1:26:52,  2.14s/it] 64%|██████▍   | 4339/6779 [2:40:58<1:27:49,  2.16s/it]                                                       {'loss': 1.5434, 'learning_rate': 0.00011805438941596398, 'epoch': 0.64}
+ 64%|██████▍   | 4339/6779 [2:40:58<1:27:49,  2.16s/it] 64%|██████▍   | 4340/6779 [2:41:00<1:29:13,  2.20s/it]                                                       {'loss': 1.7036, 'learning_rate': 0.00011796858368953836, 'epoch': 0.64}
+ 64%|██████▍   | 4340/6779 [2:41:00<1:29:13,  2.20s/it] 64%|██████▍   | 4341/6779 [2:41:02<1:30:17,  2.22s/it]                                                       {'loss': 1.8202, 'learning_rate': 0.0001178827961122949, 'epoch': 0.64}
+ 64%|██████▍   | 4341/6779 [2:41:02<1:30:17,  2.22s/it] 64%|██████▍   | 4342/6779 [2:41:04<1:30:31,  2.23s/it]                                                       {'loss': 1.7685, 'learning_rate': 0.00011779702670321387, 'epoch': 0.64}
+ 64%|██████▍   | 4342/6779 [2:41:04<1:30:31,  2.23s/it] 64%|██████▍   | 4343/6779 [2:41:07<1:29:38,  2.21s/it]                                                       {'loss': 1.8388, 'learning_rate': 0.00011771127548127143, 'epoch': 0.64}
+ 64%|██████▍   | 4343/6779 [2:41:07<1:29:38,  2.21s/it] 64%|██████▍   | 4344/6779 [2:41:09<1:29:05,  2.20s/it]                                                       {'loss': 1.6172, 'learning_rate': 0.0001176255424654398, 'epoch': 0.64}
+ 64%|██████▍   | 4344/6779 [2:41:09<1:29:05,  2.20s/it] 64%|██████▍   | 4345/6779 [2:41:11<1:32:58,  2.29s/it]                                                       {'loss': 1.4126, 'learning_rate': 0.0001175398276746871, 'epoch': 0.64}
+ 64%|██████▍   | 4345/6779 [2:41:11<1:32:58,  2.29s/it] 64%|██████▍   | 4346/6779 [2:41:13<1:31:50,  2.26s/it]                                                       {'loss': 1.6854, 'learning_rate': 0.00011745413112797736, 'epoch': 0.64}
+ 64%|██████▍   | 4346/6779 [2:41:13<1:31:50,  2.26s/it] 64%|██████▍   | 4347/6779 [2:41:15<1:28:52,  2.19s/it]                                                       {'loss': 1.7603, 'learning_rate': 0.00011736845284427085, 'epoch': 0.64}
+ 64%|██████▍   | 4347/6779 [2:41:15<1:28:52,  2.19s/it] 64%|██████▍   | 4348/6779 [2:41:18<1:29:54,  2.22s/it]                                                       {'loss': 1.5987, 'learning_rate': 0.00011728279284252357, 'epoch': 0.64}
+ 64%|██████▍   | 4348/6779 [2:41:18<1:29:54,  2.22s/it] 64%|██████▍   | 4349/6779 [2:41:20<1:31:50,  2.27s/it]                                                       {'loss': 1.7076, 'learning_rate': 0.0001171971511416874, 'epoch': 0.64}
+ 64%|██████▍   | 4349/6779 [2:41:20<1:31:50,  2.27s/it] 64%|██████▍   | 4350/6779 [2:41:22<1:29:34,  2.21s/it]                                                       {'loss': 1.6585, 'learning_rate': 0.00011711152776071038, 'epoch': 0.64}
+ 64%|██████▍   | 4350/6779 [2:41:22<1:29:34,  2.21s/it] 64%|██████▍   | 4351/6779 [2:41:24<1:29:02,  2.20s/it]                                                       {'loss': 1.6975, 'learning_rate': 0.00011702592271853632, 'epoch': 0.64}
+ 64%|██████▍   | 4351/6779 [2:41:24<1:29:02,  2.20s/it] 64%|██████▍   | 4352/6779 [2:41:27<1:29:36,  2.22s/it]                                                       {'loss': 1.6042, 'learning_rate': 0.00011694033603410515, 'epoch': 0.64}
+ 64%|██████▍   | 4352/6779 [2:41:27<1:29:36,  2.22s/it] 64%|██████▍   | 4353/6779 [2:41:29<1:30:47,  2.25s/it]                                                       {'loss': 1.4995, 'learning_rate': 0.00011685476772635249, 'epoch': 0.64}
+ 64%|██████▍   | 4353/6779 [2:41:29<1:30:47,  2.25s/it] 64%|██████▍   | 4354/6779 [2:41:31<1:31:34,  2.27s/it]                                                       {'loss': 1.7877, 'learning_rate': 0.00011676921781421029, 'epoch': 0.64}
+ 64%|██████▍   | 4354/6779 [2:41:31<1:31:34,  2.27s/it] 64%|██████▍   | 4355/6779 [2:41:33<1:29:33,  2.22s/it]                                                       {'loss': 1.5401, 'learning_rate': 0.00011668368631660596, 'epoch': 0.64}
+ 64%|██████▍   | 4355/6779 [2:41:33<1:29:33,  2.22s/it] 64%|██████▍   | 4356/6779 [2:41:36<1:30:04,  2.23s/it]                                                       {'loss': 1.8078, 'learning_rate': 0.00011659817325246325, 'epoch': 0.64}
+ 64%|██████▍   | 4356/6779 [2:41:36<1:30:04,  2.23s/it] 64%|██████▍   | 4357/6779 [2:41:38<1:30:10,  2.23s/it]                                                       {'loss': 1.882, 'learning_rate': 0.00011651267864070145, 'epoch': 0.64}
+ 64%|██████▍   | 4357/6779 [2:41:38<1:30:10,  2.23s/it] 64%|██████▍   | 4358/6779 [2:41:40<1:31:27,  2.27s/it]                                                       {'loss': 1.6159, 'learning_rate': 0.00011642720250023617, 'epoch': 0.64}
+ 64%|██████▍   | 4358/6779 [2:41:40<1:31:27,  2.27s/it] 64%|██████▍   | 4359/6779 [2:41:43<1:32:39,  2.30s/it]                                                       {'loss': 1.7666, 'learning_rate': 0.00011634174484997853, 'epoch': 0.64}
+ 64%|██████▍   | 4359/6779 [2:41:43<1:32:39,  2.30s/it] 64%|██████▍   | 4360/6779 [2:41:45<1:38:32,  2.44s/it]                                                       {'loss': 1.7064, 'learning_rate': 0.00011625630570883586, 'epoch': 0.64}
+ 64%|██████▍   | 4360/6779 [2:41:45<1:38:32,  2.44s/it] 64%|██████▍   | 4361/6779 [2:41:48<1:37:36,  2.42s/it]                                                       {'loss': 1.4699, 'learning_rate': 0.00011617088509571134, 'epoch': 0.64}
+ 64%|██████▍   | 4361/6779 [2:41:48<1:37:36,  2.42s/it] 64%|██████▍   | 4362/6779 [2:41:50<1:35:51,  2.38s/it]                                                       {'loss': 1.6124, 'learning_rate': 0.00011608548302950388, 'epoch': 0.64}
+ 64%|██████▍   | 4362/6779 [2:41:50<1:35:51,  2.38s/it] 64%|██████▍   | 4363/6779 [2:41:52<1:33:14,  2.32s/it]                                                       {'loss': 1.7564, 'learning_rate': 0.00011600009952910853, 'epoch': 0.64}
+ 64%|██████▍   | 4363/6779 [2:41:52<1:33:14,  2.32s/it] 64%|██████▍   | 4364/6779 [2:41:54<1:30:17,  2.24s/it]                                                       {'loss': 1.6289, 'learning_rate': 0.00011591473461341596, 'epoch': 0.64}
+ 64%|██████▍   | 4364/6779 [2:41:54<1:30:17,  2.24s/it] 64%|██████▍   | 4365/6779 [2:41:57<1:30:08,  2.24s/it]                                                       {'loss': 1.5874, 'learning_rate': 0.00011582938830131307, 'epoch': 0.64}
+ 64%|██████▍   | 4365/6779 [2:41:57<1:30:08,  2.24s/it] 64%|██████▍   | 4366/6779 [2:41:59<1:33:17,  2.32s/it]                                                       {'loss': 1.634, 'learning_rate': 0.00011574406061168224, 'epoch': 0.64}
+ 64%|██████▍   | 4366/6779 [2:41:59<1:33:17,  2.32s/it] 64%|██████▍   | 4367/6779 [2:42:01<1:33:26,  2.32s/it]                                                       {'loss': 1.795, 'learning_rate': 0.00011565875156340204, 'epoch': 0.64}
+ 64%|██████▍   | 4367/6779 [2:42:01<1:33:26,  2.32s/it] 64%|██████▍   | 4368/6779 [2:42:04<1:32:27,  2.30s/it]                                                       {'loss': 1.586, 'learning_rate': 0.00011557346117534693, 'epoch': 0.64}
+ 64%|██████▍   | 4368/6779 [2:42:04<1:32:27,  2.30s/it] 64%|██████▍   | 4369/6779 [2:42:06<1:31:04,  2.27s/it]                                                       {'loss': 1.6238, 'learning_rate': 0.00011548818946638693, 'epoch': 0.64}
+ 64%|██████▍   | 4369/6779 [2:42:06<1:31:04,  2.27s/it] 64%|██████▍   | 4370/6779 [2:42:08<1:29:18,  2.22s/it]                                                       {'loss': 1.5597, 'learning_rate': 0.00011540293645538831, 'epoch': 0.64}
+ 64%|██████▍   | 4370/6779 [2:42:08<1:29:18,  2.22s/it] 64%|██████▍   | 4371/6779 [2:42:10<1:28:04,  2.19s/it]                                                       {'loss': 1.6447, 'learning_rate': 0.00011531770216121285, 'epoch': 0.64}
+ 64%|██████▍   | 4371/6779 [2:42:10<1:28:04,  2.19s/it] 64%|██████▍   | 4372/6779 [2:42:13<1:33:27,  2.33s/it]                                                       {'loss': 1.803, 'learning_rate': 0.0001152324866027185, 'epoch': 0.64}
+ 64%|██████▍   | 4372/6779 [2:42:13<1:33:27,  2.33s/it] 65%|██████▍   | 4373/6779 [2:42:15<1:38:05,  2.45s/it]                                                       {'loss': 1.7431, 'learning_rate': 0.00011514728979875879, 'epoch': 0.65}
+ 65%|██████▍   | 4373/6779 [2:42:15<1:38:05,  2.45s/it] 65%|██████▍   | 4374/6779 [2:42:17<1:32:43,  2.31s/it]                                                       {'loss': 1.64, 'learning_rate': 0.00011506211176818331, 'epoch': 0.65}
+ 65%|██████▍   | 4374/6779 [2:42:17<1:32:43,  2.31s/it] 65%|██████▍   | 4375/6779 [2:42:20<1:35:04,  2.37s/it]                                                       {'loss': 1.8091, 'learning_rate': 0.0001149769525298375, 'epoch': 0.65}
+ 65%|██████▍   | 4375/6779 [2:42:20<1:35:04,  2.37s/it] 65%|██████▍   | 4376/6779 [2:42:22<1:33:03,  2.32s/it]                                                       {'loss': 1.7608, 'learning_rate': 0.00011489181210256238, 'epoch': 0.65}
+ 65%|██████▍   | 4376/6779 [2:42:22<1:33:03,  2.32s/it] 65%|██████▍   | 4377/6779 [2:42:24<1:31:17,  2.28s/it]                                                       {'loss': 1.7336, 'learning_rate': 0.00011480669050519518, 'epoch': 0.65}
+ 65%|██████▍   | 4377/6779 [2:42:24<1:31:17,  2.28s/it] 65%|██████▍   | 4378/6779 [2:42:26<1:29:34,  2.24s/it]                                                       {'loss': 1.5913, 'learning_rate': 0.00011472158775656861, 'epoch': 0.65}
+ 65%|██████▍   | 4378/6779 [2:42:26<1:29:34,  2.24s/it] 65%|██████▍   | 4379/6779 [2:42:29<1:29:05,  2.23s/it]                                                       {'loss': 1.6189, 'learning_rate': 0.0001146365038755115, 'epoch': 0.65}
+ 65%|██████▍   | 4379/6779 [2:42:29<1:29:05,  2.23s/it] 65%|██████▍   | 4380/6779 [2:42:31<1:31:24,  2.29s/it]                                                       {'loss': 1.5632, 'learning_rate': 0.00011455143888084827, 'epoch': 0.65}
+ 65%|██████▍   | 4380/6779 [2:42:31<1:31:24,  2.29s/it] 65%|██████▍   | 4381/6779 [2:42:33<1:29:37,  2.24s/it]                                                       {'loss': 1.5732, 'learning_rate': 0.00011446639279139933, 'epoch': 0.65}
+ 65%|██████▍   | 4381/6779 [2:42:33<1:29:37,  2.24s/it] 65%|██████▍   | 4382/6779 [2:42:35<1:29:00,  2.23s/it]                                                       {'loss': 1.5454, 'learning_rate': 0.00011438136562598085, 'epoch': 0.65}
+ 65%|██████▍   | 4382/6779 [2:42:35<1:29:00,  2.23s/it] 65%|██████▍   | 4383/6779 [2:42:38<1:30:38,  2.27s/it]                                                       {'loss': 1.6969, 'learning_rate': 0.00011429635740340488, 'epoch': 0.65}
+ 65%|██████▍   | 4383/6779 [2:42:38<1:30:38,  2.27s/it] 65%|██████▍   | 4384/6779 [2:42:40<1:33:34,  2.34s/it]                                                       {'loss': 1.5212, 'learning_rate': 0.00011421136814247914, 'epoch': 0.65}
+ 65%|██████▍   | 4384/6779 [2:42:40<1:33:34,  2.34s/it] 65%|██████▍   | 4385/6779 [2:42:42<1:30:02,  2.26s/it]                                                       {'loss': 1.5673, 'learning_rate': 0.00011412639786200716, 'epoch': 0.65}
+ 65%|██████▍   | 4385/6779 [2:42:42<1:30:02,  2.26s/it] 65%|██████▍   | 4386/6779 [2:42:45<1:30:36,  2.27s/it]                                                       {'loss': 1.8013, 'learning_rate': 0.00011404144658078848, 'epoch': 0.65}
+ 65%|██████▍   | 4386/6779 [2:42:45<1:30:36,  2.27s/it] 65%|██████▍   | 4387/6779 [2:42:47<1:32:58,  2.33s/it]                                                       {'loss': 1.707, 'learning_rate': 0.00011395651431761813, 'epoch': 0.65}
+ 65%|██████▍   | 4387/6779 [2:42:47<1:32:58,  2.33s/it] 65%|██████▍   | 4388/6779 [2:42:49<1:31:10,  2.29s/it]                                                       {'loss': 1.715, 'learning_rate': 0.00011387160109128725, 'epoch': 0.65}
+ 65%|██████▍   | 4388/6779 [2:42:49<1:31:10,  2.29s/it] 65%|██████▍   | 4389/6779 [2:42:51<1:29:55,  2.26s/it]                                                       {'loss': 1.5916, 'learning_rate': 0.0001137867069205824, 'epoch': 0.65}
+ 65%|██████▍   | 4389/6779 [2:42:51<1:29:55,  2.26s/it] 65%|██████▍   | 4390/6779 [2:42:54<1:27:07,  2.19s/it]                                                       {'loss': 1.5794, 'learning_rate': 0.00011370183182428644, 'epoch': 0.65}
+ 65%|██████▍   | 4390/6779 [2:42:54<1:27:07,  2.19s/it] 65%|██████▍   | 4391/6779 [2:42:56<1:27:53,  2.21s/it]                                                       {'loss': 1.588, 'learning_rate': 0.00011361697582117745, 'epoch': 0.65}
+ 65%|██████▍   | 4391/6779 [2:42:56<1:27:53,  2.21s/it] 65%|██████▍   | 4392/6779 [2:42:58<1:30:09,  2.27s/it]                                                       {'loss': 1.8062, 'learning_rate': 0.00011353213893002974, 'epoch': 0.65}
+ 65%|██████▍   | 4392/6779 [2:42:58<1:30:09,  2.27s/it] 65%|██████▍   | 4393/6779 [2:43:01<1:30:59,  2.29s/it]                                                       {'loss': 1.7273, 'learning_rate': 0.00011344732116961308, 'epoch': 0.65}
+ 65%|██████▍   | 4393/6779 [2:43:01<1:30:59,  2.29s/it] 65%|██████▍   | 4394/6779 [2:43:03<1:33:28,  2.35s/it]                                                       {'loss': 1.6616, 'learning_rate': 0.00011336252255869306, 'epoch': 0.65}
+ 65%|██████▍   | 4394/6779 [2:43:03<1:33:28,  2.35s/it] 65%|██████▍   | 4395/6779 [2:43:05<1:31:15,  2.30s/it]                                                       {'loss': 1.6194, 'learning_rate': 0.00011327774311603128, 'epoch': 0.65}
+ 65%|██████▍   | 4395/6779 [2:43:05<1:31:15,  2.30s/it] 65%|██████▍   | 4396/6779 [2:43:08<1:32:51,  2.34s/it]                                                       {'loss': 1.7909, 'learning_rate': 0.0001131929828603846, 'epoch': 0.65}
+ 65%|██████▍   | 4396/6779 [2:43:08<1:32:51,  2.34s/it] 65%|██████▍   | 4397/6779 [2:43:10<1:31:24,  2.30s/it]                                                       {'loss': 1.7705, 'learning_rate': 0.00011310824181050634, 'epoch': 0.65}
+ 65%|██████▍   | 4397/6779 [2:43:10<1:31:24,  2.30s/it] 65%|██████▍   | 4398/6779 [2:43:12<1:28:40,  2.23s/it]                                                       {'loss': 1.4525, 'learning_rate': 0.00011302351998514491, 'epoch': 0.65}
+ 65%|██████▍   | 4398/6779 [2:43:12<1:28:40,  2.23s/it] 65%|██████▍   | 4399/6779 [2:43:14<1:30:36,  2.28s/it]                                                       {'loss': 1.6983, 'learning_rate': 0.00011293881740304488, 'epoch': 0.65}
+ 65%|██████▍   | 4399/6779 [2:43:14<1:30:36,  2.28s/it] 65%|██████▍   | 4400/6779 [2:43:16<1:28:25,  2.23s/it]                                                       {'loss': 1.7375, 'learning_rate': 0.00011285413408294631, 'epoch': 0.65}
+ 65%|██████▍   | 4400/6779 [2:43:16<1:28:25,  2.23s/it] 65%|██████▍   | 4401/6779 [2:43:19<1:28:54,  2.24s/it]                                                       {'loss': 1.6217, 'learning_rate': 0.00011276947004358525, 'epoch': 0.65}
+ 65%|██████▍   | 4401/6779 [2:43:19<1:28:54,  2.24s/it] 65%|██████▍   | 4402/6779 [2:43:21<1:31:11,  2.30s/it]                                                       {'loss': 1.7079, 'learning_rate': 0.00011268482530369322, 'epoch': 0.65}
+ 65%|██████▍   | 4402/6779 [2:43:21<1:31:11,  2.30s/it] 65%|██████▍   | 4403/6779 [2:43:23<1:28:39,  2.24s/it]                                                       {'loss': 1.4938, 'learning_rate': 0.00011260019988199744, 'epoch': 0.65}
+ 65%|██████▍   | 4403/6779 [2:43:23<1:28:39,  2.24s/it] 65%|██████▍   | 4404/6779 [2:43:25<1:26:16,  2.18s/it]                                                       {'loss': 1.5518, 'learning_rate': 0.00011251559379722138, 'epoch': 0.65}
+ 65%|██████▍   | 4404/6779 [2:43:25<1:26:16,  2.18s/it] 65%|██████▍   | 4405/6779 [2:43:27<1:26:40,  2.19s/it]                                                       {'loss': 1.6106, 'learning_rate': 0.00011243100706808358, 'epoch': 0.65}
+ 65%|██████▍   | 4405/6779 [2:43:27<1:26:40,  2.19s/it] 65%|██████▍   | 4406/6779 [2:43:30<1:25:53,  2.17s/it]                                                       {'loss': 1.7965, 'learning_rate': 0.00011234643971329874, 'epoch': 0.65}
+ 65%|██████▍   | 4406/6779 [2:43:30<1:25:53,  2.17s/it] 65%|██████▌   | 4407/6779 [2:43:32<1:28:01,  2.23s/it]                                                       {'loss': 1.7451, 'learning_rate': 0.00011226189175157695, 'epoch': 0.65}
+ 65%|██████▌   | 4407/6779 [2:43:32<1:28:01,  2.23s/it] 65%|██████▌   | 4408/6779 [2:43:34<1:26:46,  2.20s/it]                                                       {'loss': 1.6052, 'learning_rate': 0.00011217736320162435, 'epoch': 0.65}
+ 65%|██████▌   | 4408/6779 [2:43:34<1:26:46,  2.20s/it] 65%|██████▌   | 4409/6779 [2:43:36<1:24:57,  2.15s/it]                                                       {'loss': 1.5435, 'learning_rate': 0.00011209285408214241, 'epoch': 0.65}
+ 65%|██████▌   | 4409/6779 [2:43:36<1:24:57,  2.15s/it] 65%|██████▌   | 4410/6779 [2:43:38<1:24:36,  2.14s/it]                                                       {'loss': 1.5778, 'learning_rate': 0.00011200836441182861, 'epoch': 0.65}
+ 65%|██████▌   | 4410/6779 [2:43:38<1:24:36,  2.14s/it] 65%|██████▌   | 4411/6779 [2:43:40<1:25:26,  2.16s/it]                                                       {'loss': 1.6161, 'learning_rate': 0.00011192389420937605, 'epoch': 0.65}
+ 65%|██████▌   | 4411/6779 [2:43:40<1:25:26,  2.16s/it] 65%|██████▌   | 4412/6779 [2:43:43<1:24:52,  2.15s/it]                                                       {'loss': 1.5359, 'learning_rate': 0.00011183944349347335, 'epoch': 0.65}
+ 65%|██████▌   | 4412/6779 [2:43:43<1:24:52,  2.15s/it] 65%|██████▌   | 4413/6779 [2:43:45<1:24:57,  2.15s/it]                                                       {'loss': 1.6065, 'learning_rate': 0.00011175501228280513, 'epoch': 0.65}
+ 65%|██████▌   | 4413/6779 [2:43:45<1:24:57,  2.15s/it] 65%|██████▌   | 4414/6779 [2:43:47<1:28:17,  2.24s/it]                                                       {'loss': 1.802, 'learning_rate': 0.00011167060059605136, 'epoch': 0.65}
+ 65%|██████▌   | 4414/6779 [2:43:47<1:28:17,  2.24s/it] 65%|██████▌   | 4415/6779 [2:43:49<1:26:03,  2.18s/it]                                                       {'loss': 1.6032, 'learning_rate': 0.00011158620845188799, 'epoch': 0.65}
+ 65%|██████▌   | 4415/6779 [2:43:49<1:26:03,  2.18s/it] 65%|██████▌   | 4416/6779 [2:43:51<1:26:42,  2.20s/it]                                                       {'loss': 1.5934, 'learning_rate': 0.00011150183586898633, 'epoch': 0.65}
+ 65%|██████▌   | 4416/6779 [2:43:51<1:26:42,  2.20s/it] 65%|██████▌   | 4417/6779 [2:43:54<1:29:04,  2.26s/it]                                                       {'loss': 1.626, 'learning_rate': 0.00011141748286601367, 'epoch': 0.65}
+ 65%|██████▌   | 4417/6779 [2:43:54<1:29:04,  2.26s/it] 65%|██████▌   | 4418/6779 [2:43:56<1:27:56,  2.23s/it]                                                       {'loss': 1.6022, 'learning_rate': 0.00011133314946163285, 'epoch': 0.65}
+ 65%|██████▌   | 4418/6779 [2:43:56<1:27:56,  2.23s/it] 65%|██████▌   | 4419/6779 [2:43:58<1:26:03,  2.19s/it]                                                       {'loss': 1.6439, 'learning_rate': 0.00011124883567450224, 'epoch': 0.65}
+ 65%|██████▌   | 4419/6779 [2:43:58<1:26:03,  2.19s/it] 65%|██████▌   | 4420/6779 [2:44:00<1:23:57,  2.14s/it]                                                       {'loss': 1.4832, 'learning_rate': 0.00011116454152327615, 'epoch': 0.65}
+ 65%|██████▌   | 4420/6779 [2:44:00<1:23:57,  2.14s/it] 65%|██████▌   | 4421/6779 [2:44:02<1:25:22,  2.17s/it]                                                       {'loss': 1.5117, 'learning_rate': 0.00011108026702660424, 'epoch': 0.65}
+ 65%|██████▌   | 4421/6779 [2:44:02<1:25:22,  2.17s/it] 65%|██████▌   | 4422/6779 [2:44:05<1:25:15,  2.17s/it]                                                       {'loss': 1.7248, 'learning_rate': 0.00011099601220313207, 'epoch': 0.65}
+ 65%|██████▌   | 4422/6779 [2:44:05<1:25:15,  2.17s/it] 65%|██████▌   | 4423/6779 [2:44:07<1:25:20,  2.17s/it]                                                       {'loss': 1.5205, 'learning_rate': 0.00011091177707150062, 'epoch': 0.65}
+ 65%|██████▌   | 4423/6779 [2:44:07<1:25:20,  2.17s/it] 65%|██████▌   | 4424/6779 [2:44:09<1:26:27,  2.20s/it]                                                       {'loss': 1.524, 'learning_rate': 0.00011082756165034672, 'epoch': 0.65}
+ 65%|██████▌   | 4424/6779 [2:44:09<1:26:27,  2.20s/it] 65%|██████▌   | 4425/6779 [2:44:11<1:28:52,  2.27s/it]                                                       {'loss': 1.7069, 'learning_rate': 0.00011074336595830281, 'epoch': 0.65}
+ 65%|██████▌   | 4425/6779 [2:44:11<1:28:52,  2.27s/it] 65%|██████▌   | 4426/6779 [2:44:14<1:26:43,  2.21s/it]                                                       {'loss': 1.7443, 'learning_rate': 0.0001106591900139968, 'epoch': 0.65}
+ 65%|██████▌   | 4426/6779 [2:44:14<1:26:43,  2.21s/it] 65%|██████▌   | 4427/6779 [2:44:16<1:26:30,  2.21s/it]                                                       {'loss': 1.5425, 'learning_rate': 0.00011057503383605245, 'epoch': 0.65}
+ 65%|██████▌   | 4427/6779 [2:44:16<1:26:30,  2.21s/it] 65%|██████▌   | 4428/6779 [2:44:18<1:26:08,  2.20s/it]                                                       {'loss': 1.6333, 'learning_rate': 0.00011049089744308894, 'epoch': 0.65}
+ 65%|██████▌   | 4428/6779 [2:44:18<1:26:08,  2.20s/it] 65%|█████���▌   | 4429/6779 [2:44:20<1:25:41,  2.19s/it]                                                       {'loss': 1.5434, 'learning_rate': 0.00011040678085372124, 'epoch': 0.65}
+ 65%|██████▌   | 4429/6779 [2:44:20<1:25:41,  2.19s/it] 65%|██████▌   | 4430/6779 [2:44:22<1:26:17,  2.20s/it]                                                       {'loss': 1.8235, 'learning_rate': 0.00011032268408655981, 'epoch': 0.65}
+ 65%|██████▌   | 4430/6779 [2:44:22<1:26:17,  2.20s/it] 65%|██████▌   | 4431/6779 [2:44:24<1:23:19,  2.13s/it]                                                       {'loss': 1.6625, 'learning_rate': 0.00011023860716021079, 'epoch': 0.65}
+ 65%|██████▌   | 4431/6779 [2:44:24<1:23:19,  2.13s/it] 65%|██████▌   | 4432/6779 [2:44:26<1:22:32,  2.11s/it]                                                       {'loss': 1.6882, 'learning_rate': 0.00011015455009327604, 'epoch': 0.65}
+ 65%|██████▌   | 4432/6779 [2:44:26<1:22:32,  2.11s/it] 65%|██████▌   | 4433/6779 [2:44:29<1:24:33,  2.16s/it]                                                       {'loss': 1.7099, 'learning_rate': 0.00011007051290435275, 'epoch': 0.65}
+ 65%|██████▌   | 4433/6779 [2:44:29<1:24:33,  2.16s/it] 65%|██████▌   | 4434/6779 [2:44:31<1:24:49,  2.17s/it]                                                       {'loss': 1.7015, 'learning_rate': 0.00010998649561203405, 'epoch': 0.65}
+ 65%|██████▌   | 4434/6779 [2:44:31<1:24:49,  2.17s/it] 65%|██████▌   | 4435/6779 [2:44:33<1:25:04,  2.18s/it]                                                       {'loss': 1.673, 'learning_rate': 0.00010990249823490825, 'epoch': 0.65}
+ 65%|██████▌   | 4435/6779 [2:44:33<1:25:04,  2.18s/it] 65%|██████▌   | 4436/6779 [2:44:35<1:26:06,  2.21s/it]                                                       {'loss': 1.5661, 'learning_rate': 0.00010981852079155974, 'epoch': 0.65}
+ 65%|██████▌   | 4436/6779 [2:44:35<1:26:06,  2.21s/it] 65%|██████▌   | 4437/6779 [2:44:37<1:24:26,  2.16s/it]                                                       {'loss': 1.6798, 'learning_rate': 0.00010973456330056806, 'epoch': 0.65}
+ 65%|██████▌   | 4437/6779 [2:44:37<1:24:26,  2.16s/it] 65%|██████▌   | 4438/6779 [2:44:39<1:24:08,  2.16s/it]                                                       {'loss': 1.4483, 'learning_rate': 0.00010965062578050864, 'epoch': 0.65}
+ 65%|██████▌   | 4438/6779 [2:44:39<1:24:08,  2.16s/it] 65%|██████▌   | 4439/6779 [2:44:42<1:25:00,  2.18s/it]                                                       {'loss': 1.7962, 'learning_rate': 0.0001095667082499524, 'epoch': 0.65}
+ 65%|██████▌   | 4439/6779 [2:44:42<1:25:00,  2.18s/it] 65%|██████▌   | 4440/6779 [2:44:44<1:26:21,  2.22s/it]                                                       {'loss': 1.6799, 'learning_rate': 0.00010948281072746572, 'epoch': 0.65}
+ 65%|██████▌   | 4440/6779 [2:44:44<1:26:21,  2.22s/it] 66%|██████▌   | 4441/6779 [2:44:46<1:26:22,  2.22s/it]                                                       {'loss': 1.6705, 'learning_rate': 0.00010939893323161076, 'epoch': 0.66}
+ 66%|██████▌   | 4441/6779 [2:44:46<1:26:22,  2.22s/it] 66%|██████▌   | 4442/6779 [2:44:49<1:27:48,  2.25s/it]                                                       {'loss': 1.6674, 'learning_rate': 0.00010931507578094504, 'epoch': 0.66}
+ 66%|██████▌   | 4442/6779 [2:44:49<1:27:48,  2.25s/it] 66%|██████▌   | 4443/6779 [2:44:51<1:28:54,  2.28s/it]                                                       {'loss': 1.6996, 'learning_rate': 0.00010923123839402185, 'epoch': 0.66}
+ 66%|██████▌   | 4443/6779 [2:44:51<1:28:54,  2.28s/it] 66%|██████▌   | 4444/6779 [2:44:53<1:26:15,  2.22s/it]                                                       {'loss': 1.5609, 'learning_rate': 0.00010914742108938983, 'epoch': 0.66}
+ 66%|██████▌   | 4444/6779 [2:44:53<1:26:15,  2.22s/it] 66%|██████▌   | 4445/6779 [2:44:55<1:25:10,  2.19s/it]                                                       {'loss': 1.6639, 'learning_rate': 0.00010906362388559333, 'epoch': 0.66}
+ 66%|██████▌   | 4445/6779 [2:44:55<1:25:10,  2.19s/it] 66%|██████▌   | 4446/6779 [2:44:57<1:25:36,  2.20s/it]                                                       {'loss': 1.6835, 'learning_rate': 0.00010897984680117228, 'epoch': 0.66}
+ 66%|██████▌   | 4446/6779 [2:44:57<1:25:36,  2.20s/it] 66%|██████▌   | 4447/6779 [2:44:59<1:24:23,  2.17s/it]                                                       {'loss': 1.8593, 'learning_rate': 0.00010889608985466193, 'epoch': 0.66}
+ 66%|██████▌   | 4447/6779 [2:44:59<1:24:23,  2.17s/it] 66%|██████▌   | 4448/6779 [2:45:02<1:26:15,  2.22s/it]                                                       {'loss': 1.4772, 'learning_rate': 0.0001088123530645934, 'epoch': 0.66}
+ 66%|██████▌   | 4448/6779 [2:45:02<1:26:15,  2.22s/it] 66%|██████▌   | 4449/6779 [2:45:04<1:26:19,  2.22s/it]                                                       {'loss': 1.7615, 'learning_rate': 0.00010872863644949305, 'epoch': 0.66}
+ 66%|██████▌   | 4449/6779 [2:45:04<1:26:19,  2.22s/it] 66%|██████▌   | 4450/6779 [2:45:06<1:24:37,  2.18s/it]                                                       {'loss': 1.6206, 'learning_rate': 0.000108644940027883, 'epoch': 0.66}
+ 66%|██████▌   | 4450/6779 [2:45:06<1:24:37,  2.18s/it] 66%|██████▌   | 4451/6779 [2:45:08<1:24:26,  2.18s/it]                                                       {'loss': 1.5321, 'learning_rate': 0.00010856126381828072, 'epoch': 0.66}
+ 66%|██████▌   | 4451/6779 [2:45:08<1:24:26,  2.18s/it] 66%|██████▌   | 4452/6779 [2:45:10<1:22:37,  2.13s/it]                                                       {'loss': 1.5751, 'learning_rate': 0.00010847760783919931, 'epoch': 0.66}
+ 66%|██████▌   | 4452/6779 [2:45:10<1:22:37,  2.13s/it] 66%|██████▌   | 4453/6779 [2:45:12<1:23:43,  2.16s/it]                                                       {'loss': 1.5734, 'learning_rate': 0.00010839397210914746, 'epoch': 0.66}
+ 66%|██████▌   | 4453/6779 [2:45:13<1:23:43,  2.16s/it] 66%|██████▌   | 4454/6779 [2:45:15<1:22:24,  2.13s/it]                                                       {'loss': 1.6108, 'learning_rate': 0.0001083103566466293, 'epoch': 0.66}
+ 66%|██████▌   | 4454/6779 [2:45:15<1:22:24,  2.13s/it] 66%|██████▌   | 4455/6779 [2:45:17<1:24:14,  2.18s/it]                                                       {'loss': 1.6555, 'learning_rate': 0.00010822676147014443, 'epoch': 0.66}
+ 66%|██████▌   | 4455/6779 [2:45:17<1:24:14,  2.18s/it] 66%|██████▌   | 4456/6779 [2:45:19<1:24:09,  2.17s/it]                                                       {'loss': 1.4606, 'learning_rate': 0.00010814318659818794, 'epoch': 0.66}
+ 66%|██████▌   | 4456/6779 [2:45:19<1:24:09,  2.17s/it] 66%|██████▌   | 4457/6779 [2:45:22<1:28:45,  2.29s/it]                                                       {'loss': 1.7096, 'learning_rate': 0.00010805963204925064, 'epoch': 0.66}
+ 66%|██████▌   | 4457/6779 [2:45:22<1:28:45,  2.29s/it] 66%|██████▌   | 4458/6779 [2:45:23<1:24:25,  2.18s/it]                                                       {'loss': 1.4392, 'learning_rate': 0.00010797609784181857, 'epoch': 0.66}
+ 66%|██████▌   | 4458/6779 [2:45:24<1:24:25,  2.18s/it] 66%|██████▌   | 4459/6779 [2:45:26<1:24:59,  2.20s/it]                                                       {'loss': 1.5363, 'learning_rate': 0.00010789258399437345, 'epoch': 0.66}
+ 66%|██████▌   | 4459/6779 [2:45:26<1:24:59,  2.20s/it] 66%|██████▌   | 4460/6779 [2:45:28<1:30:44,  2.35s/it]                                                       {'loss': 1.6232, 'learning_rate': 0.00010780909052539244, 'epoch': 0.66}
+ 66%|██████▌   | 4460/6779 [2:45:28<1:30:44,  2.35s/it] 66%|██████▌   | 4461/6779 [2:45:31<1:29:34,  2.32s/it]                                                       {'loss': 1.5756, 'learning_rate': 0.0001077256174533483, 'epoch': 0.66}
+ 66%|██████▌   | 4461/6779 [2:45:31<1:29:34,  2.32s/it] 66%|██████▌   | 4462/6779 [2:45:33<1:26:50,  2.25s/it]                                                       {'loss': 1.6727, 'learning_rate': 0.000107642164796709, 'epoch': 0.66}
+ 66%|██████▌   | 4462/6779 [2:45:33<1:26:50,  2.25s/it] 66%|██████▌   | 4463/6779 [2:45:35<1:26:39,  2.25s/it]                                                       {'loss': 1.8055, 'learning_rate': 0.00010755873257393836, 'epoch': 0.66}
+ 66%|██████▌   | 4463/6779 [2:45:35<1:26:39,  2.25s/it] 66%|██████▌   | 4464/6779 [2:45:37<1:24:37,  2.19s/it]                                                       {'loss': 1.7275, 'learning_rate': 0.00010747532080349534, 'epoch': 0.66}
+ 66%|██████▌   | 4464/6779 [2:45:37<1:24:37,  2.19s/it] 66%|██████▌   | 4465/6779 [2:45:39<1:23:13,  2.16s/it]                                                       {'loss': 1.6795, 'learning_rate': 0.0001073919295038345, 'epoch': 0.66}
+ 66%|██████▌   | 4465/6779 [2:45:39<1:23:13,  2.16s/it] 66%|██████▌   | 4466/6779 [2:45:41<1:21:27,  2.11s/it]                                                       {'loss': 1.6005, 'learning_rate': 0.00010730855869340602, 'epoch': 0.66}
+ 66%|██████▌   | 4466/6779 [2:45:41<1:21:27,  2.11s/it] 66%|██████▌   | 4467/6779 [2:45:43<1:21:15,  2.11s/it]                                                       {'loss': 1.7689, 'learning_rate': 0.00010722520839065517, 'epoch': 0.66}
+ 66%|██████▌   | 4467/6779 [2:45:43<1:21:15,  2.11s/it] 66%|██████▌   | 4468/6779 [2:45:45<1:19:38,  2.07s/it]                                                       {'loss': 1.6126, 'learning_rate': 0.00010714187861402329, 'epoch': 0.66}
+ 66%|██████▌   | 4468/6779 [2:45:45<1:19:38,  2.07s/it] 66%|██████▌   | 4469/6779 [2:45:47<1:20:22,  2.09s/it]                                                       {'loss': 1.4976, 'learning_rate': 0.00010705856938194658, 'epoch': 0.66}
+ 66%|██████▌   | 4469/6779 [2:45:47<1:20:22,  2.09s/it] 66%|██████▌   | 4470/6779 [2:45:50<1:27:23,  2.27s/it]                                                       {'loss': 1.659, 'learning_rate': 0.00010697528071285705, 'epoch': 0.66}
+ 66%|██████▌   | 4470/6779 [2:45:50<1:27:23,  2.27s/it] 66%|██████▌   | 4471/6779 [2:45:52<1:26:56,  2.26s/it]                                                       {'loss': 1.7047, 'learning_rate': 0.00010689201262518194, 'epoch': 0.66}
+ 66%|██████▌   | 4471/6779 [2:45:52<1:26:56,  2.26s/it] 66%|██████▌   | 4472/6779 [2:45:54<1:24:58,  2.21s/it]                                                       {'loss': 1.6001, 'learning_rate': 0.00010680876513734415, 'epoch': 0.66}
+ 66%|██████▌   | 4472/6779 [2:45:54<1:24:58,  2.21s/it] 66%|██████▌   | 4473/6779 [2:45:56<1:21:42,  2.13s/it]                                                       {'loss': 1.788, 'learning_rate': 0.00010672553826776184, 'epoch': 0.66}
+ 66%|██████▌   | 4473/6779 [2:45:56<1:21:42,  2.13s/it] 66%|██████▌   | 4474/6779 [2:45:59<1:25:05,  2.21s/it]                                                       {'loss': 1.7297, 'learning_rate': 0.00010664233203484856, 'epoch': 0.66}
+ 66%|██████▌   | 4474/6779 [2:45:59<1:25:05,  2.21s/it] 66%|██████▌   | 4475/6779 [2:46:01<1:24:37,  2.20s/it]                                                       {'loss': 1.6742, 'learning_rate': 0.0001065591464570137, 'epoch': 0.66}
+ 66%|██████▌   | 4475/6779 [2:46:01<1:24:37,  2.20s/it] 66%|██████▌   | 4476/6779 [2:46:03<1:24:07,  2.19s/it]                                                       {'loss': 1.6807, 'learning_rate': 0.0001064759815526616, 'epoch': 0.66}
+ 66%|██████▌   | 4476/6779 [2:46:03<1:24:07,  2.19s/it] 66%|██████▌   | 4477/6779 [2:46:06<1:30:21,  2.36s/it]                                                       {'loss': 1.5177, 'learning_rate': 0.00010639283734019233, 'epoch': 0.66}
+ 66%|██████▌   | 4477/6779 [2:46:06<1:30:21,  2.36s/it] 66%|██████▌   | 4478/6779 [2:46:08<1:32:26,  2.41s/it]                                                       {'loss': 1.712, 'learning_rate': 0.00010630971383800115, 'epoch': 0.66}
+ 66%|██████▌   | 4478/6779 [2:46:08<1:32:26,  2.41s/it] 66%|██████▌   | 4479/6779 [2:46:11<1:31:54,  2.40s/it]                                                       {'loss': 1.6607, 'learning_rate': 0.00010622661106447901, 'epoch': 0.66}
+ 66%|██████▌   | 4479/6779 [2:46:11<1:31:54,  2.40s/it] 66%|██████▌   | 4480/6779 [2:46:13<1:30:18,  2.36s/it]                                                       {'loss': 1.588, 'learning_rate': 0.000106143529038012, 'epoch': 0.66}
+ 66%|██████▌   | 4480/6779 [2:46:13<1:30:18,  2.36s/it] 66%|██████▌   | 4481/6779 [2:46:15<1:28:23,  2.31s/it]                                                       {'loss': 1.6795, 'learning_rate': 0.00010606046777698173, 'epoch': 0.66}
+ 66%|██████▌   | 4481/6779 [2:46:15<1:28:23,  2.31s/it] 66%|██████▌   | 4482/6779 [2:46:18<1:29:19,  2.33s/it]                                                       {'loss': 1.7618, 'learning_rate': 0.00010597742729976543, 'epoch': 0.66}
+ 66%|██████▌   | 4482/6779 [2:46:18<1:29:19,  2.33s/it] 66%|██████▌   | 4483/6779 [2:46:20<1:28:17,  2.31s/it]                                                       {'loss': 1.7646, 'learning_rate': 0.00010589440762473528, 'epoch': 0.66}
+ 66%|██████▌   | 4483/6779 [2:46:20<1:28:17,  2.31s/it] 66%|██████▌   | 4484/6779 [2:46:22<1:28:33,  2.32s/it]                                                       {'loss': 1.7318, 'learning_rate': 0.00010581140877025935, 'epoch': 0.66}
+ 66%|██████▌   | 4484/6779 [2:46:22<1:28:33,  2.32s/it] 66%|██████▌   | 4485/6779 [2:46:24<1:26:55,  2.27s/it]                                                       {'loss': 1.705, 'learning_rate': 0.00010572843075470063, 'epoch': 0.66}
+ 66%|██████▌   | 4485/6779 [2:46:24<1:26:55,  2.27s/it] 66%|██████▌   | 4486/6779 [2:46:26<1:24:46,  2.22s/it]                                                       {'loss': 1.6426, 'learning_rate': 0.00010564547359641794, 'epoch': 0.66}
+ 66%|██████▌   | 4486/6779 [2:46:26<1:24:46,  2.22s/it] 66%|██████▌   | 4487/6779 [2:46:29<1:30:22,  2.37s/it]                                                       {'loss': 1.6006, 'learning_rate': 0.00010556253731376511, 'epoch': 0.66}
+ 66%|██████▌   | 4487/6779 [2:46:29<1:30:22,  2.37s/it] 66%|██████▌   | 4488/6779 [2:46:31<1:28:27,  2.32s/it]                                                       {'loss': 1.8377, 'learning_rate': 0.00010547962192509162, 'epoch': 0.66}
+ 66%|██████▌   | 4488/6779 [2:46:31<1:28:27,  2.32s/it] 66%|██████▌   | 4489/6779 [2:46:33<1:25:13,  2.23s/it]                                                       {'loss': 1.6354, 'learning_rate': 0.00010539672744874227, 'epoch': 0.66}
+ 66%|██████▌   | 4489/6779 [2:46:33<1:25:13,  2.23s/it] 66%|██████▌   | 4490/6779 [2:46:36<1:27:24,  2.29s/it]                                                       {'loss': 1.6257, 'learning_rate': 0.00010531385390305705, 'epoch': 0.66}
+ 66%|██████▌   | 4490/6779 [2:46:36<1:27:24,  2.29s/it] 66%|██████▌   | 4491/6779 [2:46:38<1:24:22,  2.21s/it]                                                       {'loss': 1.6688, 'learning_rate': 0.00010523100130637162, 'epoch': 0.66}
+ 66%|██████▌   | 4491/6779 [2:46:38<1:24:22,  2.21s/it] 66%|██████▋   | 4492/6779 [2:46:40<1:22:40,  2.17s/it]                                                       {'loss': 1.6757, 'learning_rate': 0.00010514816967701673, 'epoch': 0.66}
+ 66%|██████▋   | 4492/6779 [2:46:40<1:22:40,  2.17s/it] 66%|██████▋   | 4493/6779 [2:46:42<1:21:43,  2.14s/it]                                                       {'loss': 1.6974, 'learning_rate': 0.00010506535903331867, 'epoch': 0.66}
+ 66%|██████▋   | 4493/6779 [2:46:42<1:21:43,  2.14s/it] 66%|██████▋   | 4494/6779 [2:46:44<1:21:28,  2.14s/it]                                                       {'loss': 1.5584, 'learning_rate': 0.00010498256939359894, 'epoch': 0.66}
+ 66%|██████▋   | 4494/6779 [2:46:44<1:21:28,  2.14s/it] 66%|██████▋   | 4495/6779 [2:46:46<1:20:31,  2.12s/it]                                                       {'loss': 1.627, 'learning_rate': 0.00010489980077617452, 'epoch': 0.66}
+ 66%|██████▋   | 4495/6779 [2:46:46<1:20:31,  2.12s/it] 66%|██████▋   | 4496/6779 [2:46:49<1:24:08,  2.21s/it]                                                       {'loss': 1.5523, 'learning_rate': 0.0001048170531993578, 'epoch': 0.66}
+ 66%|██████▋   | 4496/6779 [2:46:49<1:24:08,  2.21s/it] 66%|██████▋   | 4497/6779 [2:46:51<1:22:47,  2.18s/it]                                                       {'loss': 1.7442, 'learning_rate': 0.00010473432668145622, 'epoch': 0.66}
+ 66%|██████▋   | 4497/6779 [2:46:51<1:22:47,  2.18s/it] 66%|██████▋   | 4498/6779 [2:46:53<1:22:03,  2.16s/it]                                                       {'loss': 1.7411, 'learning_rate': 0.00010465162124077297, 'epoch': 0.66}
+ 66%|██████▋   | 4498/6779 [2:46:53<1:22:03,  2.16s/it] 66%|██████▋   | 4499/6779 [2:46:55<1:21:52,  2.15s/it]                                                       {'loss': 1.6526, 'learning_rate': 0.00010456893689560612, 'epoch': 0.66}
+ 66%|██████▋   | 4499/6779 [2:46:55<1:21:52,  2.15s/it] 66%|██████▋   | 4500/6779 [2:46:57<1:21:44,  2.15s/it]                                                       {'loss': 1.5144, 'learning_rate': 0.00010448627366424952, 'epoch': 0.66}
+ 66%|██████▋   | 4500/6779 [2:46:57<1:21:44,  2.15s/it] 66%|██████▋   | 4501/6779 [2:47:00<1:24:35,  2.23s/it]                                                       {'loss': 1.5913, 'learning_rate': 0.00010440363156499198, 'epoch': 0.66}
+ 66%|██████▋   | 4501/6779 [2:47:00<1:24:35,  2.23s/it] 66%|██████▋   | 4502/6779 [2:47:02<1:22:39,  2.18s/it]                                                       {'loss': 1.6608, 'learning_rate': 0.00010432101061611785, 'epoch': 0.66}
+ 66%|██████▋   | 4502/6779 [2:47:02<1:22:39,  2.18s/it] 66%|██████▋   | 4503/6779 [2:47:04<1:21:56,  2.16s/it]                                                       {'loss': 1.642, 'learning_rate': 0.00010423841083590684, 'epoch': 0.66}
+ 66%|██████▋   | 4503/6779 [2:47:04<1:21:56,  2.16s/it] 66%|██████▋   | 4504/6779 [2:47:06<1:21:43,  2.16s/it]                                                       {'loss': 1.6624, 'learning_rate': 0.00010415583224263372, 'epoch': 0.66}
+ 66%|██████▋   | 4504/6779 [2:47:06<1:21:43,  2.16s/it] 66%|██████▋   | 4505/6779 [2:47:08<1:22:53,  2.19s/it]                                                       {'loss': 1.703, 'learning_rate': 0.00010407327485456888, 'epoch': 0.66}
+ 66%|██████▋   | 4505/6779 [2:47:08<1:22:53,  2.19s/it] 66%|██████▋   | 4506/6779 [2:47:10<1:21:46,  2.16s/it]                                                       {'loss': 1.7472, 'learning_rate': 0.00010399073868997776, 'epoch': 0.66}
+ 66%|██████▋   | 4506/6779 [2:47:10<1:21:46,  2.16s/it] 66%|██████▋   | 4507/6779 [2:47:13<1:23:32,  2.21s/it]                                                       {'loss': 1.68, 'learning_rate': 0.00010390822376712128, 'epoch': 0.66}
+ 66%|██████▋   | 4507/6779 [2:47:13<1:23:32,  2.21s/it] 66%|██████▋   | 4508/6779 [2:47:15<1:24:14,  2.23s/it]                                                       {'loss': 1.7673, 'learning_rate': 0.00010382573010425554, 'epoch': 0.66}
+ 66%|██████▋   | 4508/6779 [2:47:15<1:24:14,  2.23s/it] 67%|██████▋   | 4509/6779 [2:47:17<1:23:35,  2.21s/it]                                                       {'loss': 1.6064, 'learning_rate': 0.000103743257719632, 'epoch': 0.67}
+ 67%|██████▋   | 4509/6779 [2:47:17<1:23:35,  2.21s/it] 67%|██████▋   | 4510/6779 [2:47:19<1:26:12,  2.28s/it]                                                       {'loss': 1.6831, 'learning_rate': 0.00010366080663149751, 'epoch': 0.67}
+ 67%|██████▋   | 4510/6779 [2:47:19<1:26:12,  2.28s/it] 67%|██████▋   | 4511/6779 [2:47:22<1:26:33,  2.29s/it]                                                       {'loss': 1.5525, 'learning_rate': 0.00010357837685809397, 'epoch': 0.67}
+ 67%|██████▋   | 4511/6779 [2:47:22<1:26:33,  2.29s/it] 67%|██████▋   | 4512/6779 [2:47:24<1:24:19,  2.23s/it]                                                       {'loss': 1.6599, 'learning_rate': 0.00010349596841765883, 'epoch': 0.67}
+ 67%|██████▋   | 4512/6779 [2:47:24<1:24:19,  2.23s/it] 67%|██████▋   | 4513/6779 [2:47:26<1:23:37,  2.21s/it]                                                       {'loss': 1.7227, 'learning_rate': 0.00010341358132842453, 'epoch': 0.67}
+ 67%|██████▋   | 4513/6779 [2:47:26<1:23:37,  2.21s/it] 67%|██████▋   | 4514/6779 [2:47:28<1:25:44,  2.27s/it]                                                       {'loss': 1.5782, 'learning_rate': 0.00010333121560861907, 'epoch': 0.67}
+ 67%|██████▋   | 4514/6779 [2:47:28<1:25:44,  2.27s/it] 67%|██████▋   | 4515/6779 [2:47:31<1:24:02,  2.23s/it]                                                       {'loss': 1.7197, 'learning_rate': 0.00010324887127646552, 'epoch': 0.67}
+ 67%|██████▋   | 4515/6779 [2:47:31<1:24:02,  2.23s/it] 67%|██████▋   | 4516/6779 [2:47:33<1:27:29,  2.32s/it]                                                       {'loss': 1.6851, 'learning_rate': 0.00010316654835018229, 'epoch': 0.67}
+ 67%|██████▋   | 4516/6779 [2:47:33<1:27:29,  2.32s/it] 67%|██████▋   | 4517/6779 [2:47:35<1:27:37,  2.32s/it]                                                       {'loss': 1.6965, 'learning_rate': 0.0001030842468479832, 'epoch': 0.67}
+ 67%|██████▋   | 4517/6779 [2:47:35<1:27:37,  2.32s/it] 67%|██████▋   | 4518/6779 [2:47:38<1:26:28,  2.29s/it]                                                       {'loss': 1.852, 'learning_rate': 0.00010300196678807696, 'epoch': 0.67}
+ 67%|██████▋   | 4518/6779 [2:47:38<1:26:28,  2.29s/it] 67%|██████▋   | 4519/6779 [2:47:40<1:26:32,  2.30s/it]                                                       {'loss': 1.6845, 'learning_rate': 0.00010291970818866801, 'epoch': 0.67}
+ 67%|██████▋   | 4519/6779 [2:47:40<1:26:32,  2.30s/it] 67%|██████▋   | 4520/6779 [2:47:42<1:28:03,  2.34s/it]                                                       {'loss': 1.6036, 'learning_rate': 0.00010283747106795556, 'epoch': 0.67}
+ 67%|██████▋   | 4520/6779 [2:47:42<1:28:03,  2.34s/it] 67%|██████▋   | 4521/6779 [2:47:44<1:25:19,  2.27s/it]                                                       {'loss': 1.6056, 'learning_rate': 0.00010275525544413449, 'epoch': 0.67}
+ 67%|██████▋   | 4521/6779 [2:47:44<1:25:19,  2.27s/it] 67%|██████▋   | 4522/6779 [2:47:47<1:25:57,  2.29s/it]                                                       {'loss': 1.5741, 'learning_rate': 0.00010267306133539458, 'epoch': 0.67}
+ 67%|██████▋   | 4522/6779 [2:47:47<1:25:57,  2.29s/it] 67%|██████▋   | 4523/6779 [2:47:49<1:25:42,  2.28s/it]                                                       {'loss': 1.5978, 'learning_rate': 0.00010259088875992109, 'epoch': 0.67}
+ 67%|██████▋   | 4523/6779 [2:47:49<1:25:42,  2.28s/it] 67%|██████▋   | 4524/6779 [2:47:51<1:23:37,  2.23s/it]                                                       {'loss': 1.7078, 'learning_rate': 0.00010250873773589444, 'epoch': 0.67}
+ 67%|██████▋   | 4524/6779 [2:47:51<1:23:37,  2.23s/it] 67%|██████▋   | 4525/6779 [2:47:53<1:24:32,  2.25s/it]                                                       {'loss': 1.7436, 'learning_rate': 0.00010242660828149033, 'epoch': 0.67}
+ 67%|██████▋   | 4525/6779 [2:47:53<1:24:32,  2.25s/it] 67%|██████▋   | 4526/6779 [2:47:55<1:21:36,  2.17s/it]                                                       {'loss': 1.4804, 'learning_rate': 0.0001023445004148796, 'epoch': 0.67}
+ 67%|██████▋   | 4526/6779 [2:47:55<1:21:36,  2.17s/it] 67%|██████▋   | 4527/6779 [2:47:58<1:23:01,  2.21s/it]                                                       {'loss': 1.5109, 'learning_rate': 0.0001022624141542282, 'epoch': 0.67}
+ 67%|██████▋   | 4527/6779 [2:47:58<1:23:01,  2.21s/it] 67%|██████▋   | 4528/6779 [2:48:00<1:23:59,  2.24s/it]                                                       {'loss': 1.761, 'learning_rate': 0.00010218034951769766, 'epoch': 0.67}
+ 67%|██████▋   | 4528/6779 [2:48:00<1:23:59,  2.24s/it] 67%|██████▋   | 4529/6779 [2:48:02<1:21:11,  2.17s/it]                                                       {'loss': 1.7827, 'learning_rate': 0.00010209830652344435, 'epoch': 0.67}
+ 67%|██████▋   | 4529/6779 [2:48:02<1:21:11,  2.17s/it] 67%|██████▋   | 4530/6779 [2:48:05<1:25:14,  2.27s/it]                                                       {'loss': 1.657, 'learning_rate': 0.00010201628518962003, 'epoch': 0.67}
+ 67%|██████▋   | 4530/6779 [2:48:05<1:25:14,  2.27s/it] 67%|██████▋   | 4531/6779 [2:48:07<1:22:46,  2.21s/it]                                                       {'loss': 1.5641, 'learning_rate': 0.00010193428553437172, 'epoch': 0.67}
+ 67%|██████▋   | 4531/6779 [2:48:07<1:22:46,  2.21s/it] 67%|██████▋   | 4532/6779 [2:48:09<1:25:47,  2.29s/it]                                                       {'loss': 1.5376, 'learning_rate': 0.00010185230757584165, 'epoch': 0.67}
+ 67%|██████▋   | 4532/6779 [2:48:09<1:25:47,  2.29s/it] 67%|██████▋   | 4533/6779 [2:48:12<1:29:02,  2.38s/it]                                                       {'loss': 1.7988, 'learning_rate': 0.000101770351332167, 'epoch': 0.67}
+ 67%|██████▋   | 4533/6779 [2:48:12<1:29:02,  2.38s/it] 67%|██████▋   | 4534/6779 [2:48:14<1:28:26,  2.36s/it]                                                       {'loss': 1.8528, 'learning_rate': 0.00010168841682148045, 'epoch': 0.67}
+ 67%|██████▋   | 4534/6779 [2:48:14<1:28:26,  2.36s/it] 67%|██████▋   | 4535/6779 [2:48:16<1:28:46,  2.37s/it]                                                       {'loss': 1.5964, 'learning_rate': 0.0001016065040619097, 'epoch': 0.67}
+ 67%|██████▋   | 4535/6779 [2:48:16<1:28:46,  2.37s/it] 67%|██████▋   | 4536/6779 [2:48:19<1:31:12,  2.44s/it]                                                       {'loss': 1.6253, 'learning_rate': 0.0001015246130715776, 'epoch': 0.67}
+ 67%|██████▋   | 4536/6779 [2:48:19<1:31:12,  2.44s/it] 67%|██████▋   | 4537/6779 [2:48:21<1:27:05,  2.33s/it]                                                       {'loss': 1.6203, 'learning_rate': 0.00010144274386860236, 'epoch': 0.67}
+ 67%|██████▋   | 4537/6779 [2:48:21<1:27:05,  2.33s/it] 67%|██████▋   | 4538/6779 [2:48:23<1:26:18,  2.31s/it]                                                       {'loss': 1.5488, 'learning_rate': 0.00010136089647109722, 'epoch': 0.67}
+ 67%|██████▋   | 4538/6779 [2:48:23<1:26:18,  2.31s/it] 67%|██████▋   | 4539/6779 [2:48:25<1:22:36,  2.21s/it]                                                       {'loss': 1.6833, 'learning_rate': 0.00010127907089717075, 'epoch': 0.67}
+ 67%|██████▋   | 4539/6779 [2:48:25<1:22:36,  2.21s/it] 67%|██████▋   | 4540/6779 [2:48:28<1:29:28,  2.40s/it]                                                       {'loss': 1.4571, 'learning_rate': 0.00010119726716492644, 'epoch': 0.67}
+ 67%|██████▋   | 4540/6779 [2:48:28<1:29:28,  2.40s/it] 67%|██████▋   | 4541/6779 [2:48:31<1:29:25,  2.40s/it]                                                       {'loss': 1.6406, 'learning_rate': 0.00010111548529246323, 'epoch': 0.67}
+ 67%|██████▋   | 4541/6779 [2:48:31<1:29:25,  2.40s/it] 67%|██████▋   | 4542/6779 [2:48:33<1:28:15,  2.37s/it]                                                       {'loss': 1.7868, 'learning_rate': 0.00010103372529787498, 'epoch': 0.67}
+ 67%|██████▋   | 4542/6779 [2:48:33<1:28:15,  2.37s/it] 67%|██████▋   | 4543/6779 [2:48:35<1:25:47,  2.30s/it]                                                       {'loss': 1.6533, 'learning_rate': 0.00010095198719925099, 'epoch': 0.67}
+ 67%|██████▋   | 4543/6779 [2:48:35<1:25:47,  2.30s/it] 67%|██████▋   | 4544/6779 [2:48:37<1:23:31,  2.24s/it]                                                       {'loss': 1.7638, 'learning_rate': 0.00010087027101467538, 'epoch': 0.67}
+ 67%|██████▋   | 4544/6779 [2:48:37<1:23:31,  2.24s/it] 67%|██████▋   | 4545/6779 [2:48:40<1:25:44,  2.30s/it]                                                       {'loss': 1.7476, 'learning_rate': 0.00010078857676222751, 'epoch': 0.67}
+ 67%|██████▋   | 4545/6779 [2:48:40<1:25:44,  2.30s/it] 67%|██████▋   | 4546/6779 [2:48:42<1:24:05,  2.26s/it]                                                       {'loss': 1.7864, 'learning_rate': 0.00010070690445998226, 'epoch': 0.67}
+ 67%|██████▋   | 4546/6779 [2:48:42<1:24:05,  2.26s/it] 67%|██████▋   | 4547/6779 [2:48:44<1:23:27,  2.24s/it]                                                       {'loss': 1.8074, 'learning_rate': 0.00010062525412600909, 'epoch': 0.67}
+ 67%|██████▋   | 4547/6779 [2:48:44<1:23:27,  2.24s/it] 67%|██████▋   | 4548/6779 [2:48:46<1:22:12,  2.21s/it]                                                       {'loss': 1.5664, 'learning_rate': 0.00010054362577837308, 'epoch': 0.67}
+ 67%|██████▋   | 4548/6779 [2:48:46<1:22:12,  2.21s/it] 67%|██████▋   | 4549/6779 [2:48:49<1:26:10,  2.32s/it]                                                       {'loss': 1.649, 'learning_rate': 0.00010046201943513405, 'epoch': 0.67}
+ 67%|██████▋   | 4549/6779 [2:48:49<1:26:10,  2.32s/it] 67%|██████▋   | 4550/6779 [2:48:51<1:23:36,  2.25s/it]                                                       {'loss': 1.5112, 'learning_rate': 0.00010038043511434727, 'epoch': 0.67}
+ 67%|██████▋   | 4550/6779 [2:48:51<1:23:36,  2.25s/it] 67%|██████▋   | 4551/6779 [2:48:53<1:23:27,  2.25s/it]                                                       {'loss': 1.674, 'learning_rate': 0.0001002988728340629, 'epoch': 0.67}
+ 67%|██████▋   | 4551/6779 [2:48:53<1:23:27,  2.25s/it] 67%|██████▋   | 4552/6779 [2:48:55<1:23:21,  2.25s/it]                                                       {'loss': 1.5735, 'learning_rate': 0.00010021733261232636, 'epoch': 0.67}
+ 67%|██████▋   | 4552/6779 [2:48:55<1:23:21,  2.25s/it] 67%|██████▋   | 4553/6779 [2:48:58<1:24:38,  2.28s/it]                                                       {'loss': 1.7092, 'learning_rate': 0.00010013581446717827, 'epoch': 0.67}
+ 67%|██████▋   | 4553/6779 [2:48:58<1:24:38,  2.28s/it] 67%|██████▋   | 4554/6779 [2:49:00<1:22:08,  2.21s/it]                                                       {'loss': 1.709, 'learning_rate': 0.00010005431841665407, 'epoch': 0.67}
+ 67%|██████▋   | 4554/6779 [2:49:00<1:22:08,  2.21s/it] 67%|██████▋   | 4555/6779 [2:49:02<1:20:20,  2.17s/it]                                                       {'loss': 1.692, 'learning_rate': 9.997284447878465e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4555/6779 [2:49:02<1:20:20,  2.17s/it] 67%|██████▋   | 4556/6779 [2:49:04<1:19:05,  2.13s/it]                                                       {'loss': 1.5629, 'learning_rate': 9.989139267159573e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4556/6779 [2:49:04<1:19:05,  2.13s/it] 67%|██████▋   | 4557/6779 [2:49:06<1:20:17,  2.17s/it]                                                       {'loss': 1.7266, 'learning_rate': 9.980996301310836e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4557/6779 [2:49:06<1:20:17,  2.17s/it] 67%|██████▋   | 4558/6779 [2:49:08<1:23:28,  2.26s/it]                                                       {'loss': 1.544, 'learning_rate': 9.972855552133846e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4558/6779 [2:49:08<1:23:28,  2.26s/it] 67%|██████▋   | 4559/6779 [2:49:11<1:23:26,  2.26s/it]                                                       {'loss': 1.6823, 'learning_rate': 9.964717021429726e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4559/6779 [2:49:11<1:23:26,  2.26s/it] 67%|██████▋   | 4560/6779 [2:49:13<1:22:18,  2.23s/it]                                                       {'loss': 1.6369, 'learning_rate': 9.956580710999104e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4560/6779 [2:49:13<1:22:18,  2.23s/it] 67%|██████▋   | 4561/6779 [2:49:15<1:23:03,  2.25s/it]                                                       {'loss': 1.6612, 'learning_rate': 9.948446622642101e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4561/6779 [2:49:15<1:23:03,  2.25s/it] 67%|██████▋   | 4562/6779 [2:49:17<1:21:31,  2.21s/it]                                                       {'loss': 1.6415, 'learning_rate': 9.940314758158367e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4562/6779 [2:49:17<1:21:31,  2.21s/it] 67%|██████▋   | 4563/6779 [2:49:19<1:19:08,  2.14s/it]                                                       {'loss': 1.692, 'learning_rate': 9.932185119347037e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4563/6779 [2:49:19<1:19:08,  2.14s/it] 67%|██████▋   | 4564/6779 [2:49:21<1:19:23,  2.15s/it]                                                       {'loss': 1.8535, 'learning_rate': 9.924057708006786e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4564/6779 [2:49:21<1:19:23,  2.15s/it] 67%|██████▋   | 4565/6779 [2:49:24<1:19:02,  2.14s/it]                                                       {'loss': 1.8264, 'learning_rate': 9.915932525935758e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4565/6779 [2:49:24<1:19:02,  2.14s/it] 67%|██████▋   | 4566/6779 [2:49:26<1:18:23,  2.13s/it]                                                       {'loss': 1.7406, 'learning_rate': 9.90780957493163e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4566/6779 [2:49:26<1:18:23,  2.13s/it] 67%|██████▋   | 4567/6779 [2:49:28<1:20:12,  2.18s/it]                                                       {'loss': 1.6612, 'learning_rate': 9.899688856791589e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4567/6779 [2:49:28<1:20:12,  2.18s/it] 67%|██████▋   | 4568/6779 [2:49:30<1:20:01,  2.17s/it]                                                       {'loss': 1.6475, 'learning_rate': 9.891570373312302e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4568/6779 [2:49:30<1:20:01,  2.17s/it] 67%|██████▋   | 4569/6779 [2:49:32<1:21:33,  2.21s/it]                                                       {'loss': 1.5344, 'learning_rate': 9.883454126289968e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4569/6779 [2:49:32<1:21:33,  2.21s/it] 67%|██████▋   | 4570/6779 [2:49:35<1:22:50,  2.25s/it]                                                       {'loss': 1.8248, 'learning_rate': 9.875340117520269e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4570/6779 [2:49:35<1:22:50,  2.25s/it] 67%|██████▋   | 4571/6779 [2:49:37<1:21:05,  2.20s/it]                                                       {'loss': 1.564, 'learning_rate': 9.867228348798417e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4571/6779 [2:49:37<1:21:05,  2.20s/it] 67%|██████▋   | 4572/6779 [2:49:39<1:20:32,  2.19s/it]                                                       {'loss': 1.6471, 'learning_rate': 9.859118821919098e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4572/6779 [2:49:39<1:20:32,  2.19s/it] 67%|██████▋   | 4573/6779 [2:49:41<1:21:32,  2.22s/it]                                                       {'loss': 1.7473, 'learning_rate': 9.851011538676526e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4573/6779 [2:49:41<1:21:32,  2.22s/it] 67%|██████▋   | 4574/6779 [2:49:43<1:21:11,  2.21s/it]                                                       {'loss': 1.7324, 'learning_rate': 9.842906500864422e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4574/6779 [2:49:43<1:21:11,  2.21s/it] 67%|██████▋   | 4575/6779 [2:49:46<1:19:18,  2.16s/it]                                                       {'loss': 1.7621, 'learning_rate': 9.834803710275978e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4575/6779 [2:49:46<1:19:18,  2.16s/it] 68%|██████▊   | 4576/6779 [2:49:48<1:19:26,  2.16s/it]                                                       {'loss': 1.6712, 'learning_rate': 9.826703168703928e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4576/6779 [2:49:48<1:19:26,  2.16s/it] 68%|██████▊   | 4577/6779 [2:49:50<1:23:36,  2.28s/it]                                                       {'loss': 1.5615, 'learning_rate': 9.818604877940476e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4577/6779 [2:49:50<1:23:36,  2.28s/it] 68%|██████▊   | 4578/6779 [2:49:53<1:30:59,  2.48s/it]                                                       {'loss': 1.6814, 'learning_rate': 9.810508839777357e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4578/6779 [2:49:53<1:30:59,  2.48s/it] 68%|██████▊   | 4579/6779 [2:49:55<1:27:57,  2.40s/it]                                                       {'loss': 1.7842, 'learning_rate': 9.802415056005776e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4579/6779 [2:49:55<1:27:57,  2.40s/it] 68%|██████▊   | 4580/6779 [2:49:58<1:25:06,  2.32s/it]                                                       {'loss': 1.638, 'learning_rate': 9.794323528416465e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4580/6779 [2:49:58<1:25:06,  2.32s/it] 68%|██████▊   | 4581/6779 [2:50:00<1:23:26,  2.28s/it]                                                       {'loss': 1.465, 'learning_rate': 9.786234258799657e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4581/6779 [2:50:00<1:23:26,  2.28s/it] 68%|██████▊   | 4582/6779 [2:50:02<1:21:31,  2.23s/it]                                                       {'loss': 1.8147, 'learning_rate': 9.77814724894506e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4582/6779 [2:50:02<1:21:31,  2.23s/it] 68%|██████▊   | 4583/6779 [2:50:04<1:19:39,  2.18s/it]                                                       {'loss': 1.6759, 'learning_rate': 9.770062500641913e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4583/6779 [2:50:04<1:19:39,  2.18s/it] 68%|██████▊   | 4584/6779 [2:50:06<1:18:37,  2.15s/it]                                                       {'loss': 1.6459, 'learning_rate': 9.761980015678924e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4584/6779 [2:50:06<1:18:37,  2.15s/it] 68%|██████▊   | 4585/6779 [2:50:08<1:20:26,  2.20s/it]                                                       {'loss': 1.6792, 'learning_rate': 9.753899795844333e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4585/6779 [2:50:08<1:20:26,  2.20s/it] 68%|██████▊   | 4586/6779 [2:50:10<1:20:31,  2.20s/it]                                                       {'loss': 1.602, 'learning_rate': 9.745821842925849e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4586/6779 [2:50:10<1:20:31,  2.20s/it] 68%|██████▊   | 4587/6779 [2:50:13<1:18:58,  2.16s/it]                                                       {'loss': 1.6899, 'learning_rate': 9.737746158710697e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4587/6779 [2:50:13<1:18:58,  2.16s/it] 68%|██████▊   | 4588/6779 [2:50:15<1:20:26,  2.20s/it]                                                       {'loss': 1.7539, 'learning_rate': 9.729672744985603e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4588/6779 [2:50:15<1:20:26,  2.20s/it] 68%|██████▊   | 4589/6779 [2:50:17<1:19:19,  2.17s/it]                                                       {'loss': 1.7753, 'learning_rate': 9.72160160353677e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4589/6779 [2:50:17<1:19:19,  2.17s/it] 68%|██████▊   | 4590/6779 [2:50:19<1:18:24,  2.15s/it]                                                       {'loss': 1.4995, 'learning_rate': 9.713532736149929e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4590/6779 [2:50:19<1:18:24,  2.15s/it] 68%|██████▊   | 4591/6779 [2:50:21<1:19:54,  2.19s/it]                                                       {'loss': 1.7893, 'learning_rate': 9.705466144610269e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4591/6779 [2:50:21<1:19:54,  2.19s/it] 68%|██████▊   | 4592/6779 [2:50:24<1:20:38,  2.21s/it]                                                       {'loss': 1.7913, 'learning_rate': 9.697401830702518e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4592/6779 [2:50:24<1:20:38,  2.21s/it] 68%|██████▊   | 4593/6779 [2:50:26<1:21:19,  2.23s/it]                                                       {'loss': 1.836, 'learning_rate': 9.689339796210862e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4593/6779 [2:50:26<1:21:19,  2.23s/it] 68%|██████▊   | 4594/6779 [2:50:28<1:22:00,  2.25s/it]                                                       {'loss': 1.8311, 'learning_rate': 9.681280042919006e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4594/6779 [2:50:28<1:22:00,  2.25s/it] 68%|██████▊   | 4595/6779 [2:50:30<1:20:19,  2.21s/it]                                                       {'loss': 1.7764, 'learning_rate': 9.673222572610143e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4595/6779 [2:50:30<1:20:19,  2.21s/it] 68%|██████▊   | 4596/6779 [2:50:32<1:19:52,  2.20s/it]                                                       {'loss': 1.5783, 'learning_rate': 9.665167387066973e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4596/6779 [2:50:32<1:19:52,  2.20s/it] 68%|██████▊   | 4597/6779 [2:50:35<1:20:15,  2.21s/it]                                                       {'loss': 1.5876, 'learning_rate': 9.657114488071672e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4597/6779 [2:50:35<1:20:15,  2.21s/it] 68%|██████▊   | 4598/6779 [2:50:37<1:18:56,  2.17s/it]                                                       {'loss': 1.7558, 'learning_rate': 9.649063877405906e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4598/6779 [2:50:37<1:18:56,  2.17s/it] 68%|██████▊   | 4599/6779 [2:50:39<1:23:18,  2.29s/it]                                                       {'loss': 1.5828, 'learning_rate': 9.641015556850866e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4599/6779 [2:50:39<1:23:18,  2.29s/it] 68%|██████▊   | 4600/6779 [2:50:42<1:21:59,  2.26s/it]                                                       {'loss': 1.6238, 'learning_rate': 9.632969528187197e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4600/6779 [2:50:42<1:21:59,  2.26s/it] 68%|██████▊   | 4601/6779 [2:50:44<1:23:17,  2.29s/it]                                                       {'loss': 1.7721, 'learning_rate': 9.624925793195065e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4601/6779 [2:50:44<1:23:17,  2.29s/it] 68%|██████▊   | 4602/6779 [2:50:46<1:21:25,  2.24s/it]                                                       {'loss': 1.5871, 'learning_rate': 9.616884353654123e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4602/6779 [2:50:46<1:21:25,  2.24s/it] 68%|██████▊   | 4603/6779 [2:50:48<1:19:40,  2.20s/it]                                                       {'loss': 1.6516, 'learning_rate': 9.60884521134352e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4603/6779 [2:50:48<1:19:40,  2.20s/it] 68%|██████▊   | 4604/6779 [2:50:50<1:20:30,  2.22s/it]                                                       {'loss': 1.552, 'learning_rate': 9.600808368041872e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4604/6779 [2:50:50<1:20:30,  2.22s/it] 68%|██████▊   | 4605/6779 [2:50:53<1:19:20,  2.19s/it]                                                       {'loss': 1.4244, 'learning_rate': 9.592773825527322e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4605/6779 [2:50:53<1:19:20,  2.19s/it] 68%|██████▊   | 4606/6779 [2:50:55<1:19:13,  2.19s/it]                                                       {'loss': 1.8131, 'learning_rate': 9.584741585577478e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4606/6779 [2:50:55<1:19:13,  2.19s/it] 68%|██████▊   | 4607/6779 [2:50:57<1:18:59,  2.18s/it]                                                       {'loss': 1.5201, 'learning_rate': 9.576711649969437e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4607/6779 [2:50:57<1:18:59,  2.18s/it] 68%|██████▊   | 4608/6779 [2:50:59<1:18:50,  2.18s/it]                                                       {'loss': 1.6394, 'learning_rate': 9.568684020479806e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4608/6779 [2:50:59<1:18:50,  2.18s/it] 68%|██████▊   | 4609/6779 [2:51:01<1:17:28,  2.14s/it]                                                       {'loss': 1.5614, 'learning_rate': 9.560658698884671e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4609/6779 [2:51:01<1:17:28,  2.14s/it] 68%|██████▊   | 4610/6779 [2:51:03<1:20:13,  2.22s/it]                                                       {'loss': 1.713, 'learning_rate': 9.552635686959616e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4610/6779 [2:51:03<1:20:13,  2.22s/it] 68%|██████▊   | 4611/6779 [2:51:06<1:19:27,  2.20s/it]                                                       {'loss': 1.6388, 'learning_rate': 9.544614986479692e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4611/6779 [2:51:06<1:19:27,  2.20s/it] 68%|██████▊   | 4612/6779 [2:51:08<1:18:43,  2.18s/it]                                                       {'loss': 1.6394, 'learning_rate': 9.536596599219465e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4612/6779 [2:51:08<1:18:43,  2.18s/it] 68%|██████▊   | 4613/6779 [2:51:10<1:18:13,  2.17s/it]                                                       {'loss': 1.6607, 'learning_rate': 9.528580526952964e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4613/6779 [2:51:10<1:18:13,  2.17s/it] 68%|██████▊   | 4614/6779 [2:51:13<1:22:51,  2.30s/it]                                                       {'loss': 1.8648, 'learning_rate': 9.520566771453734e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4614/6779 [2:51:13<1:22:51,  2.30s/it] 68%|██████▊   | 4615/6779 [2:51:15<1:23:24,  2.31s/it]                                                       {'loss': 1.5349, 'learning_rate': 9.512555334494777e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4615/6779 [2:51:15<1:23:24,  2.31s/it] 68%|██████▊   | 4616/6779 [2:51:17<1:21:07,  2.25s/it]                                                       {'loss': 1.8281, 'learning_rate': 9.504546217848602e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4616/6779 [2:51:17<1:21:07,  2.25s/it] 68%|██████▊   | 4617/6779 [2:51:19<1:19:30,  2.21s/it]                                                       {'loss': 1.4792, 'learning_rate': 9.496539423287212e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4617/6779 [2:51:19<1:19:30,  2.21s/it] 68%|██████▊   | 4618/6779 [2:51:21<1:19:00,  2.19s/it]                                                       {'loss': 1.4949, 'learning_rate': 9.488534952582064e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4618/6779 [2:51:21<1:19:00,  2.19s/it] 68%|██████▊   | 4619/6779 [2:51:23<1:19:12,  2.20s/it]                                                       {'loss': 1.6189, 'learning_rate': 9.480532807504139e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4619/6779 [2:51:23<1:19:12,  2.20s/it] 68%|██████▊   | 4620/6779 [2:51:26<1:18:59,  2.20s/it]                                                       {'loss': 1.6139, 'learning_rate': 9.47253298982387e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4620/6779 [2:51:26<1:18:59,  2.20s/it] 68%|██████▊   | 4621/6779 [2:51:28<1:17:29,  2.15s/it]                                                       {'loss': 1.6117, 'learning_rate': 9.464535501311207e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4621/6779 [2:51:28<1:17:29,  2.15s/it] 68%|██████▊   | 4622/6779 [2:51:30<1:18:45,  2.19s/it]                                                       {'loss': 1.5691, 'learning_rate': 9.456540343735549e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4622/6779 [2:51:30<1:18:45,  2.19s/it] 68%|██████▊   | 4623/6779 [2:51:32<1:18:30,  2.18s/it]                                                       {'loss': 1.6716, 'learning_rate': 9.448547518865809e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4623/6779 [2:51:32<1:18:30,  2.18s/it] 68%|██████▊   | 4624/6779 [2:51:34<1:19:56,  2.23s/it]                                                       {'loss': 1.4991, 'learning_rate': 9.440557028470381e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4624/6779 [2:51:34<1:19:56,  2.23s/it] 68%|██████▊   | 4625/6779 [2:51:37<1:19:12,  2.21s/it]                                                       {'loss': 1.6287, 'learning_rate': 9.432568874317118e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4625/6779 [2:51:37<1:19:12,  2.21s/it] 68%|██████▊   | 4626/6779 [2:51:39<1:16:27,  2.13s/it]                                                       {'loss': 1.7102, 'learning_rate': 9.424583058173389e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4626/6779 [2:51:39<1:16:27,  2.13s/it] 68%|██████▊   | 4627/6779 [2:51:41<1:17:52,  2.17s/it]                                                       {'loss': 1.6533, 'learning_rate': 9.416599581806016e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4627/6779 [2:51:41<1:17:52,  2.17s/it] 68%|██████▊   | 4628/6779 [2:51:43<1:18:44,  2.20s/it]                                                       {'loss': 1.6851, 'learning_rate': 9.408618446981328e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4628/6779 [2:51:43<1:18:44,  2.20s/it] 68%|██████▊   | 4629/6779 [2:51:45<1:16:51,  2.14s/it]                                                       {'loss': 1.5565, 'learning_rate': 9.400639655465116e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4629/6779 [2:51:45<1:16:51,  2.14s/it] 68%|██████▊   | 4630/6779 [2:51:47<1:16:53,  2.15s/it]                                                       {'loss': 1.6132, 'learning_rate': 9.392663209022663e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4630/6779 [2:51:47<1:16:53,  2.15s/it] 68%|██████▊   | 4631/6779 [2:51:49<1:16:17,  2.13s/it]                                                       {'loss': 1.7677, 'learning_rate': 9.384689109418741e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4631/6779 [2:51:49<1:16:17,  2.13s/it] 68%|██████▊   | 4632/6779 [2:51:52<1:22:30,  2.31s/it]                                                       {'loss': 1.5127, 'learning_rate': 9.376717358417581e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4632/6779 [2:51:52<1:22:30,  2.31s/it] 68%|██████▊   | 4633/6779 [2:51:54<1:21:44,  2.29s/it]                                                       {'loss': 1.7823, 'learning_rate': 9.368747957782919e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4633/6779 [2:51:54<1:21:44,  2.29s/it] 68%|██████▊   | 4634/6779 [2:51:57<1:21:31,  2.28s/it]                                                       {'loss': 1.6117, 'learning_rate': 9.360780909277947e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4634/6779 [2:51:57<1:21:31,  2.28s/it] 68%|██████▊   | 4635/6779 [2:51:59<1:18:41,  2.20s/it]                                                       {'loss': 1.5493, 'learning_rate': 9.352816214665357e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4635/6779 [2:51:59<1:18:41,  2.20s/it] 68%|██████▊   | 4636/6779 [2:52:01<1:17:37,  2.17s/it]                                                       {'loss': 1.6296, 'learning_rate': 9.344853875707303e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4636/6779 [2:52:01<1:17:37,  2.17s/it] 68%|██████▊   | 4637/6779 [2:52:03<1:20:29,  2.25s/it]                                                       {'loss': 1.5053, 'learning_rate': 9.336893894165433e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4637/6779 [2:52:03<1:20:29,  2.25s/it] 68%|██████▊   | 4638/6779 [2:52:05<1:19:43,  2.23s/it]                                                       {'loss': 1.7584, 'learning_rate': 9.32893627180087e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4638/6779 [2:52:05<1:19:43,  2.23s/it] 68%|██████▊   | 4639/6779 [2:52:08<1:20:14,  2.25s/it]                                                       {'loss': 1.6403, 'learning_rate': 9.320981010374202e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4639/6779 [2:52:08<1:20:14,  2.25s/it] 68%|██████▊   | 4640/6779 [2:52:10<1:18:09,  2.19s/it]                                                       {'loss': 1.7198, 'learning_rate': 9.313028111645516e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4640/6779 [2:52:10<1:18:09,  2.19s/it] 68%|██████▊   | 4641/6779 [2:52:12<1:17:57,  2.19s/it]                                                       {'loss': 1.7474, 'learning_rate': 9.30507757737435e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4641/6779 [2:52:12<1:17:57,  2.19s/it] 68%|██████▊   | 4642/6779 [2:52:14<1:18:34,  2.21s/it]                                                       {'loss': 1.6246, 'learning_rate': 9.297129409319754e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4642/6779 [2:52:14<1:18:34,  2.21s/it] 68%|██████▊   | 4643/6779 [2:52:16<1:17:20,  2.17s/it]                                                       {'loss': 1.6647, 'learning_rate': 9.28918360924021e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4643/6779 [2:52:16<1:17:20,  2.17s/it] 69%|██████▊   | 4644/6779 [2:52:19<1:20:46,  2.27s/it]                                                       {'loss': 1.5764, 'learning_rate': 9.281240178893718e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4644/6779 [2:52:19<1:20:46,  2.27s/it] 69%|██████▊   | 4645/6779 [2:52:21<1:23:26,  2.35s/it]                                                       {'loss': 1.6376, 'learning_rate': 9.273299120037736e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4645/6779 [2:52:21<1:23:26,  2.35s/it] 69%|██████▊   | 4646/6779 [2:52:24<1:24:08,  2.37s/it]                                                       {'loss': 1.7476, 'learning_rate': 9.265360434429182e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4646/6779 [2:52:24<1:24:08,  2.37s/it] 69%|██████▊   | 4647/6779 [2:52:26<1:21:01,  2.28s/it]                                                       {'loss': 1.7686, 'learning_rate': 9.257424123824483e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4647/6779 [2:52:26<1:21:01,  2.28s/it] 69%|██████▊   | 4648/6779 [2:52:28<1:18:36,  2.21s/it]                                                       {'loss': 1.7504, 'learning_rate': 9.249490189979507e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4648/6779 [2:52:28<1:18:36,  2.21s/it] 69%|██████▊   | 4649/6779 [2:52:30<1:20:13,  2.26s/it]                                                       {'loss': 1.7232, 'learning_rate': 9.241558634649623e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4649/6779 [2:52:30<1:20:13,  2.26s/it] 69%|██████▊   | 4650/6779 [2:52:33<1:21:57,  2.31s/it]                                                       {'loss': 1.6603, 'learning_rate': 9.233629459589648e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4650/6779 [2:52:33<1:21:57,  2.31s/it] 69%|██████▊   | 4651/6779 [2:52:35<1:19:32,  2.24s/it]                                                       {'loss': 1.7357, 'learning_rate': 9.225702666553893e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4651/6779 [2:52:35<1:19:32,  2.24s/it] 69%|██████▊   | 4652/6779 [2:52:37<1:17:14,  2.18s/it]                                                       {'loss': 1.7034, 'learning_rate': 9.217778257296144e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4652/6779 [2:52:37<1:17:14,  2.18s/it] 69%|██████▊   | 4653/6779 [2:52:39<1:15:18,  2.13s/it]                                                       {'loss': 1.6168, 'learning_rate': 9.209856233569633e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4653/6779 [2:52:39<1:15:18,  2.13s/it] 69%|██████▊   | 4654/6779 [2:52:41<1:17:31,  2.19s/it]                                                       {'loss': 1.7189, 'learning_rate': 9.201936597127099e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4654/6779 [2:52:41<1:17:31,  2.19s/it] 69%|██████▊   | 4655/6779 [2:52:43<1:15:31,  2.13s/it]                                                       {'loss': 1.6009, 'learning_rate': 9.19401934972072e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4655/6779 [2:52:43<1:15:31,  2.13s/it] 69%|██████▊   | 4656/6779 [2:52:45<1:15:46,  2.14s/it]                                                       {'loss': 1.6664, 'learning_rate': 9.186104493102175e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4656/6779 [2:52:45<1:15:46,  2.14s/it] 69%|██████▊   | 4657/6779 [2:52:47<1:14:58,  2.12s/it]                                                       {'loss': 1.6591, 'learning_rate': 9.178192029022587e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4657/6779 [2:52:47<1:14:58,  2.12s/it] 69%|██████▊   | 4658/6779 [2:52:49<1:15:24,  2.13s/it]                                                       {'loss': 1.7217, 'learning_rate': 9.17028195923257e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4658/6779 [2:52:49<1:15:24,  2.13s/it] 69%|██████▊   | 4659/6779 [2:52:53<1:32:40,  2.62s/it]                                                       {'loss': 1.5775, 'learning_rate': 9.162374285482208e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4659/6779 [2:52:53<1:32:40,  2.62s/it] 69%|██████▊   | 4660/6779 [2:52:55<1:26:47,  2.46s/it]                                                       {'loss': 1.5376, 'learning_rate': 9.15446900952103e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4660/6779 [2:52:55<1:26:47,  2.46s/it] 69%|██████▉   | 4661/6779 [2:52:57<1:21:32,  2.31s/it]                                                       {'loss': 1.653, 'learning_rate': 9.146566133098073e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4661/6779 [2:52:57<1:21:32,  2.31s/it] 69%|██████▉   | 4662/6779 [2:52:59<1:19:35,  2.26s/it]                                                       {'loss': 1.755, 'learning_rate': 9.138665657961802e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4662/6779 [2:52:59<1:19:35,  2.26s/it] 69%|██████▉   | 4663/6779 [2:53:01<1:16:15,  2.16s/it]                                                       {'loss': 1.5822, 'learning_rate': 9.130767585860191e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4663/6779 [2:53:01<1:16:15,  2.16s/it] 69%|██████▉   | 4664/6779 [2:53:03<1:15:51,  2.15s/it]                                                       {'loss': 1.6938, 'learning_rate': 9.122871918540647e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4664/6779 [2:53:03<1:15:51,  2.15s/it] 69%|██████▉   | 4665/6779 [2:53:06<1:15:40,  2.15s/it]                                                       {'loss': 1.752, 'learning_rate': 9.114978657750063e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4665/6779 [2:53:06<1:15:40,  2.15s/it] 69%|██████▉   | 4666/6779 [2:53:08<1:16:26,  2.17s/it]                                                       {'loss': 1.7439, 'learning_rate': 9.107087805234804e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4666/6779 [2:53:08<1:16:26,  2.17s/it] 69%|██████▉   | 4667/6779 [2:53:10<1:16:42,  2.18s/it]                                                       {'loss': 1.8376, 'learning_rate': 9.099199362740698e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4667/6779 [2:53:10<1:16:42,  2.18s/it] 69%|██████▉   | 4668/6779 [2:53:13<1:26:14,  2.45s/it]                                                       {'loss': 1.7121, 'learning_rate': 9.091313332013031e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4668/6779 [2:53:13<1:26:14,  2.45s/it] 69%|██████▉   | 4669/6779 [2:53:16<1:26:38,  2.46s/it]                                                       {'loss': 1.7488, 'learning_rate': 9.083429714796554e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4669/6779 [2:53:16<1:26:38,  2.46s/it] 69%|██████▉   | 4670/6779 [2:53:18<1:23:28,  2.37s/it]                                                       {'loss': 1.6638, 'learning_rate': 9.075548512835508e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4670/6779 [2:53:18<1:23:28,  2.37s/it] 69%|██████▉   | 4671/6779 [2:53:20<1:24:28,  2.40s/it]                                                       {'loss': 1.7101, 'learning_rate': 9.067669727873564e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4671/6779 [2:53:20<1:24:28,  2.40s/it] 69%|██████▉   | 4672/6779 [2:53:23<1:23:53,  2.39s/it]                                                       {'loss': 1.6821, 'learning_rate': 9.05979336165389e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4672/6779 [2:53:23<1:23:53,  2.39s/it] 69%|██████▉   | 4673/6779 [2:53:25<1:23:06,  2.37s/it]                                                       {'loss': 1.7644, 'learning_rate': 9.051919415919101e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4673/6779 [2:53:25<1:23:06,  2.37s/it] 69%|██████▉   | 4674/6779 [2:53:27<1:22:52,  2.36s/it]                                                       {'loss': 1.6734, 'learning_rate': 9.044047892411294e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4674/6779 [2:53:27<1:22:52,  2.36s/it] 69%|██████▉   | 4675/6779 [2:53:29<1:19:11,  2.26s/it]                                                       {'loss': 1.7366, 'learning_rate': 9.036178792872002e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4675/6779 [2:53:29<1:19:11,  2.26s/it] 69%|██████▉   | 4676/6779 [2:53:32<1:20:34,  2.30s/it]                                                       {'loss': 1.56, 'learning_rate': 9.028312119042249e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4676/6779 [2:53:32<1:20:34,  2.30s/it] 69%|██████▉   | 4677/6779 [2:53:34<1:19:10,  2.26s/it]                                                       {'loss': 1.7507, 'learning_rate': 9.020447872662505e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4677/6779 [2:53:34<1:19:10,  2.26s/it] 69%|██████▉   | 4678/6779 [2:53:36<1:16:18,  2.18s/it]                                                       {'loss': 1.5919, 'learning_rate': 9.012586055472703e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4678/6779 [2:53:36<1:16:18,  2.18s/it] 69%|██████▉   | 4679/6779 [2:53:38<1:17:59,  2.23s/it]                                                       {'loss': 1.696, 'learning_rate': 9.004726669212249e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4679/6779 [2:53:38<1:17:59,  2.23s/it] 69%|██████▉   | 4680/6779 [2:53:40<1:16:17,  2.18s/it]                                                       {'loss': 1.7675, 'learning_rate': 8.996869715620011e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4680/6779 [2:53:40<1:16:17,  2.18s/it] 69%|██████▉   | 4681/6779 [2:53:42<1:14:51,  2.14s/it]                                                       {'loss': 1.5371, 'learning_rate': 8.989015196434316e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4681/6779 [2:53:42<1:14:51,  2.14s/it] 69%|██████▉   | 4682/6779 [2:53:44<1:14:15,  2.12s/it]                                                       {'loss': 1.7459, 'learning_rate': 8.98116311339294e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4682/6779 [2:53:44<1:14:15,  2.12s/it] 69%|██████▉   | 4683/6779 [2:53:46<1:13:16,  2.10s/it]                                                       {'loss': 1.6836, 'learning_rate': 8.973313468233144e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4683/6779 [2:53:46<1:13:16,  2.10s/it] 69%|██████▉   | 4684/6779 [2:53:49<1:14:07,  2.12s/it]                                                       {'loss': 1.6372, 'learning_rate': 8.965466262691619e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4684/6779 [2:53:49<1:14:07,  2.12s/it] 69%|██████▉   | 4685/6779 [2:53:51<1:15:32,  2.16s/it]                                                       {'loss': 1.647, 'learning_rate': 8.957621498504554e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4685/6779 [2:53:51<1:15:32,  2.16s/it] 69%|██████▉   | 4686/6779 [2:53:53<1:14:10,  2.13s/it]                                                       {'loss': 1.7093, 'learning_rate': 8.949779177407558e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4686/6779 [2:53:53<1:14:10,  2.13s/it] 69%|██████▉   | 4687/6779 [2:53:55<1:16:00,  2.18s/it]                                                       {'loss': 1.7213, 'learning_rate': 8.941939301135728e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4687/6779 [2:53:55<1:16:00,  2.18s/it] 69%|██████▉   | 4688/6779 [2:53:57<1:13:54,  2.12s/it]                                                       {'loss': 1.4896, 'learning_rate': 8.934101871423619e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4688/6779 [2:53:57<1:13:54,  2.12s/it] 69%|██████▉   | 4689/6779 [2:53:59<1:13:50,  2.12s/it]                                                       {'loss': 1.7143, 'learning_rate': 8.92626689000522e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4689/6779 [2:53:59<1:13:50,  2.12s/it] 69%|██████▉   | 4690/6779 [2:54:01<1:13:44,  2.12s/it]                                                       {'loss': 1.579, 'learning_rate': 8.91843435861401e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4690/6779 [2:54:01<1:13:44,  2.12s/it] 69%|██████▉   | 4691/6779 [2:54:03<1:13:37,  2.12s/it]                                                       {'loss': 1.6756, 'learning_rate': 8.910604278982897e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4691/6779 [2:54:03<1:13:37,  2.12s/it] 69%|██████▉   | 4692/6779 [2:54:06<1:13:32,  2.11s/it]                                                       {'loss': 1.5745, 'learning_rate': 8.902776652844276e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4692/6779 [2:54:06<1:13:32,  2.11s/it] 69%|██████▉   | 4693/6779 [2:54:08<1:14:35,  2.15s/it]                                                       {'loss': 1.515, 'learning_rate': 8.894951481929968e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4693/6779 [2:54:08<1:14:35,  2.15s/it] 69%|██████▉   | 4694/6779 [2:54:10<1:14:40,  2.15s/it]                                                       {'loss': 1.6098, 'learning_rate': 8.887128767971272e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4694/6779 [2:54:10<1:14:40,  2.15s/it] 69%|██████▉   | 4695/6779 [2:54:12<1:16:19,  2.20s/it]                                                       {'loss': 1.7656, 'learning_rate': 8.879308512698947e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4695/6779 [2:54:12<1:16:19,  2.20s/it] 69%|██████▉   | 4696/6779 [2:54:15<1:16:52,  2.21s/it]                                                       {'loss': 1.6097, 'learning_rate': 8.871490717843185e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4696/6779 [2:54:15<1:16:52,  2.21s/it] 69%|██████▉   | 4697/6779 [2:54:17<1:18:18,  2.26s/it]                                                       {'loss': 1.8023, 'learning_rate': 8.863675385133663e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4697/6779 [2:54:17<1:18:18,  2.26s/it] 69%|██████▉   | 4698/6779 [2:54:19<1:16:17,  2.20s/it]                                                       {'loss': 1.6651, 'learning_rate': 8.855862516299478e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4698/6779 [2:54:19<1:16:17,  2.20s/it] 69%|██████▉   | 4699/6779 [2:54:21<1:14:31,  2.15s/it]                                                       {'loss': 1.6381, 'learning_rate': 8.848052113069224e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4699/6779 [2:54:21<1:14:31,  2.15s/it] 69%|██████▉   | 4700/6779 [2:54:23<1:16:14,  2.20s/it]                                                       {'loss': 1.6763, 'learning_rate': 8.840244177170904e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4700/6779 [2:54:23<1:16:14,  2.20s/it] 69%|██████▉   | 4701/6779 [2:54:26<1:16:31,  2.21s/it]                                                       {'loss': 1.538, 'learning_rate': 8.832438710332009e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4701/6779 [2:54:26<1:16:31,  2.21s/it] 69%|██████▉   | 4702/6779 [2:54:28<1:16:38,  2.21s/it]                                                       {'loss': 1.6884, 'learning_rate': 8.824635714279485e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4702/6779 [2:54:28<1:16:38,  2.21s/it] 69%|██████▉   | 4703/6779 [2:54:30<1:18:16,  2.26s/it]                                                       {'loss': 1.6311, 'learning_rate': 8.816835190739698e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4703/6779 [2:54:30<1:18:16,  2.26s/it] 69%|██████▉   | 4704/6779 [2:54:32<1:16:16,  2.21s/it]                                                       {'loss': 1.5898, 'learning_rate': 8.809037141438508e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4704/6779 [2:54:32<1:16:16,  2.21s/it] 69%|██████▉   | 4705/6779 [2:54:34<1:16:26,  2.21s/it]                                                       {'loss': 1.6448, 'learning_rate': 8.801241568101188e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4705/6779 [2:54:34<1:16:26,  2.21s/it] 69%|██████▉   | 4706/6779 [2:54:37<1:18:18,  2.27s/it]                                                       {'loss': 1.6892, 'learning_rate': 8.7934484724525e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4706/6779 [2:54:37<1:18:18,  2.27s/it] 69%|██████▉   | 4707/6779 [2:54:39<1:17:14,  2.24s/it]                                                       {'loss': 1.7692, 'learning_rate': 8.785657856216631e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4707/6779 [2:54:39<1:17:14,  2.24s/it] 69%|██████▉   | 4708/6779 [2:54:42<1:22:59,  2.40s/it]                                                       {'loss': 1.5418, 'learning_rate': 8.777869721117229e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4708/6779 [2:54:42<1:22:59,  2.40s/it] 69%|██████▉   | 4709/6779 [2:54:44<1:19:17,  2.30s/it]                                                       {'loss': 1.5951, 'learning_rate': 8.770084068877407e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4709/6779 [2:54:44<1:19:17,  2.30s/it] 69%|██████▉   | 4710/6779 [2:54:46<1:19:33,  2.31s/it]                                                       {'loss': 1.6539, 'learning_rate': 8.762300901219695e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4710/6779 [2:54:46<1:19:33,  2.31s/it] 69%|██████▉   | 4711/6779 [2:54:48<1:17:08,  2.24s/it]                                                       {'loss': 1.7986, 'learning_rate': 8.754520219866111e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4711/6779 [2:54:48<1:17:08,  2.24s/it] 70%|██████▉   | 4712/6779 [2:54:50<1:16:32,  2.22s/it]                                                       {'loss': 1.3896, 'learning_rate': 8.746742026538091e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4712/6779 [2:54:50<1:16:32,  2.22s/it] 70%|██████▉   | 4713/6779 [2:54:53<1:18:12,  2.27s/it]                                                       {'loss': 1.5659, 'learning_rate': 8.738966322956548e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4713/6779 [2:54:53<1:18:12,  2.27s/it] 70%|██████▉   | 4714/6779 [2:54:55<1:17:37,  2.26s/it]                                                       {'loss': 1.7541, 'learning_rate': 8.731193110841818e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4714/6779 [2:54:55<1:17:37,  2.26s/it] 70%|██████▉   | 4715/6779 [2:54:57<1:15:33,  2.20s/it]                                                       {'loss': 1.5589, 'learning_rate': 8.723422391913703e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4715/6779 [2:54:57<1:15:33,  2.20s/it] 70%|██████▉   | 4716/6779 [2:54:59<1:14:45,  2.17s/it]                                                       {'loss': 1.5456, 'learning_rate': 8.71565416789146e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4716/6779 [2:54:59<1:14:45,  2.17s/it] 70%|██████▉   | 4717/6779 [2:55:01<1:15:39,  2.20s/it]                                                       {'loss': 1.612, 'learning_rate': 8.707888440493765e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4717/6779 [2:55:01<1:15:39,  2.20s/it] 70%|██████▉   | 4718/6779 [2:55:04<1:14:24,  2.17s/it]                                                       {'loss': 1.6708, 'learning_rate': 8.700125211438779e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4718/6779 [2:55:04<1:14:24,  2.17s/it] 70%|██████▉   | 4719/6779 [2:55:06<1:13:26,  2.14s/it]                                                       {'loss': 1.5768, 'learning_rate': 8.692364482444073e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4719/6779 [2:55:06<1:13:26,  2.14s/it] 70%|██████▉   | 4720/6779 [2:55:08<1:11:08,  2.07s/it]                                                       {'loss': 1.4952, 'learning_rate': 8.684606255226697e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4720/6779 [2:55:08<1:11:08,  2.07s/it] 70%|██████▉   | 4721/6779 [2:55:10<1:11:46,  2.09s/it]                                                       {'loss': 1.5089, 'learning_rate': 8.67685053150312e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4721/6779 [2:55:10<1:11:46,  2.09s/it] 70%|██████▉   | 4722/6779 [2:55:12<1:11:04,  2.07s/it]                                                       {'loss': 1.7466, 'learning_rate': 8.669097312989279e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4722/6779 [2:55:12<1:11:04,  2.07s/it] 70%|██████▉   | 4723/6779 [2:55:14<1:12:28,  2.11s/it]                                                       {'loss': 1.6806, 'learning_rate': 8.661346601400553e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4723/6779 [2:55:14<1:12:28,  2.11s/it] 70%|██████▉   | 4724/6779 [2:55:16<1:13:28,  2.15s/it]                                                       {'loss': 1.6799, 'learning_rate': 8.653598398451748e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4724/6779 [2:55:16<1:13:28,  2.15s/it] 70%|██████▉   | 4725/6779 [2:55:18<1:14:30,  2.18s/it]                                                       {'loss': 1.6844, 'learning_rate': 8.645852705857145e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4725/6779 [2:55:18<1:14:30,  2.18s/it] 70%|██████▉   | 4726/6779 [2:55:20<1:13:11,  2.14s/it]                                                       {'loss': 1.683, 'learning_rate': 8.638109525330436e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4726/6779 [2:55:20<1:13:11,  2.14s/it] 70%|██████▉   | 4727/6779 [2:55:23<1:13:07,  2.14s/it]                                                       {'loss': 1.637, 'learning_rate': 8.630368858584788e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4727/6779 [2:55:23<1:13:07,  2.14s/it] 70%|██████▉   | 4728/6779 [2:55:25<1:14:02,  2.17s/it]                                                       {'loss': 1.5674, 'learning_rate': 8.622630707332786e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4728/6779 [2:55:25<1:14:02,  2.17s/it] 70%|██████▉   | 4729/6779 [2:55:27<1:13:29,  2.15s/it]                                                       {'loss': 1.5352, 'learning_rate': 8.614895073286478e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4729/6779 [2:55:27<1:13:29,  2.15s/it] 70%|██████▉   | 4730/6779 [2:55:29<1:13:13,  2.14s/it]                                                       {'loss': 1.5525, 'learning_rate': 8.607161958157354e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4730/6779 [2:55:29<1:13:13,  2.14s/it] 70%|██████▉   | 4731/6779 [2:55:31<1:13:10,  2.14s/it]                                                       {'loss': 1.6203, 'learning_rate': 8.599431363656327e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4731/6779 [2:55:31<1:13:10,  2.14s/it] 70%|██████▉   | 4732/6779 [2:55:34<1:14:59,  2.20s/it]                                                       {'loss': 1.6564, 'learning_rate': 8.591703291493778e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4732/6779 [2:55:34<1:14:59,  2.20s/it] 70%|██████▉   | 4733/6779 [2:55:36<1:16:20,  2.24s/it]                                                       {'loss': 1.6546, 'learning_rate': 8.583977743379504e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4733/6779 [2:55:36<1:16:20,  2.24s/it] 70%|██████▉   | 4734/6779 [2:55:38<1:17:24,  2.27s/it]                                                       {'loss': 1.7833, 'learning_rate': 8.576254721022774e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4734/6779 [2:55:38<1:17:24,  2.27s/it] 70%|██████▉   | 4735/6779 [2:55:41<1:17:40,  2.28s/it]                                                       {'loss': 1.7409, 'learning_rate': 8.568534226132263e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4735/6779 [2:55:41<1:17:40,  2.28s/it] 70%|██████▉   | 4736/6779 [2:55:43<1:22:20,  2.42s/it]                                                       {'loss': 1.6724, 'learning_rate': 8.560816260416116e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4736/6779 [2:55:43<1:22:20,  2.42s/it] 70%|██████▉   | 4737/6779 [2:55:45<1:18:48,  2.32s/it]                                                       {'loss': 1.6391, 'learning_rate': 8.553100825581903e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4737/6779 [2:55:45<1:18:48,  2.32s/it] 70%|██████▉   | 4738/6779 [2:55:48<1:19:07,  2.33s/it]                                                       {'loss': 1.7873, 'learning_rate': 8.545387923336652e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4738/6779 [2:55:48<1:19:07,  2.33s/it] 70%|██████▉   | 4739/6779 [2:55:50<1:17:41,  2.29s/it]                                                       {'loss': 1.6583, 'learning_rate': 8.537677555386807e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4739/6779 [2:55:50<1:17:41,  2.29s/it] 70%|██████▉   | 4740/6779 [2:55:52<1:17:29,  2.28s/it]                                                       {'loss': 1.4448, 'learning_rate': 8.529969723438253e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4740/6779 [2:55:52<1:17:29,  2.28s/it] 70%|██████▉   | 4741/6779 [2:55:55<1:19:13,  2.33s/it]                                                       {'loss': 1.6529, 'learning_rate': 8.52226442919634e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4741/6779 [2:55:55<1:19:13,  2.33s/it] 70%|██████▉   | 4742/6779 [2:55:57<1:18:01,  2.30s/it]                                                       {'loss': 1.7536, 'learning_rate': 8.514561674365824e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4742/6779 [2:55:57<1:18:01,  2.30s/it] 70%|██████▉   | 4743/6779 [2:55:59<1:18:28,  2.31s/it]                                                       {'loss': 1.7237, 'learning_rate': 8.50686146065092e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4743/6779 [2:55:59<1:18:28,  2.31s/it] 70%|██████▉   | 4744/6779 [2:56:01<1:17:51,  2.30s/it]                                                       {'loss': 1.7751, 'learning_rate': 8.499163789755276e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4744/6779 [2:56:01<1:17:51,  2.30s/it] 70%|██████▉   | 4745/6779 [2:56:04<1:16:17,  2.25s/it]                                                       {'loss': 1.7782, 'learning_rate': 8.491468663381982e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4745/6779 [2:56:04<1:16:17,  2.25s/it] 70%|███████   | 4746/6779 [2:56:06<1:15:10,  2.22s/it]                                                       {'loss': 1.766, 'learning_rate': 8.48377608323355e-05, 'epoch': 0.7}
+ 70%|███████   | 4746/6779 [2:56:06<1:15:10,  2.22s/it] 70%|███████   | 4747/6779 [2:56:08<1:13:58,  2.18s/it]                                                       {'loss': 1.7782, 'learning_rate': 8.476086051011947e-05, 'epoch': 0.7}
+ 70%|███████   | 4747/6779 [2:56:08<1:13:58,  2.18s/it] 70%|███████   | 4748/6779 [2:56:10<1:15:44,  2.24s/it]                                                       {'loss': 1.6245, 'learning_rate': 8.468398568418563e-05, 'epoch': 0.7}
+ 70%|███████   | 4748/6779 [2:56:10<1:15:44,  2.24s/it] 70%|███████   | 4749/6779 [2:56:12<1:13:34,  2.17s/it]                                                       {'loss': 1.4437, 'learning_rate': 8.46071363715422e-05, 'epoch': 0.7}
+ 70%|███████   | 4749/6779 [2:56:12<1:13:34,  2.17s/it] 70%|███████   | 4750/6779 [2:56:15<1:15:56,  2.25s/it]                                                       {'loss': 1.6586, 'learning_rate': 8.453031258919192e-05, 'epoch': 0.7}
+ 70%|███████   | 4750/6779 [2:56:15<1:15:56,  2.25s/it] 70%|███████   | 4751/6779 [2:56:17<1:15:10,  2.22s/it]                                                       {'loss': 1.7163, 'learning_rate': 8.44535143541318e-05, 'epoch': 0.7}
+ 70%|███████   | 4751/6779 [2:56:17<1:15:10,  2.22s/it] 70%|███████   | 4752/6779 [2:56:19<1:16:54,  2.28s/it]                                                       {'loss': 1.5617, 'learning_rate': 8.437674168335325e-05, 'epoch': 0.7}
+ 70%|███████   | 4752/6779 [2:56:19<1:16:54,  2.28s/it] 70%|███████   | 4753/6779 [2:56:22<1:18:25,  2.32s/it]                                                       {'loss': 1.6075, 'learning_rate': 8.429999459384186e-05, 'epoch': 0.7}
+ 70%|███████   | 4753/6779 [2:56:22<1:18:25,  2.32s/it] 70%|███████   | 4754/6779 [2:56:24<1:18:02,  2.31s/it]                                                       {'loss': 1.551, 'learning_rate': 8.422327310257781e-05, 'epoch': 0.7}
+ 70%|███████   | 4754/6779 [2:56:24<1:18:02,  2.31s/it] 70%|███████   | 4755/6779 [2:56:26<1:18:17,  2.32s/it]                                                       {'loss': 1.6391, 'learning_rate': 8.414657722653532e-05, 'epoch': 0.7}
+ 70%|███████   | 4755/6779 [2:56:26<1:18:17,  2.32s/it] 70%|███████   | 4756/6779 [2:56:28<1:16:29,  2.27s/it]                                                       {'loss': 1.5878, 'learning_rate': 8.406990698268325e-05, 'epoch': 0.7}
+ 70%|███████   | 4756/6779 [2:56:28<1:16:29,  2.27s/it] 70%|███████   | 4757/6779 [2:56:30<1:14:23,  2.21s/it]                                                       {'loss': 1.5054, 'learning_rate': 8.399326238798449e-05, 'epoch': 0.7}
+ 70%|███████   | 4757/6779 [2:56:30<1:14:23,  2.21s/it] 70%|███████   | 4758/6779 [2:56:33<1:17:20,  2.30s/it]                                                       {'loss': 1.586, 'learning_rate': 8.391664345939647e-05, 'epoch': 0.7}
+ 70%|███████   | 4758/6779 [2:56:33<1:17:20,  2.30s/it] 70%|███████   | 4759/6779 [2:56:35<1:16:45,  2.28s/it]                                                       {'loss': 1.5379, 'learning_rate': 8.384005021387101e-05, 'epoch': 0.7}
+ 70%|███████   | 4759/6779 [2:56:35<1:16:45,  2.28s/it] 70%|███████   | 4760/6779 [2:56:38<1:19:04,  2.35s/it]                                                       {'loss': 1.672, 'learning_rate': 8.376348266835387e-05, 'epoch': 0.7}
+ 70%|███████   | 4760/6779 [2:56:38<1:19:04,  2.35s/it] 70%|███████   | 4761/6779 [2:56:40<1:23:17,  2.48s/it]                                                       {'loss': 1.5876, 'learning_rate': 8.368694083978561e-05, 'epoch': 0.7}
+ 70%|███████   | 4761/6779 [2:56:40<1:23:17,  2.48s/it] 70%|███████   | 4762/6779 [2:56:43<1:20:55,  2.41s/it]                                                       {'loss': 1.6347, 'learning_rate': 8.361042474510066e-05, 'epoch': 0.7}
+ 70%|███████   | 4762/6779 [2:56:43<1:20:55,  2.41s/it] 70%|███████   | 4763/6779 [2:56:45<1:17:04,  2.29s/it]                                                       {'loss': 1.6439, 'learning_rate': 8.353393440122809e-05, 'epoch': 0.7}
+ 70%|███████   | 4763/6779 [2:56:45<1:17:04,  2.29s/it] 70%|███████   | 4764/6779 [2:56:47<1:16:32,  2.28s/it]                                                       {'loss': 1.4473, 'learning_rate': 8.345746982509103e-05, 'epoch': 0.7}
+ 70%|███████   | 4764/6779 [2:56:47<1:16:32,  2.28s/it] 70%|███████   | 4765/6779 [2:56:49<1:16:56,  2.29s/it]                                                       {'loss': 1.6031, 'learning_rate': 8.33810310336071e-05, 'epoch': 0.7}
+ 70%|███████   | 4765/6779 [2:56:49<1:16:56,  2.29s/it] 70%|███████   | 4766/6779 [2:56:51<1:14:36,  2.22s/it]                                                       {'loss': 1.5143, 'learning_rate': 8.330461804368814e-05, 'epoch': 0.7}
+ 70%|███████   | 4766/6779 [2:56:51<1:14:36,  2.22s/it] 70%|███████   | 4767/6779 [2:56:54<1:13:25,  2.19s/it]                                                       {'loss': 1.535, 'learning_rate': 8.322823087224021e-05, 'epoch': 0.7}
+ 70%|███████   | 4767/6779 [2:56:54<1:13:25,  2.19s/it] 70%|███████   | 4768/6779 [2:56:56<1:15:23,  2.25s/it]                                                       {'loss': 1.6589, 'learning_rate': 8.315186953616378e-05, 'epoch': 0.7}
+ 70%|███████   | 4768/6779 [2:56:56<1:15:23,  2.25s/it] 70%|███████   | 4769/6779 [2:56:58<1:17:06,  2.30s/it]                                                       {'loss': 1.7807, 'learning_rate': 8.307553405235349e-05, 'epoch': 0.7}
+ 70%|███████   | 4769/6779 [2:56:58<1:17:06,  2.30s/it] 70%|███████   | 4770/6779 [2:57:00<1:13:41,  2.20s/it]                                                       {'loss': 1.5272, 'learning_rate': 8.299922443769839e-05, 'epoch': 0.7}
+ 70%|███████   | 4770/6779 [2:57:00<1:13:41,  2.20s/it] 70%|███████   | 4771/6779 [2:57:02<1:13:21,  2.19s/it]                                                       {'loss': 1.8175, 'learning_rate': 8.292294070908163e-05, 'epoch': 0.7}
+ 70%|███████   | 4771/6779 [2:57:02<1:13:21,  2.19s/it] 70%|███████   | 4772/6779 [2:57:05<1:17:19,  2.31s/it]                                                       {'loss': 1.6637, 'learning_rate': 8.284668288338076e-05, 'epoch': 0.7}
+ 70%|███████   | 4772/6779 [2:57:05<1:17:19,  2.31s/it] 70%|███████   | 4773/6779 [2:57:07<1:17:21,  2.31s/it]                                                       {'loss': 1.5464, 'learning_rate': 8.27704509774677e-05, 'epoch': 0.7}
+ 70%|███████   | 4773/6779 [2:57:07<1:17:21,  2.31s/it] 70%|███████   | 4774/6779 [2:57:10<1:18:13,  2.34s/it]                                                       {'loss': 1.6815, 'learning_rate': 8.269424500820832e-05, 'epoch': 0.7}
+ 70%|███████   | 4774/6779 [2:57:10<1:18:13,  2.34s/it] 70%|███████   | 4775/6779 [2:57:12<1:17:30,  2.32s/it]                                                       {'loss': 1.7232, 'learning_rate': 8.261806499246314e-05, 'epoch': 0.7}
+ 70%|███████   | 4775/6779 [2:57:12<1:17:30,  2.32s/it] 70%|███████   | 4776/6779 [2:57:14<1:16:17,  2.29s/it]                                                       {'loss': 1.7899, 'learning_rate': 8.254191094708654e-05, 'epoch': 0.7}
+ 70%|███████   | 4776/6779 [2:57:14<1:16:17,  2.29s/it] 70%|███████   | 4777/6779 [2:57:16<1:15:38,  2.27s/it]                                                       {'loss': 1.7495, 'learning_rate': 8.246578288892752e-05, 'epoch': 0.7}
+ 70%|███████   | 4777/6779 [2:57:16<1:15:38,  2.27s/it] 70%|███████   | 4778/6779 [2:57:19<1:16:05,  2.28s/it]                                                       {'loss': 1.5863, 'learning_rate': 8.238968083482903e-05, 'epoch': 0.7}
+ 70%|███████   | 4778/6779 [2:57:19<1:16:05,  2.28s/it] 70%|███████   | 4779/6779 [2:57:21<1:14:31,  2.24s/it]                                                       {'loss': 1.8252, 'learning_rate': 8.231360480162847e-05, 'epoch': 0.7}
+ 70%|███████   | 4779/6779 [2:57:21<1:14:31,  2.24s/it] 71%|███████   | 4780/6779 [2:57:23<1:15:19,  2.26s/it]                                                       {'loss': 1.7638, 'learning_rate': 8.223755480615747e-05, 'epoch': 0.71}
+ 71%|███████   | 4780/6779 [2:57:23<1:15:19,  2.26s/it] 71%|███████   | 4781/6779 [2:57:25<1:14:25,  2.24s/it]                                                       {'loss': 1.682, 'learning_rate': 8.21615308652417e-05, 'epoch': 0.71}
+ 71%|███████   | 4781/6779 [2:57:25<1:14:25,  2.24s/it] 71%|███████   | 4782/6779 [2:57:28<1:17:25,  2.33s/it]                                                       {'loss': 1.5501, 'learning_rate': 8.208553299570136e-05, 'epoch': 0.71}
+ 71%|███████   | 4782/6779 [2:57:28<1:17:25,  2.33s/it] 71%|███████   | 4783/6779 [2:57:30<1:15:34,  2.27s/it]                                                       {'loss': 1.5843, 'learning_rate': 8.200956121435057e-05, 'epoch': 0.71}
+ 71%|███████   | 4783/6779 [2:57:30<1:15:34,  2.27s/it] 71%|███████   | 4784/6779 [2:57:32<1:15:31,  2.27s/it]                                                       {'loss': 1.5631, 'learning_rate': 8.1933615537998e-05, 'epoch': 0.71}
+ 71%|███████   | 4784/6779 [2:57:32<1:15:31,  2.27s/it] 71%|███████   | 4785/6779 [2:57:35<1:15:12,  2.26s/it]                                                       {'loss': 1.7378, 'learning_rate': 8.185769598344626e-05, 'epoch': 0.71}
+ 71%|███████   | 4785/6779 [2:57:35<1:15:12,  2.26s/it] 71%|███████   | 4786/6779 [2:57:37<1:14:37,  2.25s/it]                                                       {'loss': 1.7372, 'learning_rate': 8.178180256749233e-05, 'epoch': 0.71}
+ 71%|███████   | 4786/6779 [2:57:37<1:14:37,  2.25s/it] 71%|███████   | 4787/6779 [2:57:39<1:15:52,  2.29s/it]                                                       {'loss': 1.8464, 'learning_rate': 8.170593530692745e-05, 'epoch': 0.71}
+ 71%|███████   | 4787/6779 [2:57:39<1:15:52,  2.29s/it] 71%|███████   | 4788/6779 [2:57:41<1:14:10,  2.24s/it]                                                       {'loss': 1.722, 'learning_rate': 8.16300942185369e-05, 'epoch': 0.71}
+ 71%|███████   | 4788/6779 [2:57:41<1:14:10,  2.24s/it] 71%|███████   | 4789/6779 [2:57:44<1:14:05,  2.23s/it]                                                       {'loss': 1.7003, 'learning_rate': 8.15542793191004e-05, 'epoch': 0.71}
+ 71%|███████   | 4789/6779 [2:57:44<1:14:05,  2.23s/it] 71%|███████   | 4790/6779 [2:57:46<1:16:06,  2.30s/it]                                                       {'loss': 1.3903, 'learning_rate': 8.147849062539159e-05, 'epoch': 0.71}
+ 71%|███████   | 4790/6779 [2:57:46<1:16:06,  2.30s/it] 71%|███████   | 4791/6779 [2:57:49<1:19:52,  2.41s/it]                                                       {'loss': 1.3476, 'learning_rate': 8.140272815417863e-05, 'epoch': 0.71}
+ 71%|███████   | 4791/6779 [2:57:49<1:19:52,  2.41s/it] 71%|███████   | 4792/6779 [2:57:51<1:16:40,  2.32s/it]                                                       {'loss': 1.7011, 'learning_rate': 8.132699192222354e-05, 'epoch': 0.71}
+ 71%|███████   | 4792/6779 [2:57:51<1:16:40,  2.32s/it] 71%|███████   | 4793/6779 [2:57:53<1:14:53,  2.26s/it]                                                       {'loss': 1.605, 'learning_rate': 8.125128194628285e-05, 'epoch': 0.71}
+ 71%|███████   | 4793/6779 [2:57:53<1:14:53,  2.26s/it] 71%|███████   | 4794/6779 [2:57:55<1:13:08,  2.21s/it]                                                       {'loss': 1.7047, 'learning_rate': 8.117559824310715e-05, 'epoch': 0.71}
+ 71%|███████   | 4794/6779 [2:57:55<1:13:08,  2.21s/it] 71%|███████   | 4795/6779 [2:57:57<1:12:35,  2.20s/it]                                                       {'loss': 1.7484, 'learning_rate': 8.10999408294411e-05, 'epoch': 0.71}
+ 71%|███████   | 4795/6779 [2:57:57<1:12:35,  2.20s/it] 71%|███████   | 4796/6779 [2:57:59<1:12:14,  2.19s/it]                                                       {'loss': 1.3614, 'learning_rate': 8.102430972202381e-05, 'epoch': 0.71}
+ 71%|███████   | 4796/6779 [2:57:59<1:12:14,  2.19s/it] 71%|███████   | 4797/6779 [2:58:01<1:12:13,  2.19s/it]                                                       {'loss': 1.5753, 'learning_rate': 8.094870493758825e-05, 'epoch': 0.71}
+ 71%|███████   | 4797/6779 [2:58:01<1:12:13,  2.19s/it] 71%|███████   | 4798/6779 [2:58:04<1:10:52,  2.15s/it]                                                       {'loss': 1.7056, 'learning_rate': 8.087312649286189e-05, 'epoch': 0.71}
+ 71%|███████   | 4798/6779 [2:58:04<1:10:52,  2.15s/it] 71%|███████   | 4799/6779 [2:58:06<1:11:33,  2.17s/it]                                                       {'loss': 1.5949, 'learning_rate': 8.079757440456606e-05, 'epoch': 0.71}
+ 71%|███████   | 4799/6779 [2:58:06<1:11:33,  2.17s/it] 71%|███████   | 4800/6779 [2:58:08<1:10:37,  2.14s/it]                                                       {'loss': 1.6708, 'learning_rate': 8.072204868941646e-05, 'epoch': 0.71}
+ 71%|███████   | 4800/6779 [2:58:08<1:10:37,  2.14s/it] 71%|███████   | 4801/6779 [2:58:10<1:13:00,  2.21s/it]                                                       {'loss': 1.7237, 'learning_rate': 8.064654936412304e-05, 'epoch': 0.71}
+ 71%|███████   | 4801/6779 [2:58:10<1:13:00,  2.21s/it] 71%|███████   | 4802/6779 [2:58:13<1:16:09,  2.31s/it]                                                       {'loss': 1.6781, 'learning_rate': 8.057107644538957e-05, 'epoch': 0.71}
+ 71%|███████   | 4802/6779 [2:58:13<1:16:09,  2.31s/it] 71%|███████   | 4803/6779 [2:58:15<1:14:49,  2.27s/it]                                                       {'loss': 1.5892, 'learning_rate': 8.049562994991437e-05, 'epoch': 0.71}
+ 71%|███████   | 4803/6779 [2:58:15<1:14:49,  2.27s/it] 71%|███████   | 4804/6779 [2:58:17<1:12:47,  2.21s/it]                                                       {'loss': 1.5809, 'learning_rate': 8.042020989438957e-05, 'epoch': 0.71}
+ 71%|███████   | 4804/6779 [2:58:17<1:12:47,  2.21s/it] 71%|███████   | 4805/6779 [2:58:19<1:14:22,  2.26s/it]                                                       {'loss': 1.7087, 'learning_rate': 8.034481629550176e-05, 'epoch': 0.71}
+ 71%|███████   | 4805/6779 [2:58:19<1:14:22,  2.26s/it] 71%|███████   | 4806/6779 [2:58:22<1:15:34,  2.30s/it]                                                       {'loss': 1.6385, 'learning_rate': 8.026944916993139e-05, 'epoch': 0.71}
+ 71%|███████   | 4806/6779 [2:58:22<1:15:34,  2.30s/it] 71%|███████   | 4807/6779 [2:58:24<1:14:33,  2.27s/it]                                                       {'loss': 1.5275, 'learning_rate': 8.019410853435326e-05, 'epoch': 0.71}
+ 71%|███████   | 4807/6779 [2:58:24<1:14:33,  2.27s/it] 71%|███████   | 4808/6779 [2:58:26<1:16:53,  2.34s/it]                                                       {'loss': 1.4799, 'learning_rate': 8.011879440543622e-05, 'epoch': 0.71}
+ 71%|███████   | 4808/6779 [2:58:26<1:16:53,  2.34s/it] 71%|███████   | 4809/6779 [2:58:29<1:16:00,  2.31s/it]                                                       {'loss': 1.6985, 'learning_rate': 8.004350679984336e-05, 'epoch': 0.71}
+ 71%|███████   | 4809/6779 [2:58:29<1:16:00,  2.31s/it] 71%|███████   | 4810/6779 [2:58:31<1:14:49,  2.28s/it]                                                       {'loss': 1.6553, 'learning_rate': 7.996824573423174e-05, 'epoch': 0.71}
+ 71%|███████   | 4810/6779 [2:58:31<1:14:49,  2.28s/it] 71%|███████   | 4811/6779 [2:58:33<1:14:37,  2.28s/it]                                                       {'loss': 1.6774, 'learning_rate': 7.989301122525254e-05, 'epoch': 0.71}
+ 71%|███████   | 4811/6779 [2:58:33<1:14:37,  2.28s/it] 71%|███████   | 4812/6779 [2:58:36<1:15:32,  2.30s/it]                                                       {'loss': 1.6843, 'learning_rate': 7.981780328955133e-05, 'epoch': 0.71}
+ 71%|███████   | 4812/6779 [2:58:36<1:15:32,  2.30s/it] 71%|███████   | 4813/6779 [2:58:38<1:16:07,  2.32s/it]                                                       {'loss': 1.5098, 'learning_rate': 7.974262194376745e-05, 'epoch': 0.71}
+ 71%|███████   | 4813/6779 [2:58:38<1:16:07,  2.32s/it] 71%|███████   | 4814/6779 [2:58:40<1:14:45,  2.28s/it]                                                       {'loss': 1.6799, 'learning_rate': 7.966746720453459e-05, 'epoch': 0.71}
+ 71%|███████   | 4814/6779 [2:58:40<1:14:45,  2.28s/it] 71%|███████   | 4815/6779 [2:58:42<1:13:51,  2.26s/it]                                                       {'loss': 1.7975, 'learning_rate': 7.959233908848051e-05, 'epoch': 0.71}
+ 71%|███████   | 4815/6779 [2:58:42<1:13:51,  2.26s/it] 71%|███████   | 4816/6779 [2:58:45<1:17:26,  2.37s/it]                                                       {'loss': 1.6815, 'learning_rate': 7.951723761222714e-05, 'epoch': 0.71}
+ 71%|███████   | 4816/6779 [2:58:45<1:17:26,  2.37s/it] 71%|███████   | 4817/6779 [2:58:47<1:14:51,  2.29s/it]                                                       {'loss': 1.6351, 'learning_rate': 7.944216279239025e-05, 'epoch': 0.71}
+ 71%|███████   | 4817/6779 [2:58:47<1:14:51,  2.29s/it] 71%|███████   | 4818/6779 [2:58:49<1:14:06,  2.27s/it]                                                       {'loss': 1.9147, 'learning_rate': 7.936711464558009e-05, 'epoch': 0.71}
+ 71%|███████   | 4818/6779 [2:58:49<1:14:06,  2.27s/it] 71%|███████   | 4819/6779 [2:58:52<1:14:34,  2.28s/it]                                                       {'loss': 1.7957, 'learning_rate': 7.92920931884007e-05, 'epoch': 0.71}
+ 71%|███████   | 4819/6779 [2:58:52<1:14:34,  2.28s/it] 71%|███████   | 4820/6779 [2:58:54<1:15:31,  2.31s/it]                                                       {'loss': 1.4683, 'learning_rate': 7.921709843745029e-05, 'epoch': 0.71}
+ 71%|███████   | 4820/6779 [2:58:54<1:15:31,  2.31s/it] 71%|███████   | 4821/6779 [2:58:56<1:13:25,  2.25s/it]                                                       {'loss': 1.7066, 'learning_rate': 7.914213040932126e-05, 'epoch': 0.71}
+ 71%|███████   | 4821/6779 [2:58:56<1:13:25,  2.25s/it] 71%|███████   | 4822/6779 [2:58:58<1:12:09,  2.21s/it]                                                       {'loss': 1.6327, 'learning_rate': 7.906718912060007e-05, 'epoch': 0.71}
+ 71%|███████   | 4822/6779 [2:58:58<1:12:09,  2.21s/it] 71%|███████   | 4823/6779 [2:59:00<1:11:51,  2.20s/it]                                                       {'loss': 1.5879, 'learning_rate': 7.899227458786726e-05, 'epoch': 0.71}
+ 71%|███████   | 4823/6779 [2:59:00<1:11:51,  2.20s/it] 71%|███████   | 4824/6779 [2:59:03<1:14:56,  2.30s/it]                                                       {'loss': 1.5991, 'learning_rate': 7.891738682769732e-05, 'epoch': 0.71}
+ 71%|███████   | 4824/6779 [2:59:03<1:14:56,  2.30s/it] 71%|███████   | 4825/6779 [2:59:05<1:14:29,  2.29s/it]                                                       {'loss': 1.7104, 'learning_rate': 7.884252585665903e-05, 'epoch': 0.71}
+ 71%|███████   | 4825/6779 [2:59:05<1:14:29,  2.29s/it] 71%|███████   | 4826/6779 [2:59:07<1:12:25,  2.23s/it]                                                       {'loss': 1.6662, 'learning_rate': 7.876769169131501e-05, 'epoch': 0.71}
+ 71%|███████   | 4826/6779 [2:59:07<1:12:25,  2.23s/it] 71%|███████   | 4827/6779 [2:59:09<1:12:33,  2.23s/it]                                                       {'loss': 1.6044, 'learning_rate': 7.869288434822224e-05, 'epoch': 0.71}
+ 71%|███████   | 4827/6779 [2:59:09<1:12:33,  2.23s/it] 71%|███████   | 4828/6779 [2:59:12<1:12:50,  2.24s/it]                                                       {'loss': 1.6724, 'learning_rate': 7.861810384393142e-05, 'epoch': 0.71}
+ 71%|███████   | 4828/6779 [2:59:12<1:12:50,  2.24s/it] 71%|███████   | 4829/6779 [2:59:14<1:14:06,  2.28s/it]                                                       {'loss': 1.6007, 'learning_rate': 7.85433501949876e-05, 'epoch': 0.71}
+ 71%|███████   | 4829/6779 [2:59:14<1:14:06,  2.28s/it] 71%|███████   | 4830/6779 [2:59:16<1:10:56,  2.18s/it]                                                       {'loss': 1.5748, 'learning_rate': 7.846862341792982e-05, 'epoch': 0.71}
+ 71%|███████   | 4830/6779 [2:59:16<1:10:56,  2.18s/it] 71%|███████▏  | 4831/6779 [2:59:18<1:10:32,  2.17s/it]                                                       {'loss': 1.7409, 'learning_rate': 7.839392352929098e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4831/6779 [2:59:18<1:10:32,  2.17s/it] 71%|███████▏  | 4832/6779 [2:59:21<1:11:43,  2.21s/it]                                                       {'loss': 1.7379, 'learning_rate': 7.831925054559837e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4832/6779 [2:59:21<1:11:43,  2.21s/it] 71%|███████▏  | 4833/6779 [2:59:22<1:09:18,  2.14s/it]                                                       {'loss': 1.5805, 'learning_rate': 7.824460448337299e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4833/6779 [2:59:23<1:09:18,  2.14s/it] 71%|███████▏  | 4834/6779 [2:59:25<1:10:02,  2.16s/it]                                                       {'loss': 1.6855, 'learning_rate': 7.816998535913016e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4834/6779 [2:59:25<1:10:02,  2.16s/it] 71%|███████▏  | 4835/6779 [2:59:27<1:10:43,  2.18s/it]                                                       {'loss': 1.7002, 'learning_rate': 7.809539318937897e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4835/6779 [2:59:27<1:10:43,  2.18s/it] 71%|███████▏  | 4836/6779 [2:59:29<1:09:52,  2.16s/it]                                                       {'loss': 1.6347, 'learning_rate': 7.80208279906228e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4836/6779 [2:59:29<1:09:52,  2.16s/it] 71%|███████▏  | 4837/6779 [2:59:31<1:08:23,  2.11s/it]                                                       {'loss': 1.6997, 'learning_rate': 7.794628977935898e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4837/6779 [2:59:31<1:08:23,  2.11s/it] 71%|███████▏  | 4838/6779 [2:59:34<1:15:15,  2.33s/it]                                                       {'loss': 1.6726, 'learning_rate': 7.787177857207874e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4838/6779 [2:59:34<1:15:15,  2.33s/it] 71%|███████▏  | 4839/6779 [2:59:36<1:13:29,  2.27s/it]                                                       {'loss': 1.7049, 'learning_rate': 7.779729438526759e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4839/6779 [2:59:36<1:13:29,  2.27s/it] 71%|███████▏  | 4840/6779 [2:59:38<1:13:18,  2.27s/it]                                                       {'loss': 1.6758, 'learning_rate': 7.772283723540474e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4840/6779 [2:59:38<1:13:18,  2.27s/it] 71%|███████▏  | 4841/6779 [2:59:40<1:11:51,  2.22s/it]                                                       {'loss': 1.6391, 'learning_rate': 7.764840713896374e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4841/6779 [2:59:40<1:11:51,  2.22s/it] 71%|███████▏  | 4842/6779 [2:59:43<1:14:16,  2.30s/it]                                                       {'loss': 1.7725, 'learning_rate': 7.757400411241187e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4842/6779 [2:59:43<1:14:16,  2.30s/it] 71%|███████▏  | 4843/6779 [2:59:45<1:12:44,  2.25s/it]                                                       {'loss': 1.6171, 'learning_rate': 7.749962817221062e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4843/6779 [2:59:45<1:12:44,  2.25s/it] 71%|███████▏  | 4844/6779 [2:59:48<1:15:21,  2.34s/it]                                                       {'loss': 1.6737, 'learning_rate': 7.742527933481552e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4844/6779 [2:59:48<1:15:21,  2.34s/it] 71%|███████▏  | 4845/6779 [2:59:50<1:14:43,  2.32s/it]                                                       {'loss': 1.7048, 'learning_rate': 7.735095761667581e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4845/6779 [2:59:50<1:14:43,  2.32s/it] 71%|███████▏  | 4846/6779 [2:59:52<1:15:46,  2.35s/it]                                                       {'loss': 1.7201, 'learning_rate': 7.727666303423512e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4846/6779 [2:59:52<1:15:46,  2.35s/it] 72%|███████▏  | 4847/6779 [2:59:54<1:12:34,  2.25s/it]                                                       {'loss': 1.6348, 'learning_rate': 7.720239560393073e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4847/6779 [2:59:54<1:12:34,  2.25s/it] 72%|███████▏  | 4848/6779 [2:59:57<1:12:36,  2.26s/it]                                                       {'loss': 1.8529, 'learning_rate': 7.712815534219417e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4848/6779 [2:59:57<1:12:36,  2.26s/it] 72%|███████▏  | 4849/6779 [2:59:59<1:11:58,  2.24s/it]                                                       {'loss': 1.6316, 'learning_rate': 7.705394226545077e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4849/6779 [2:59:59<1:11:58,  2.24s/it] 72%|███████▏  | 4850/6779 [3:00:01<1:10:46,  2.20s/it]                                                       {'loss': 1.611, 'learning_rate': 7.697975639011998e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4850/6779 [3:00:01<1:10:46,  2.20s/it] 72%|███████▏  | 4851/6779 [3:00:03<1:11:32,  2.23s/it]                                                       {'loss': 1.5338, 'learning_rate': 7.690559773261523e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4851/6779 [3:00:03<1:11:32,  2.23s/it] 72%|███████▏  | 4852/6779 [3:00:05<1:10:23,  2.19s/it]                                                       {'loss': 1.6098, 'learning_rate': 7.683146630934377e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4852/6779 [3:00:05<1:10:23,  2.19s/it] 72%|███████▏  | 4853/6779 [3:00:07<1:10:01,  2.18s/it]                                                       {'loss': 1.5061, 'learning_rate': 7.675736213670705e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4853/6779 [3:00:07<1:10:01,  2.18s/it] 72%|███████▏  | 4854/6779 [3:00:10<1:10:36,  2.20s/it]                                                       {'loss': 1.7394, 'learning_rate': 7.668328523110027e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4854/6779 [3:00:10<1:10:36,  2.20s/it] 72%|███████▏  | 4855/6779 [3:00:12<1:10:41,  2.20s/it]                                                       {'loss': 1.6303, 'learning_rate': 7.66092356089128e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4855/6779 [3:00:12<1:10:41,  2.20s/it] 72%|███████▏  | 4856/6779 [3:00:14<1:08:30,  2.14s/it]                                                       {'loss': 1.5544, 'learning_rate': 7.653521328652775e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4856/6779 [3:00:14<1:08:30,  2.14s/it] 72%|███████▏  | 4857/6779 [3:00:16<1:08:58,  2.15s/it]                                                       {'loss': 1.6884, 'learning_rate': 7.64612182803224e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4857/6779 [3:00:16<1:08:58,  2.15s/it] 72%|███████▏  | 4858/6779 [3:00:18<1:09:14,  2.16s/it]                                                       {'loss': 1.6255, 'learning_rate': 7.638725060666796e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4858/6779 [3:00:18<1:09:14,  2.16s/it] 72%|███████▏  | 4859/6779 [3:00:20<1:07:54,  2.12s/it]                                                       {'loss': 1.7071, 'learning_rate': 7.631331028192941e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4859/6779 [3:00:20<1:07:54,  2.12s/it] 72%|███████▏  | 4860/6779 [3:00:22<1:07:15,  2.10s/it]                                                       {'loss': 1.7119, 'learning_rate': 7.623939732246592e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4860/6779 [3:00:22<1:07:15,  2.10s/it] 72%|███████▏  | 4861/6779 [3:00:25<1:08:30,  2.14s/it]                                                       {'loss': 1.5591, 'learning_rate': 7.616551174463038e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4861/6779 [3:00:25<1:08:30,  2.14s/it] 72%|███████▏  | 4862/6779 [3:00:27<1:08:38,  2.15s/it]                                                       {'loss': 1.6119, 'learning_rate': 7.609165356476986e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4862/6779 [3:00:27<1:08:38,  2.15s/it] 72%|███████▏  | 4863/6779 [3:00:29<1:08:24,  2.14s/it]                                                       {'loss': 1.7885, 'learning_rate': 7.601782279922509e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4863/6779 [3:00:29<1:08:24,  2.14s/it] 72%|███████▏  | 4864/6779 [3:00:31<1:10:34,  2.21s/it]                                                       {'loss': 1.6723, 'learning_rate': 7.594401946433096e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4864/6779 [3:00:31<1:10:34,  2.21s/it] 72%|███████▏  | 4865/6779 [3:00:33<1:11:02,  2.23s/it]                                                       {'loss': 1.6808, 'learning_rate': 7.58702435764163e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4865/6779 [3:00:33<1:11:02,  2.23s/it] 72%|███████▏  | 4866/6779 [3:00:36<1:10:00,  2.20s/it]                                                       {'loss': 1.7456, 'learning_rate': 7.579649515180362e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4866/6779 [3:00:36<1:10:00,  2.20s/it] 72%|███████▏  | 4867/6779 [3:00:38<1:12:12,  2.27s/it]                                                       {'loss': 1.6805, 'learning_rate': 7.572277420680968e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4867/6779 [3:00:38<1:12:12,  2.27s/it] 72%|███████▏  | 4868/6779 [3:00:40<1:09:04,  2.17s/it]                                                       {'loss': 1.4072, 'learning_rate': 7.564908075774486e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4868/6779 [3:00:40<1:09:04,  2.17s/it] 72%|███████▏  | 4869/6779 [3:00:42<1:09:01,  2.17s/it]                                                       {'loss': 1.552, 'learning_rate': 7.557541482091371e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4869/6779 [3:00:42<1:09:01,  2.17s/it] 72%|███████▏  | 4870/6779 [3:00:44<1:08:59,  2.17s/it]                                                       {'loss': 1.6631, 'learning_rate': 7.550177641261444e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4870/6779 [3:00:44<1:08:59,  2.17s/it] 72%|███████▏  | 4871/6779 [3:00:46<1:07:30,  2.12s/it]                                                       {'loss': 1.4785, 'learning_rate': 7.542816554913939e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4871/6779 [3:00:46<1:07:30,  2.12s/it] 72%|███████▏  | 4872/6779 [3:00:49<1:09:08,  2.18s/it]                                                       {'loss': 1.7449, 'learning_rate': 7.535458224677478e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4872/6779 [3:00:49<1:09:08,  2.18s/it] 72%|███████▏  | 4873/6779 [3:00:51<1:11:34,  2.25s/it]                                                       {'loss': 1.6819, 'learning_rate': 7.528102652180058e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4873/6779 [3:00:51<1:11:34,  2.25s/it] 72%|███████▏  | 4874/6779 [3:00:53<1:11:24,  2.25s/it]                                                       {'loss': 1.6942, 'learning_rate': 7.520749839049081e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4874/6779 [3:00:53<1:11:24,  2.25s/it] 72%|███████▏  | 4875/6779 [3:00:55<1:10:18,  2.22s/it]                                                       {'loss': 1.6517, 'learning_rate': 7.513399786911325e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4875/6779 [3:00:55<1:10:18,  2.22s/it] 72%|███████▏  | 4876/6779 [3:00:57<1:08:47,  2.17s/it]                                                       {'loss': 1.6167, 'learning_rate': 7.50605249739298e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4876/6779 [3:00:57<1:08:47,  2.17s/it] 72%|███████▏  | 4877/6779 [3:01:00<1:09:27,  2.19s/it]                                                       {'loss': 1.5353, 'learning_rate': 7.498707972119592e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4877/6779 [3:01:00<1:09:27,  2.19s/it] 72%|███████▏  | 4878/6779 [3:01:03<1:18:59,  2.49s/it]                                                       {'loss': 1.564, 'learning_rate': 7.49136621271612e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4878/6779 [3:01:03<1:18:59,  2.49s/it] 72%|███████▏  | 4879/6779 [3:01:05<1:16:48,  2.43s/it]                                                       {'loss': 1.5592, 'learning_rate': 7.484027220806907e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4879/6779 [3:01:05<1:16:48,  2.43s/it] 72%|███████▏  | 4880/6779 [3:01:07<1:13:40,  2.33s/it]                                                       {'loss': 1.5412, 'learning_rate': 7.476690998015686e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4880/6779 [3:01:07<1:13:40,  2.33s/it] 72%|███████▏  | 4881/6779 [3:01:10<1:12:56,  2.31s/it]                                                       {'loss': 1.6047, 'learning_rate': 7.469357545965563e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4881/6779 [3:01:10<1:12:56,  2.31s/it] 72%|███████▏  | 4882/6779 [3:01:12<1:11:23,  2.26s/it]                                                       {'loss': 1.5876, 'learning_rate': 7.462026866279039e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4882/6779 [3:01:12<1:11:23,  2.26s/it] 72%|███████▏  | 4883/6779 [3:01:14<1:10:30,  2.23s/it]                                                       {'loss': 1.6752, 'learning_rate': 7.454698960578012e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4883/6779 [3:01:14<1:10:30,  2.23s/it] 72%|███████▏  | 4884/6779 [3:01:16<1:11:12,  2.25s/it]                                                       {'loss': 1.6711, 'learning_rate': 7.447373830483748e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4884/6779 [3:01:16<1:11:12,  2.25s/it] 72%|███████▏  | 4885/6779 [3:01:18<1:09:15,  2.19s/it]                                                       {'loss': 1.4842, 'learning_rate': 7.44005147761691e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4885/6779 [3:01:18<1:09:15,  2.19s/it] 72%|███████▏  | 4886/6779 [3:01:20<1:06:45,  2.12s/it]                                                       {'loss': 1.6119, 'learning_rate': 7.432731903597545e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4886/6779 [3:01:20<1:06:45,  2.12s/it] 72%|███████▏  | 4887/6779 [3:01:22<1:07:49,  2.15s/it]                                                       {'loss': 1.6855, 'learning_rate': 7.425415110045096e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4887/6779 [3:01:22<1:07:49,  2.15s/it] 72%|███████▏  | 4888/6779 [3:01:25<1:07:26,  2.14s/it]                                                       {'loss': 1.7287, 'learning_rate': 7.418101098578363e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4888/6779 [3:01:25<1:07:26,  2.14s/it] 72%|███████▏  | 4889/6779 [3:01:27<1:07:32,  2.14s/it]                                                       {'loss': 1.5061, 'learning_rate': 7.41078987081556e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4889/6779 [3:01:27<1:07:32,  2.14s/it] 72%|███████▏  | 4890/6779 [3:01:29<1:08:22,  2.17s/it]                                                       {'loss': 1.5211, 'learning_rate': 7.403481428374266e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4890/6779 [3:01:29<1:08:22,  2.17s/it] 72%|███████▏  | 4891/6779 [3:01:31<1:11:34,  2.27s/it]                                                       {'loss': 1.4737, 'learning_rate': 7.396175772871446e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4891/6779 [3:01:31<1:11:34,  2.27s/it] 72%|███████▏  | 4892/6779 [3:01:34<1:11:09,  2.26s/it]                                                       {'loss': 1.8717, 'learning_rate': 7.388872905923454e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4892/6779 [3:01:34<1:11:09,  2.26s/it] 72%|███████▏  | 4893/6779 [3:01:36<1:11:26,  2.27s/it]                                                       {'loss': 1.6541, 'learning_rate': 7.381572829146029e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4893/6779 [3:01:36<1:11:26,  2.27s/it] 72%|███████▏  | 4894/6779 [3:01:38<1:12:09,  2.30s/it]                                                       {'loss': 1.6881, 'learning_rate': 7.374275544154293e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4894/6779 [3:01:38<1:12:09,  2.30s/it] 72%|███████▏  | 4895/6779 [3:01:41<1:11:43,  2.28s/it]                                                       {'loss': 1.4826, 'learning_rate': 7.366981052562736e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4895/6779 [3:01:41<1:11:43,  2.28s/it] 72%|███████▏  | 4896/6779 [3:01:43<1:11:26,  2.28s/it]                                                       {'loss': 1.7081, 'learning_rate': 7.359689355985253e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4896/6779 [3:01:43<1:11:26,  2.28s/it] 72%|███████▏  | 4897/6779 [3:01:45<1:13:31,  2.34s/it]                                                       {'loss': 1.5743, 'learning_rate': 7.352400456035094e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4897/6779 [3:01:45<1:13:31,  2.34s/it] 72%|███████▏  | 4898/6779 [3:01:47<1:11:03,  2.27s/it]                                                       {'loss': 1.5192, 'learning_rate': 7.345114354324918e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4898/6779 [3:01:47<1:11:03,  2.27s/it] 72%|███████▏  | 4899/6779 [3:01:50<1:09:34,  2.22s/it]                                                       {'loss': 1.6082, 'learning_rate': 7.337831052466737e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4899/6779 [3:01:50<1:09:34,  2.22s/it] 72%|███████▏  | 4900/6779 [3:01:52<1:07:47,  2.16s/it]                                                       {'loss': 1.7096, 'learning_rate': 7.330550552071964e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4900/6779 [3:01:52<1:07:47,  2.16s/it] 72%|███████▏  | 4901/6779 [3:01:54<1:07:13,  2.15s/it]                                                       {'loss': 1.7195, 'learning_rate': 7.323272854751395e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4901/6779 [3:01:54<1:07:13,  2.15s/it] 72%|███████▏  | 4902/6779 [3:01:56<1:06:44,  2.13s/it]                                                       {'loss': 1.7857, 'learning_rate': 7.315997962115183e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4902/6779 [3:01:56<1:06:44,  2.13s/it] 72%|███████▏  | 4903/6779 [3:01:58<1:07:57,  2.17s/it]                                                       {'loss': 1.7462, 'learning_rate': 7.308725875772884e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4903/6779 [3:01:58<1:07:57,  2.17s/it] 72%|███████▏  | 4904/6779 [3:02:00<1:07:11,  2.15s/it]                                                       {'loss': 1.6169, 'learning_rate': 7.301456597333412e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4904/6779 [3:02:00<1:07:11,  2.15s/it] 72%|███████▏  | 4905/6779 [3:02:02<1:06:41,  2.14s/it]                                                       {'loss': 1.5507, 'learning_rate': 7.294190128405086e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4905/6779 [3:02:02<1:06:41,  2.14s/it] 72%|███████▏  | 4906/6779 [3:02:04<1:06:55,  2.14s/it]                                                       {'loss': 1.551, 'learning_rate': 7.286926470595572e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4906/6779 [3:02:04<1:06:55,  2.14s/it] 72%|███████▏  | 4907/6779 [3:02:07<1:08:37,  2.20s/it]                                                       {'loss': 1.7934, 'learning_rate': 7.27966562551194e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4907/6779 [3:02:07<1:08:37,  2.20s/it] 72%|███████▏  | 4908/6779 [3:02:09<1:08:28,  2.20s/it]                                                       {'loss': 1.569, 'learning_rate': 7.272407594760635e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4908/6779 [3:02:09<1:08:28,  2.20s/it] 72%|███████▏  | 4909/6779 [3:02:12<1:12:22,  2.32s/it]                                                       {'loss': 1.5926, 'learning_rate': 7.265152379947457e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4909/6779 [3:02:12<1:12:22,  2.32s/it] 72%|███████▏  | 4910/6779 [3:02:14<1:10:06,  2.25s/it]                                                       {'loss': 1.7362, 'learning_rate': 7.257899982677612e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4910/6779 [3:02:14<1:10:06,  2.25s/it] 72%|███████▏  | 4911/6779 [3:02:16<1:10:15,  2.26s/it]                                                       {'loss': 1.6547, 'learning_rate': 7.25065040455566e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4911/6779 [3:02:16<1:10:15,  2.26s/it] 72%|███████▏  | 4912/6779 [3:02:18<1:11:13,  2.29s/it]                                                       {'loss': 1.9265, 'learning_rate': 7.243403647185552e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4912/6779 [3:02:18<1:11:13,  2.29s/it] 72%|███████▏  | 4913/6779 [3:02:20<1:09:09,  2.22s/it]                                                       {'loss': 1.5729, 'learning_rate': 7.236159712170602e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4913/6779 [3:02:20<1:09:09,  2.22s/it] 72%|███████▏  | 4914/6779 [3:02:22<1:08:21,  2.20s/it]                                                       {'loss': 1.8644, 'learning_rate': 7.228918601113512e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4914/6779 [3:02:22<1:08:21,  2.20s/it] 73%|███████▎  | 4915/6779 [3:02:25<1:09:48,  2.25s/it]                                                       {'loss': 1.4587, 'learning_rate': 7.221680315616362e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4915/6779 [3:02:25<1:09:48,  2.25s/it] 73%|███████▎  | 4916/6779 [3:02:27<1:10:14,  2.26s/it]                                                       {'loss': 1.6476, 'learning_rate': 7.214444857280582e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4916/6779 [3:02:27<1:10:14,  2.26s/it] 73%|███████▎  | 4917/6779 [3:02:30<1:11:48,  2.31s/it]                                                       {'loss': 1.6945, 'learning_rate': 7.207212227707013e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4917/6779 [3:02:30<1:11:48,  2.31s/it] 73%|███████▎  | 4918/6779 [3:02:32<1:15:35,  2.44s/it]                                                       {'loss': 1.4538, 'learning_rate': 7.199982428495828e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4918/6779 [3:02:32<1:15:35,  2.44s/it] 73%|███████▎  | 4919/6779 [3:02:34<1:13:35,  2.37s/it]                                                       {'loss': 1.5705, 'learning_rate': 7.192755461246619e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4919/6779 [3:02:35<1:13:35,  2.37s/it] 73%|███████▎  | 4920/6779 [3:02:37<1:10:26,  2.27s/it]                                                       {'loss': 1.748, 'learning_rate': 7.18553132755831e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4920/6779 [3:02:37<1:10:26,  2.27s/it] 73%|���██████▎  | 4921/6779 [3:02:39<1:09:32,  2.25s/it]                                                       {'loss': 1.6486, 'learning_rate': 7.178310029029227e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4921/6779 [3:02:39<1:09:32,  2.25s/it] 73%|███████▎  | 4922/6779 [3:02:41<1:07:56,  2.20s/it]                                                       {'loss': 1.4553, 'learning_rate': 7.171091567257062e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4922/6779 [3:02:41<1:07:56,  2.20s/it] 73%|███████▎  | 4923/6779 [3:02:43<1:06:08,  2.14s/it]                                                       {'loss': 1.5303, 'learning_rate': 7.163875943838865e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4923/6779 [3:02:43<1:06:08,  2.14s/it] 73%|███████▎  | 4924/6779 [3:02:45<1:07:35,  2.19s/it]                                                       {'loss': 1.4854, 'learning_rate': 7.15666316037108e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4924/6779 [3:02:45<1:07:35,  2.19s/it] 73%|███████▎  | 4925/6779 [3:02:47<1:07:43,  2.19s/it]                                                       {'loss': 1.5817, 'learning_rate': 7.149453218449502e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4925/6779 [3:02:47<1:07:43,  2.19s/it] 73%|███████▎  | 4926/6779 [3:02:50<1:07:48,  2.20s/it]                                                       {'loss': 1.6001, 'learning_rate': 7.142246119669318e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4926/6779 [3:02:50<1:07:48,  2.20s/it] 73%|███████▎  | 4927/6779 [3:02:52<1:06:51,  2.17s/it]                                                       {'loss': 1.7317, 'learning_rate': 7.13504186562506e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4927/6779 [3:02:52<1:06:51,  2.17s/it] 73%|███████▎  | 4928/6779 [3:02:54<1:06:09,  2.14s/it]                                                       {'loss': 1.6285, 'learning_rate': 7.127840457910658e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4928/6779 [3:02:54<1:06:09,  2.14s/it] 73%|███████▎  | 4929/6779 [3:02:56<1:08:20,  2.22s/it]                                                       {'loss': 1.5665, 'learning_rate': 7.1206418981194e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4929/6779 [3:02:56<1:08:20,  2.22s/it] 73%|███████▎  | 4930/6779 [3:02:58<1:08:06,  2.21s/it]                                                       {'loss': 1.6216, 'learning_rate': 7.113446187843933e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4930/6779 [3:02:58<1:08:06,  2.21s/it] 73%|███████▎  | 4931/6779 [3:03:00<1:07:21,  2.19s/it]                                                       {'loss': 1.6589, 'learning_rate': 7.1062533286763e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4931/6779 [3:03:00<1:07:21,  2.19s/it] 73%|███████▎  | 4932/6779 [3:03:02<1:06:21,  2.16s/it]                                                       {'loss': 1.5715, 'learning_rate': 7.099063322207881e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4932/6779 [3:03:02<1:06:21,  2.16s/it] 73%|███████▎  | 4933/6779 [3:03:05<1:06:16,  2.15s/it]                                                       {'loss': 1.6609, 'learning_rate': 7.091876170029457e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4933/6779 [3:03:05<1:06:16,  2.15s/it] 73%|███████▎  | 4934/6779 [3:03:07<1:08:38,  2.23s/it]                                                       {'loss': 1.7406, 'learning_rate': 7.08469187373114e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4934/6779 [3:03:07<1:08:38,  2.23s/it] 73%|███████▎  | 4935/6779 [3:03:09<1:08:36,  2.23s/it]                                                       {'loss': 1.6629, 'learning_rate': 7.077510434902459e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4935/6779 [3:03:09<1:08:36,  2.23s/it] 73%|███████▎  | 4936/6779 [3:03:11<1:06:46,  2.17s/it]                                                       {'loss': 1.5239, 'learning_rate': 7.070331855132271e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4936/6779 [3:03:11<1:06:46,  2.17s/it] 73%|███████▎  | 4937/6779 [3:03:13<1:06:36,  2.17s/it]                                                       {'loss': 1.6526, 'learning_rate': 7.063156136008809e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4937/6779 [3:03:13<1:06:36,  2.17s/it] 73%|███████▎  | 4938/6779 [3:03:15<1:04:42,  2.11s/it]                                                       {'loss': 1.7704, 'learning_rate': 7.055983279119684e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4938/6779 [3:03:15<1:04:42,  2.11s/it] 73%|███████▎  | 4939/6779 [3:03:18<1:05:00,  2.12s/it]                                                       {'loss': 1.7759, 'learning_rate': 7.048813286051861e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4939/6779 [3:03:18<1:05:00,  2.12s/it] 73%|███████▎  | 4940/6779 [3:03:20<1:04:07,  2.09s/it]                                                       {'loss': 1.7439, 'learning_rate': 7.041646158391687e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4940/6779 [3:03:20<1:04:07,  2.09s/it] 73%|███████▎  | 4941/6779 [3:03:22<1:04:19,  2.10s/it]                                                       {'loss': 1.5989, 'learning_rate': 7.034481897724852e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4941/6779 [3:03:22<1:04:19,  2.10s/it] 73%|███████▎  | 4942/6779 [3:03:24<1:03:17,  2.07s/it]                                                       {'loss': 1.4862, 'learning_rate': 7.027320505636434e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4942/6779 [3:03:24<1:03:17,  2.07s/it] 73%|███████▎  | 4943/6779 [3:03:26<1:03:58,  2.09s/it]                                                       {'loss': 1.6627, 'learning_rate': 7.020161983710874e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4943/6779 [3:03:26<1:03:58,  2.09s/it] 73%|███████▎  | 4944/6779 [3:03:28<1:04:14,  2.10s/it]                                                       {'loss': 1.6727, 'learning_rate': 7.013006333531955e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4944/6779 [3:03:28<1:04:14,  2.10s/it] 73%|███████▎  | 4945/6779 [3:03:30<1:07:14,  2.20s/it]                                                       {'loss': 1.7569, 'learning_rate': 7.005853556682857e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4945/6779 [3:03:30<1:07:14,  2.20s/it] 73%|███████▎  | 4946/6779 [3:03:33<1:08:04,  2.23s/it]                                                       {'loss': 1.6651, 'learning_rate': 6.998703654746097e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4946/6779 [3:03:33<1:08:04,  2.23s/it] 73%|███████▎  | 4947/6779 [3:03:35<1:06:49,  2.19s/it]                                                       {'loss': 1.6442, 'learning_rate': 6.991556629303578e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4947/6779 [3:03:35<1:06:49,  2.19s/it] 73%|███████▎  | 4948/6779 [3:03:37<1:06:04,  2.17s/it]                                                       {'loss': 1.6468, 'learning_rate': 6.984412481936542e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4948/6779 [3:03:37<1:06:04,  2.17s/it] 73%|███████▎  | 4949/6779 [3:03:39<1:08:32,  2.25s/it]                                                       {'loss': 1.752, 'learning_rate': 6.977271214225618e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4949/6779 [3:03:39<1:08:32,  2.25s/it] 73%|███████▎  | 4950/6779 [3:03:41<1:06:53,  2.19s/it]                                                       {'loss': 1.6005, 'learning_rate': 6.970132827750784e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4950/6779 [3:03:41<1:06:53,  2.19s/it] 73%|███████▎  | 4951/6779 [3:03:44<1:07:35,  2.22s/it]                                                       {'loss': 1.7786, 'learning_rate': 6.962997324091393e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4951/6779 [3:03:44<1:07:35,  2.22s/it] 73%|███████▎  | 4952/6779 [3:03:46<1:08:44,  2.26s/it]                                                       {'loss': 1.6897, 'learning_rate': 6.955864704826149e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4952/6779 [3:03:46<1:08:44,  2.26s/it] 73%|███████▎  | 4953/6779 [3:03:48<1:08:46,  2.26s/it]                                                       {'loss': 1.9344, 'learning_rate': 6.948734971533108e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4953/6779 [3:03:48<1:08:46,  2.26s/it] 73%|███████▎  | 4954/6779 [3:03:51<1:08:59,  2.27s/it]                                                       {'loss': 1.51, 'learning_rate': 6.941608125789718e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4954/6779 [3:03:51<1:08:59,  2.27s/it] 73%|███████▎  | 4955/6779 [3:03:53<1:05:55,  2.17s/it]                                                       {'loss': 1.4182, 'learning_rate': 6.934484169172755e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4955/6779 [3:03:53<1:05:55,  2.17s/it] 73%|███████▎  | 4956/6779 [3:03:55<1:06:13,  2.18s/it]                                                       {'loss': 1.7939, 'learning_rate': 6.927363103258376e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4956/6779 [3:03:55<1:06:13,  2.18s/it] 73%|███████▎  | 4957/6779 [3:03:57<1:06:27,  2.19s/it]                                                       {'loss': 1.5745, 'learning_rate': 6.920244929622095e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4957/6779 [3:03:57<1:06:27,  2.19s/it] 73%|███████▎  | 4958/6779 [3:03:59<1:06:26,  2.19s/it]                                                       {'loss': 1.4545, 'learning_rate': 6.913129649838795e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4958/6779 [3:03:59<1:06:26,  2.19s/it] 73%|███████▎  | 4959/6779 [3:04:01<1:06:34,  2.19s/it]                                                       {'loss': 1.8378, 'learning_rate': 6.90601726548269e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4959/6779 [3:04:01<1:06:34,  2.19s/it] 73%|███████▎  | 4960/6779 [3:04:04<1:07:27,  2.23s/it]                                                       {'loss': 1.5849, 'learning_rate': 6.898907778127384e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4960/6779 [3:04:04<1:07:27,  2.23s/it] 73%|███████▎  | 4961/6779 [3:04:06<1:08:16,  2.25s/it]                                                       {'loss': 1.606, 'learning_rate': 6.891801189345826e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4961/6779 [3:04:06<1:08:16,  2.25s/it] 73%|███████▎  | 4962/6779 [3:04:08<1:07:00,  2.21s/it]                                                       {'loss': 1.56, 'learning_rate': 6.884697500710318e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4962/6779 [3:04:08<1:07:00,  2.21s/it] 73%|███████▎  | 4963/6779 [3:04:10<1:08:17,  2.26s/it]                                                       {'loss': 1.6846, 'learning_rate': 6.877596713792532e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4963/6779 [3:04:10<1:08:17,  2.26s/it] 73%|███████▎  | 4964/6779 [3:04:13<1:07:51,  2.24s/it]                                                       {'loss': 1.7439, 'learning_rate': 6.870498830163492e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4964/6779 [3:04:13<1:07:51,  2.24s/it] 73%|███████▎  | 4965/6779 [3:04:15<1:06:04,  2.19s/it]                                                       {'loss': 1.6387, 'learning_rate': 6.863403851393594e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4965/6779 [3:04:15<1:06:04,  2.19s/it] 73%|███████▎  | 4966/6779 [3:04:17<1:06:14,  2.19s/it]                                                       {'loss': 1.6617, 'learning_rate': 6.856311779052563e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4966/6779 [3:04:17<1:06:14,  2.19s/it] 73%|███████▎  | 4967/6779 [3:04:19<1:07:00,  2.22s/it]                                                       {'loss': 1.6794, 'learning_rate': 6.849222614709509e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4967/6779 [3:04:19<1:07:00,  2.22s/it] 73%|███████▎  | 4968/6779 [3:04:21<1:05:51,  2.18s/it]                                                       {'loss': 1.7147, 'learning_rate': 6.842136359932873e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4968/6779 [3:04:21<1:05:51,  2.18s/it] 73%|███████▎  | 4969/6779 [3:04:24<1:07:25,  2.24s/it]                                                       {'loss': 1.6966, 'learning_rate': 6.835053016290482e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4969/6779 [3:04:24<1:07:25,  2.24s/it] 73%|███████▎  | 4970/6779 [3:04:26<1:06:09,  2.19s/it]                                                       {'loss': 1.5878, 'learning_rate': 6.827972585349486e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4970/6779 [3:04:26<1:06:09,  2.19s/it] 73%|███████▎  | 4971/6779 [3:04:28<1:07:27,  2.24s/it]                                                       {'loss': 1.5479, 'learning_rate': 6.820895068676414e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4971/6779 [3:04:28<1:07:27,  2.24s/it] 73%|███████▎  | 4972/6779 [3:04:30<1:07:58,  2.26s/it]                                                       {'loss': 1.712, 'learning_rate': 6.813820467837153e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4972/6779 [3:04:30<1:07:58,  2.26s/it] 73%|███████▎  | 4973/6779 [3:04:33<1:08:19,  2.27s/it]                                                       {'loss': 1.7339, 'learning_rate': 6.806748784396918e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4973/6779 [3:04:33<1:08:19,  2.27s/it] 73%|███████▎  | 4974/6779 [3:04:35<1:08:46,  2.29s/it]                                                       {'loss': 1.6201, 'learning_rate': 6.799680019920311e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4974/6779 [3:04:35<1:08:46,  2.29s/it] 73%|███████▎  | 4975/6779 [3:04:37<1:07:15,  2.24s/it]                                                       {'loss': 1.7698, 'learning_rate': 6.792614175971261e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4975/6779 [3:04:37<1:07:15,  2.24s/it] 73%|███████▎  | 4976/6779 [3:04:39<1:08:02,  2.26s/it]                                                       {'loss': 1.5584, 'learning_rate': 6.785551254113073e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4976/6779 [3:04:39<1:08:02,  2.26s/it] 73%|███████▎  | 4977/6779 [3:04:42<1:07:00,  2.23s/it]                                                       {'loss': 1.4848, 'learning_rate': 6.778491255908385e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4977/6779 [3:04:42<1:07:00,  2.23s/it] 73%|███████▎  | 4978/6779 [3:04:44<1:05:27,  2.18s/it]                                                       {'loss': 1.5038, 'learning_rate': 6.771434182919205e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4978/6779 [3:04:44<1:05:27,  2.18s/it] 73%|███████▎  | 4979/6779 [3:04:46<1:05:15,  2.18s/it]                                                       {'loss': 1.7038, 'learning_rate': 6.764380036706891e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4979/6779 [3:04:46<1:05:15,  2.18s/it] 73%|███████▎  | 4980/6779 [3:04:48<1:05:03,  2.17s/it]                                                       {'loss': 1.6436, 'learning_rate': 6.75732881883214e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4980/6779 [3:04:48<1:05:03,  2.17s/it] 73%|███████▎  | 4981/6779 [3:04:50<1:04:28,  2.15s/it]                                                       {'loss': 1.7248, 'learning_rate': 6.75028053085502e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4981/6779 [3:04:50<1:04:28,  2.15s/it] 73%|███████▎  | 4982/6779 [3:04:52<1:05:51,  2.20s/it]                                                       {'loss': 1.5854, 'learning_rate': 6.743235174334935e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4982/6779 [3:04:52<1:05:51,  2.20s/it] 74%|███████▎  | 4983/6779 [3:04:54<1:02:51,  2.10s/it]                                                       {'loss': 1.6544, 'learning_rate': 6.736192750830652e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4983/6779 [3:04:54<1:02:51,  2.10s/it] 74%|███████▎  | 4984/6779 [3:04:56<1:03:18,  2.12s/it]                                                       {'loss': 1.6016, 'learning_rate': 6.729153261900277e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4984/6779 [3:04:56<1:03:18,  2.12s/it] 74%|███████▎  | 4985/6779 [3:04:59<1:04:23,  2.15s/it]                                                       {'loss': 1.4654, 'learning_rate': 6.722116709101278e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4985/6779 [3:04:59<1:04:23,  2.15s/it] 74%|███████▎  | 4986/6779 [3:05:01<1:03:26,  2.12s/it]                                                       {'loss': 1.7633, 'learning_rate': 6.715083093990475e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4986/6779 [3:05:01<1:03:26,  2.12s/it] 74%|███████▎  | 4987/6779 [3:05:03<1:02:54,  2.11s/it]                                                       {'loss': 1.6312, 'learning_rate': 6.708052418124022e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4987/6779 [3:05:03<1:02:54,  2.11s/it] 74%|███████▎  | 4988/6779 [3:05:05<1:04:14,  2.15s/it]                                                       {'loss': 1.7288, 'learning_rate': 6.701024683057446e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4988/6779 [3:05:05<1:04:14,  2.15s/it] 74%|███████▎  | 4989/6779 [3:05:08<1:07:37,  2.27s/it]                                                       {'loss': 1.6427, 'learning_rate': 6.693999890345595e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4989/6779 [3:05:08<1:07:37,  2.27s/it] 74%|███████▎  | 4990/6779 [3:05:10<1:07:12,  2.25s/it]                                                       {'loss': 1.6772, 'learning_rate': 6.686978041542696e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4990/6779 [3:05:10<1:07:12,  2.25s/it] 74%|███████▎  | 4991/6779 [3:05:13<1:10:54,  2.38s/it]                                                       {'loss': 1.5896, 'learning_rate': 6.679959138202294e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4991/6779 [3:05:13<1:10:54,  2.38s/it] 74%|███████▎  | 4992/6779 [3:05:15<1:08:14,  2.29s/it]                                                       {'loss': 1.7846, 'learning_rate': 6.672943181877309e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4992/6779 [3:05:15<1:08:14,  2.29s/it] 74%|███████▎  | 4993/6779 [3:05:17<1:06:33,  2.24s/it]                                                       {'loss': 1.5749, 'learning_rate': 6.665930174120003e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4993/6779 [3:05:17<1:06:33,  2.24s/it] 74%|███████▎  | 4994/6779 [3:05:19<1:05:32,  2.20s/it]                                                       {'loss': 1.6201, 'learning_rate': 6.658920116481969e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4994/6779 [3:05:19<1:05:32,  2.20s/it] 74%|███████▎  | 4995/6779 [3:05:21<1:05:20,  2.20s/it]                                                       {'loss': 1.7142, 'learning_rate': 6.65191301051417e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4995/6779 [3:05:21<1:05:20,  2.20s/it] 74%|███████▎  | 4996/6779 [3:05:23<1:06:41,  2.24s/it]                                                       {'loss': 1.873, 'learning_rate': 6.644908857766894e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4996/6779 [3:05:23<1:06:41,  2.24s/it] 74%|███████▎  | 4997/6779 [3:05:26<1:06:44,  2.25s/it]                                                       {'loss': 1.6486, 'learning_rate': 6.6379076597898e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4997/6779 [3:05:26<1:06:44,  2.25s/it] 74%|███████▎  | 4998/6779 [3:05:28<1:11:36,  2.41s/it]                                                       {'loss': 1.7585, 'learning_rate': 6.630909418131866e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4998/6779 [3:05:28<1:11:36,  2.41s/it] 74%|███████▎  | 4999/6779 [3:05:31<1:10:57,  2.39s/it]                                                       {'loss': 1.477, 'learning_rate': 6.623914134341438e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4999/6779 [3:05:31<1:10:57,  2.39s/it] 74%|███████▍  | 5000/6779 [3:05:33<1:08:44,  2.32s/it]                                                       {'loss': 1.7329, 'learning_rate': 6.616921809966205e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5000/6779 [3:05:33<1:08:44,  2.32s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+ 74%|███████▍  | 5001/6779 [3:05:36<1:13:30,  2.48s/it]                                                       {'loss': 1.5571, 'learning_rate': 6.609932446553184e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5001/6779 [3:05:36<1:13:30,  2.48s/it] 74%|███████▍  | 5002/6779 [3:05:38<1:10:43,  2.39s/it]                                                       {'loss': 1.7334, 'learning_rate': 6.60294604564876e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5002/6779 [3:05:38<1:10:43,  2.39s/it] 74%|███████▍  | 5003/6779 [3:05:40<1:09:56,  2.36s/it]                                                       {'loss': 1.6237, 'learning_rate': 6.595962608798638e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5003/6779 [3:05:40<1:09:56,  2.36s/it] 74%|███████▍  | 5004/6779 [3:05:42<1:07:59,  2.30s/it]                                                       {'loss': 1.6203, 'learning_rate': 6.588982137547896e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5004/6779 [3:05:42<1:07:59,  2.30s/it] 74%|███████▍  | 5005/6779 [3:05:45<1:07:01,  2.27s/it]                                                       {'loss': 1.6586, 'learning_rate': 6.582004633440921e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5005/6779 [3:05:45<1:07:01,  2.27s/it] 74%|███████▍  | 5006/6779 [3:05:47<1:05:30,  2.22s/it]                                                       {'loss': 1.645, 'learning_rate': 6.575030098021486e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5006/6779 [3:05:47<1:05:30,  2.22s/it] 74%|███████▍  | 5007/6779 [3:05:49<1:04:50,  2.20s/it]                                                       {'loss': 1.5997, 'learning_rate': 6.568058532832675e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5007/6779 [3:05:49<1:04:50,  2.20s/it] 74%|███████▍  | 5008/6779 [3:05:51<1:03:45,  2.16s/it]                                                       {'loss': 1.6367, 'learning_rate': 6.561089939416913e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5008/6779 [3:05:51<1:03:45,  2.16s/it] 74%|███████▍  | 5009/6779 [3:05:53<1:03:00,  2.14s/it]                                                       {'loss': 1.5954, 'learning_rate': 6.554124319315995e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5009/6779 [3:05:53<1:03:00,  2.14s/it] 74%|███████▍  | 5010/6779 [3:05:55<1:04:08,  2.18s/it]                                                       {'loss': 1.5253, 'learning_rate': 6.547161674071027e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5010/6779 [3:05:55<1:04:08,  2.18s/it] 74%|███████▍  | 5011/6779 [3:05:57<1:04:23,  2.19s/it]                                                       {'loss': 1.7627, 'learning_rate': 6.540202005222485e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5011/6779 [3:05:57<1:04:23,  2.19s/it] 74%|███████▍  | 5012/6779 [3:06:00<1:03:18,  2.15s/it]                                                       {'loss': 1.6635, 'learning_rate': 6.533245314310152e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5012/6779 [3:06:00<1:03:18,  2.15s/it] 74%|███████▍  | 5013/6779 [3:06:02<1:03:48,  2.17s/it]                                                       {'loss': 1.6264, 'learning_rate': 6.5262916028732e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5013/6779 [3:06:02<1:03:48,  2.17s/it] 74%|███████▍  | 5014/6779 [3:06:04<1:02:56,  2.14s/it]                                                       {'loss': 1.7376, 'learning_rate': 6.519340872450103e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5014/6779 [3:06:04<1:02:56,  2.14s/it] 74%|███████▍  | 5015/6779 [3:06:06<1:05:00,  2.21s/it]                                                       {'loss': 1.8078, 'learning_rate': 6.512393124578682e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5015/6779 [3:06:06<1:05:00,  2.21s/it] 74%|███████▍  | 5016/6779 [3:06:08<1:03:33,  2.16s/it]                                                       {'loss': 1.6393, 'learning_rate': 6.505448360796111e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5016/6779 [3:06:08<1:03:33,  2.16s/it] 74%|███████▍  | 5017/6779 [3:06:10<1:03:24,  2.16s/it]                                                       {'loss': 1.6303, 'learning_rate': 6.49850658263889e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5017/6779 [3:06:10<1:03:24,  2.16s/it] 74%|███████▍  | 5018/6779 [3:06:13<1:04:00,  2.18s/it]                                                       {'loss': 1.6282, 'learning_rate': 6.491567791642872e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5018/6779 [3:06:13<1:04:00,  2.18s/it] 74%|███████▍  | 5019/6779 [3:06:15<1:04:09,  2.19s/it]                                                       {'loss': 1.8088, 'learning_rate': 6.484631989343232e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5019/6779 [3:06:15<1:04:09,  2.19s/it] 74%|███████▍  | 5020/6779 [3:06:17<1:06:43,  2.28s/it]                                                       {'loss': 1.7001, 'learning_rate': 6.477699177274502e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5020/6779 [3:06:17<1:06:43,  2.28s/it] 74%|███████▍  | 5021/6779 [3:06:19<1:05:47,  2.25s/it]                                                       {'loss': 1.6431, 'learning_rate': 6.470769356970536e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5021/6779 [3:06:20<1:05:47,  2.25s/it] 74%|███████▍  | 5022/6779 [3:06:22<1:06:31,  2.27s/it]                                                       {'loss': 1.6589, 'learning_rate': 6.46384252996455e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5022/6779 [3:06:22<1:06:31,  2.27s/it] 74%|███████▍  | 5023/6779 [3:06:24<1:06:42,  2.28s/it]                                                       {'loss': 1.4853, 'learning_rate': 6.456918697789069e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5023/6779 [3:06:24<1:06:42,  2.28s/it] 74%|███████▍  | 5024/6779 [3:06:26<1:06:44,  2.28s/it]                                                       {'loss': 1.5816, 'learning_rate': 6.449997861975964e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5024/6779 [3:06:26<1:06:44,  2.28s/it] 74%|███████▍  | 5025/6779 [3:06:28<1:04:49,  2.22s/it]                                                       {'loss': 1.6698, 'learning_rate': 6.44308002405646e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5025/6779 [3:06:28<1:04:49,  2.22s/it] 74%|███████▍  | 5026/6779 [3:06:31<1:04:10,  2.20s/it]                                                       {'loss': 1.6767, 'learning_rate': 6.436165185561094e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5026/6779 [3:06:31<1:04:10,  2.20s/it] 74%|███████▍  | 5027/6779 [3:06:33<1:02:45,  2.15s/it]                                                       {'loss': 1.7288, 'learning_rate': 6.429253348019755e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5027/6779 [3:06:33<1:02:45,  2.15s/it] 74%|███████▍  | 5028/6779 [3:06:35<1:02:05,  2.13s/it]                                                       {'loss': 1.7162, 'learning_rate': 6.422344512961669e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5028/6779 [3:06:35<1:02:05,  2.13s/it] 74%|███████▍  | 5029/6779 [3:06:37<1:01:21,  2.10s/it]                                                       {'loss': 1.6208, 'learning_rate': 6.415438681915393e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5029/6779 [3:06:37<1:01:21,  2.10s/it] 74%|███████▍  | 5030/6779 [3:06:39<1:02:43,  2.15s/it]                                                       {'loss': 2.002, 'learning_rate': 6.408535856408812e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5030/6779 [3:06:39<1:02:43,  2.15s/it] 74%|███████▍  | 5031/6779 [3:06:41<1:03:03,  2.16s/it]                                                       {'loss': 1.8748, 'learning_rate': 6.401636037969167e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5031/6779 [3:06:41<1:03:03,  2.16s/it] 74%|███████▍  | 5032/6779 [3:06:43<1:03:16,  2.17s/it]                                                       {'loss': 1.5647, 'learning_rate': 6.39473922812301e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5032/6779 [3:06:43<1:03:16,  2.17s/it] 74%|███████▍  | 5033/6779 [3:06:46<1:02:14,  2.14s/it]                                                       {'loss': 1.7607, 'learning_rate': 6.387845428396234e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5033/6779 [3:06:46<1:02:14,  2.14s/it] 74%|███████▍  | 5034/6779 [3:06:48<1:03:03,  2.17s/it]                                                       {'loss': 1.5758, 'learning_rate': 6.380954640314074e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5034/6779 [3:06:48<1:03:03,  2.17s/it] 74%|███████▍  | 5035/6779 [3:06:50<1:05:38,  2.26s/it]                                                       {'loss': 1.7128, 'learning_rate': 6.374066865401094e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5035/6779 [3:06:50<1:05:38,  2.26s/it] 74%|███████▍  | 5036/6779 [3:06:52<1:04:57,  2.24s/it]                                                       {'loss': 1.6606, 'learning_rate': 6.3671821051812e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5036/6779 [3:06:52<1:04:57,  2.24s/it] 74%|███████▍  | 5037/6779 [3:06:55<1:04:46,  2.23s/it]                                                       {'loss': 1.7893, 'learning_rate': 6.360300361177609e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5037/6779 [3:06:55<1:04:46,  2.23s/it] 74%|███████▍  | 5038/6779 [3:06:57<1:03:42,  2.20s/it]                                                       {'loss': 1.6489, 'learning_rate': 6.353421634912897e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5038/6779 [3:06:57<1:03:42,  2.20s/it] 74%|███████▍  | 5039/6779 [3:06:59<1:03:06,  2.18s/it]                                                       {'loss': 1.5724, 'learning_rate': 6.34654592790895e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5039/6779 [3:06:59<1:03:06,  2.18s/it] 74%|███████▍  | 5040/6779 [3:07:01<1:04:24,  2.22s/it]                                                       {'loss': 1.8249, 'learning_rate': 6.339673241687e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5040/6779 [3:07:01<1:04:24,  2.22s/it] 74%|███████▍  | 5041/6779 [3:07:04<1:06:19,  2.29s/it]                                                       {'loss': 1.5819, 'learning_rate': 6.332803577767603e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5041/6779 [3:07:04<1:06:19,  2.29s/it] 74%|███████▍  | 5042/6779 [3:07:06<1:05:11,  2.25s/it]                                                       {'loss': 1.6146, 'learning_rate': 6.325936937670651e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5042/6779 [3:07:06<1:05:11,  2.25s/it] 74%|███████▍  | 5043/6779 [3:07:08<1:06:11,  2.29s/it]                                                       {'loss': 1.7469, 'learning_rate': 6.319073322915374e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5043/6779 [3:07:08<1:06:11,  2.29s/it] 74%|███████▍  | 5044/6779 [3:07:10<1:04:57,  2.25s/it]                                                       {'loss': 1.4624, 'learning_rate': 6.312212735020309e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5044/6779 [3:07:10<1:04:57,  2.25s/it] 74%|███████▍  | 5045/6779 [3:07:13<1:05:31,  2.27s/it]                                                       {'loss': 1.8383, 'learning_rate': 6.305355175503353e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5045/6779 [3:07:13<1:05:31,  2.27s/it] 74%|███████▍  | 5046/6779 [3:07:15<1:03:15,  2.19s/it]                                                       {'loss': 1.6151, 'learning_rate': 6.298500645881706e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5046/6779 [3:07:15<1:03:15,  2.19s/it] 74%|███████▍  | 5047/6779 [3:07:17<1:01:27,  2.13s/it]                                                       {'loss': 1.5753, 'learning_rate': 6.291649147671926e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5047/6779 [3:07:17<1:01:27,  2.13s/it] 74%|███████▍  | 5048/6779 [3:07:19<1:01:21,  2.13s/it]                                                       {'loss': 1.7, 'learning_rate': 6.284800682389864e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5048/6779 [3:07:19<1:01:21,  2.13s/it] 74%|███████▍  | 5049/6779 [3:07:21<1:04:20,  2.23s/it]                                                       {'loss': 1.5963, 'learning_rate': 6.277955251550733e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5049/6779 [3:07:21<1:04:20,  2.23s/it] 74%|███████▍  | 5050/6779 [3:07:24<1:04:54,  2.25s/it]                                                       {'loss': 1.7301, 'learning_rate': 6.271112856669068e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5050/6779 [3:07:24<1:04:54,  2.25s/it] 75%|███████▍  | 5051/6779 [3:07:26<1:09:42,  2.42s/it]                                                       {'loss': 1.5522, 'learning_rate': 6.26427349925871e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5051/6779 [3:07:26<1:09:42,  2.42s/it] 75%|███████▍  | 5052/6779 [3:07:29<1:07:32,  2.35s/it]                                                       {'loss': 1.7726, 'learning_rate': 6.257437180832863e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5052/6779 [3:07:29<1:07:32,  2.35s/it] 75%|███████▍  | 5053/6779 [3:07:31<1:06:10,  2.30s/it]                                                       {'loss': 1.5339, 'learning_rate': 6.250603902904021e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5053/6779 [3:07:31<1:06:10,  2.30s/it] 75%|███████▍  | 5054/6779 [3:07:33<1:06:40,  2.32s/it]                                                       {'loss': 1.563, 'learning_rate': 6.243773666984043e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5054/6779 [3:07:33<1:06:40,  2.32s/it] 75%|███████▍  | 5055/6779 [3:07:35<1:06:29,  2.31s/it]                                                       {'loss': 1.6866, 'learning_rate': 6.23694647458408e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5055/6779 [3:07:35<1:06:29,  2.31s/it] 75%|███████▍  | 5056/6779 [3:07:38<1:05:22,  2.28s/it]                                                       {'loss': 1.6081, 'learning_rate': 6.230122327214633e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5056/6779 [3:07:38<1:05:22,  2.28s/it] 75%|███████▍  | 5057/6779 [3:07:40<1:02:27,  2.18s/it]                                                       {'loss': 1.5196, 'learning_rate': 6.22330122638553e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5057/6779 [3:07:40<1:02:27,  2.18s/it] 75%|███████▍  | 5058/6779 [3:07:42<1:02:08,  2.17s/it]                                                       {'loss': 1.666, 'learning_rate': 6.216483173605901e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5058/6779 [3:07:42<1:02:08,  2.17s/it] 75%|███████▍  | 5059/6779 [3:07:44<1:02:15,  2.17s/it]                                                       {'loss': 1.8141, 'learning_rate': 6.209668170384235e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5059/6779 [3:07:44<1:02:15,  2.17s/it] 75%|███████▍  | 5060/6779 [3:07:46<1:02:31,  2.18s/it]                                                       {'loss': 1.49, 'learning_rate': 6.202856218228312e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5060/6779 [3:07:46<1:02:31,  2.18s/it] 75%|███████▍  | 5061/6779 [3:07:48<1:03:17,  2.21s/it]                                                       {'loss': 1.7337, 'learning_rate': 6.19604731864527e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5061/6779 [3:07:48<1:03:17,  2.21s/it] 75%|███████▍  | 5062/6779 [3:07:50<1:02:00,  2.17s/it]                                                       {'loss': 1.7959, 'learning_rate': 6.189241473141543e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5062/6779 [3:07:50<1:02:00,  2.17s/it] 75%|███████▍  | 5063/6779 [3:07:53<1:02:57,  2.20s/it]                                                       {'loss': 1.6229, 'learning_rate': 6.182438683222909e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5063/6779 [3:07:53<1:02:57,  2.20s/it] 75%|███████▍  | 5064/6779 [3:07:55<1:03:15,  2.21s/it]                                                       {'loss': 1.6719, 'learning_rate': 6.175638950394465e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5064/6779 [3:07:55<1:03:15,  2.21s/it] 75%|███████▍  | 5065/6779 [3:07:57<1:04:00,  2.24s/it]                                                       {'loss': 1.6296, 'learning_rate': 6.16884227616062e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5065/6779 [3:07:57<1:04:00,  2.24s/it] 75%|███████▍  | 5066/6779 [3:07:59<1:04:18,  2.25s/it]                                                       {'loss': 1.6087, 'learning_rate': 6.162048662025128e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5066/6779 [3:07:59<1:04:18,  2.25s/it] 75%|███████▍  | 5067/6779 [3:08:02<1:06:13,  2.32s/it]                                                       {'loss': 1.6068, 'learning_rate': 6.155258109491044e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5067/6779 [3:08:02<1:06:13,  2.32s/it] 75%|███████▍  | 5068/6779 [3:08:04<1:04:57,  2.28s/it]                                                       {'loss': 1.5633, 'learning_rate': 6.148470620060765e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5068/6779 [3:08:04<1:04:57,  2.28s/it] 75%|███████▍  | 5069/6779 [3:08:06<1:03:25,  2.23s/it]                                                       {'loss': 1.6549, 'learning_rate': 6.141686195235987e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5069/6779 [3:08:06<1:03:25,  2.23s/it] 75%|███████▍  | 5070/6779 [3:08:08<1:01:15,  2.15s/it]                                                       {'loss': 1.5862, 'learning_rate': 6.134904836517752e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5070/6779 [3:08:08<1:01:15,  2.15s/it] 75%|███████▍  | 5071/6779 [3:08:10<1:01:14,  2.15s/it]                                                       {'loss': 1.4903, 'learning_rate': 6.128126545406416e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5071/6779 [3:08:10<1:01:14,  2.15s/it] 75%|███████▍  | 5072/6779 [3:08:12<1:00:29,  2.13s/it]                                                       {'loss': 1.7299, 'learning_rate': 6.121351323401643e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5072/6779 [3:08:12<1:00:29,  2.13s/it] 75%|███████▍  | 5073/6779 [3:08:15<1:01:46,  2.17s/it]                                                       {'loss': 1.5905, 'learning_rate': 6.114579172002443e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5073/6779 [3:08:15<1:01:46,  2.17s/it] 75%|███████▍  | 5074/6779 [3:08:17<1:00:13,  2.12s/it]                                                       {'loss': 1.6288, 'learning_rate': 6.107810092707116e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5074/6779 [3:08:17<1:00:13,  2.12s/it] 75%|███████▍  | 5075/6779 [3:08:19<59:38,  2.10s/it]                                                       {'loss': 1.5331, 'learning_rate': 6.1010440870133146e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5075/6779 [3:08:19<59:38,  2.10s/it] 75%|███████▍  | 5076/6779 [3:08:21<1:00:42,  2.14s/it]                                                       {'loss': 1.45, 'learning_rate': 6.094281156417974e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5076/6779 [3:08:21<1:00:42,  2.14s/it] 75%|███████▍  | 5077/6779 [3:08:23<1:00:03,  2.12s/it]                                                       {'loss': 1.4878, 'learning_rate': 6.087521302417396e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5077/6779 [3:08:23<1:00:03,  2.12s/it] 75%|███████▍  | 5078/6779 [3:08:25<1:00:02,  2.12s/it]                                                       {'loss': 1.7313, 'learning_rate': 6.0807645265071636e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5078/6779 [3:08:25<1:00:02,  2.12s/it] 75%|███████▍  | 5079/6779 [3:08:28<1:02:33,  2.21s/it]                                                       {'loss': 1.7082, 'learning_rate': 6.074010830182186e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5079/6779 [3:08:28<1:02:33,  2.21s/it] 75%|███████▍  | 5080/6779 [3:08:30<1:03:33,  2.24s/it]                                                       {'loss': 1.6136, 'learning_rate': 6.0672602149367096e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5080/6779 [3:08:30<1:03:33,  2.24s/it] 75%|███████▍  | 5081/6779 [3:08:32<1:03:09,  2.23s/it]                                                       {'loss': 1.6017, 'learning_rate': 6.060512682264272e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5081/6779 [3:08:32<1:03:09,  2.23s/it] 75%|███████▍  | 5082/6779 [3:08:34<1:02:13,  2.20s/it]                                                       {'loss': 1.6909, 'learning_rate': 6.053768233657755e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5082/6779 [3:08:34<1:02:13,  2.20s/it] 75%|███████▍  | 5083/6779 [3:08:36<1:01:18,  2.17s/it]                                                       {'loss': 1.6627, 'learning_rate': 6.0470268706093294e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5083/6779 [3:08:36<1:01:18,  2.17s/it] 75%|███████▍  | 5084/6779 [3:08:39<1:02:11,  2.20s/it]                                                       {'loss': 1.6479, 'learning_rate': 6.040288594610522e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5084/6779 [3:08:39<1:02:11,  2.20s/it] 75%|███████▌  | 5085/6779 [3:08:41<1:03:15,  2.24s/it]                                                       {'loss': 1.7077, 'learning_rate': 6.0335534071521414e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5085/6779 [3:08:41<1:03:15,  2.24s/it] 75%|███████▌  | 5086/6779 [3:08:43<1:02:27,  2.21s/it]                                                       {'loss': 1.6247, 'learning_rate': 6.02682130972432e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5086/6779 [3:08:43<1:02:27,  2.21s/it] 75%|███████▌  | 5087/6779 [3:08:46<1:03:59,  2.27s/it]                                                       {'loss': 1.7611, 'learning_rate': 6.020092303816527e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5087/6779 [3:08:46<1:03:59,  2.27s/it] 75%|███████▌  | 5088/6779 [3:08:48<1:02:12,  2.21s/it]                                                       {'loss': 1.6365, 'learning_rate': 6.013366390917519e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5088/6779 [3:08:48<1:02:12,  2.21s/it] 75%|███████▌  | 5089/6779 [3:08:50<1:02:16,  2.21s/it]                                                       {'loss': 1.8074, 'learning_rate': 6.006643572515396e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5089/6779 [3:08:50<1:02:16,  2.21s/it] 75%|███████▌  | 5090/6779 [3:08:52<1:02:42,  2.23s/it]                                                       {'loss': 1.6538, 'learning_rate': 5.999923850097538e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5090/6779 [3:08:52<1:02:42,  2.23s/it] 75%|███████▌  | 5091/6779 [3:08:54<1:03:39,  2.26s/it]                                                       {'loss': 1.6115, 'learning_rate': 5.9932072251506876e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5091/6779 [3:08:54<1:03:39,  2.26s/it] 75%|███████▌  | 5092/6779 [3:08:57<1:03:06,  2.24s/it]                                                       {'loss': 1.8217, 'learning_rate': 5.986493699160858e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5092/6779 [3:08:57<1:03:06,  2.24s/it] 75%|███████▌  | 5093/6779 [3:08:59<1:06:29,  2.37s/it]                                                       {'loss': 1.4959, 'learning_rate': 5.979783273613406e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5093/6779 [3:08:59<1:06:29,  2.37s/it] 75%|███████▌  | 5094/6779 [3:09:02<1:05:51,  2.35s/it]                                                       {'loss': 1.6024, 'learning_rate': 5.973075949992988e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5094/6779 [3:09:02<1:05:51,  2.35s/it] 75%|███████▌  | 5095/6779 [3:09:04<1:03:49,  2.27s/it]                                                       {'loss': 1.5637, 'learning_rate': 5.9663717297835686e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5095/6779 [3:09:04<1:03:49,  2.27s/it] 75%|███████▌  | 5096/6779 [3:09:06<1:01:48,  2.20s/it]                                                       {'loss': 1.6483, 'learning_rate': 5.959670614468449e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5096/6779 [3:09:06<1:01:48,  2.20s/it] 75%|███████▌  | 5097/6779 [3:09:08<1:00:57,  2.17s/it]                                                       {'loss': 1.5472, 'learning_rate': 5.9529726055302135e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5097/6779 [3:09:08<1:00:57,  2.17s/it] 75%|███████▌  | 5098/6779 [3:09:10<59:57,  2.14s/it]                                                       {'loss': 1.3795, 'learning_rate': 5.946277704450785e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5098/6779 [3:09:10<59:57,  2.14s/it] 75%|███████▌  | 5099/6779 [3:09:12<1:02:21,  2.23s/it]                                                       {'loss': 1.3408, 'learning_rate': 5.939585912711383e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5099/6779 [3:09:12<1:02:21,  2.23s/it] 75%|███████▌  | 5100/6779 [3:09:15<1:02:29,  2.23s/it]                                                       {'loss': 1.6485, 'learning_rate': 5.932897231792556e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5100/6779 [3:09:15<1:02:29,  2.23s/it] 75%|███████▌  | 5101/6779 [3:09:17<1:02:44,  2.24s/it]                                                       {'loss': 1.6332, 'learning_rate': 5.926211663174137e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5101/6779 [3:09:17<1:02:44,  2.24s/it] 75%|███████▌  | 5102/6779 [3:09:20<1:06:30,  2.38s/it]                                                       {'loss': 1.7832, 'learning_rate': 5.919529208335299e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5102/6779 [3:09:20<1:06:30,  2.38s/it] 75%|███████▌  | 5103/6779 [3:09:21<1:02:57,  2.25s/it]                                                       {'loss': 1.5574, 'learning_rate': 5.912849868754509e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5103/6779 [3:09:21<1:02:57,  2.25s/it] 75%|███████▌  | 5104/6779 [3:09:24<1:03:38,  2.28s/it]                                                       {'loss': 1.6816, 'learning_rate': 5.906173645909543e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5104/6779 [3:09:24<1:03:38,  2.28s/it] 75%|███████▌  | 5105/6779 [3:09:26<1:05:00,  2.33s/it]                                                       {'loss': 1.7299, 'learning_rate': 5.8995005412774965e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5105/6779 [3:09:26<1:05:00,  2.33s/it] 75%|███████▌  | 5106/6779 [3:09:29<1:04:42,  2.32s/it]                                                       {'loss': 1.6896, 'learning_rate': 5.892830556334772e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5106/6779 [3:09:29<1:04:42,  2.32s/it] 75%|███████▌  | 5107/6779 [3:09:31<1:04:07,  2.30s/it]                                                       {'loss': 1.6076, 'learning_rate': 5.886163692557092e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5107/6779 [3:09:31<1:04:07,  2.30s/it] 75%|███████▌  | 5108/6779 [3:09:33<1:04:20,  2.31s/it]                                                       {'loss': 1.6711, 'learning_rate': 5.879499951419463e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5108/6779 [3:09:33<1:04:20,  2.31s/it] 75%|███████▌  | 5109/6779 [3:09:35<1:04:00,  2.30s/it]                                                       {'loss': 1.6399, 'learning_rate': 5.87283933439623e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5109/6779 [3:09:35<1:04:00,  2.30s/it] 75%|███████▌  | 5110/6779 [3:09:38<1:03:04,  2.27s/it]                                                       {'loss': 1.5799, 'learning_rate': 5.866181842961018e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5110/6779 [3:09:38<1:03:04,  2.27s/it] 75%|███████▌  | 5111/6779 [3:09:40<1:02:12,  2.24s/it]                                                       {'loss': 1.6007, 'learning_rate': 5.8595274785867885e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5111/6779 [3:09:40<1:02:12,  2.24s/it] 75%|███████▌  | 5112/6779 [3:09:42<1:01:13,  2.20s/it]                                                       {'loss': 1.6406, 'learning_rate': 5.8528762427457864e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5112/6779 [3:09:42<1:01:13,  2.20s/it] 75%|███████▌  | 5113/6779 [3:09:45<1:04:37,  2.33s/it]                                                       {'loss': 1.5899, 'learning_rate': 5.846228136909582e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5113/6779 [3:09:45<1:04:37,  2.33s/it] 75%|███████▌  | 5114/6779 [3:09:47<1:03:42,  2.30s/it]                                                       {'loss': 1.5569, 'learning_rate': 5.839583162549052e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5114/6779 [3:09:47<1:03:42,  2.30s/it] 75%|███████▌  | 5115/6779 [3:09:49<1:01:55,  2.23s/it]                                                       {'loss': 1.6108, 'learning_rate': 5.832941321134362e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5115/6779 [3:09:49<1:01:55,  2.23s/it] 75%|███████▌  | 5116/6779 [3:09:52<1:05:43,  2.37s/it]                                                       {'loss': 1.5267, 'learning_rate': 5.826302614135013e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5116/6779 [3:09:52<1:05:43,  2.37s/it] 75%|███████▌  | 5117/6779 [3:09:54<1:04:05,  2.31s/it]                                                       {'loss': 1.6086, 'learning_rate': 5.819667043019783e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5117/6779 [3:09:54<1:04:05,  2.31s/it] 75%|███████▌  | 5118/6779 [3:09:56<1:02:14,  2.25s/it]                                                       {'loss': 1.6585, 'learning_rate': 5.813034609256782e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5118/6779 [3:09:56<1:02:14,  2.25s/it] 76%|███████▌  | 5119/6779 [3:09:58<1:00:34,  2.19s/it]                                                       {'loss': 1.6604, 'learning_rate': 5.8064053143134036e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5119/6779 [3:09:58<1:00:34,  2.19s/it] 76%|███████▌  | 5120/6779 [3:10:00<1:00:08,  2.17s/it]                                                       {'loss': 1.484, 'learning_rate': 5.799779159656362e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5120/6779 [3:10:00<1:00:08,  2.17s/it] 76%|███████▌  | 5121/6779 [3:10:02<1:01:09,  2.21s/it]                                                       {'loss': 1.6147, 'learning_rate': 5.793156146751681e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5121/6779 [3:10:02<1:01:09,  2.21s/it] 76%|███████▌  | 5122/6779 [3:10:05<1:04:59,  2.35s/it]                                                       {'loss': 1.742, 'learning_rate': 5.786536277064667e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5122/6779 [3:10:05<1:04:59,  2.35s/it] 76%|███████▌  | 5123/6779 [3:10:07<1:02:48,  2.28s/it]                                                       {'loss': 1.6443, 'learning_rate': 5.7799195520599534e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5123/6779 [3:10:07<1:02:48,  2.28s/it] 76%|███████▌  | 5124/6779 [3:10:09<1:03:27,  2.30s/it]                                                       {'loss': 1.5819, 'learning_rate': 5.7733059732014613e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5124/6779 [3:10:09<1:03:27,  2.30s/it] 76%|███████▌  | 5125/6779 [3:10:12<1:02:48,  2.28s/it]                                                       {'loss': 1.566, 'learning_rate': 5.766695541952436e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5125/6779 [3:10:12<1:02:48,  2.28s/it] 76%|███████▌  | 5126/6779 [3:10:14<1:03:29,  2.30s/it]                                                       {'loss': 1.7183, 'learning_rate': 5.760088259775396e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5126/6779 [3:10:14<1:03:29,  2.30s/it] 76%|███████▌  | 5127/6779 [3:10:16<1:04:18,  2.34s/it]                                                       {'loss': 1.6683, 'learning_rate': 5.753484128132192e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5127/6779 [3:10:16<1:04:18,  2.34s/it] 76%|███████▌  | 5128/6779 [3:10:19<1:03:14,  2.30s/it]                                                       {'loss': 1.574, 'learning_rate': 5.74688314848397e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5128/6779 [3:10:19<1:03:14,  2.30s/it] 76%|███████▌  | 5129/6779 [3:10:21<1:01:39,  2.24s/it]                                                       {'loss': 1.632, 'learning_rate': 5.740285322291166e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5129/6779 [3:10:21<1:01:39,  2.24s/it] 76%|███████▌  | 5130/6779 [3:10:23<1:01:04,  2.22s/it]                                                       {'loss': 1.6245, 'learning_rate': 5.733690651013537e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5130/6779 [3:10:23<1:01:04,  2.22s/it] 76%|███████▌  | 5131/6779 [3:10:25<59:23,  2.16s/it]                                                       {'loss': 1.5628, 'learning_rate': 5.727099136110119e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5131/6779 [3:10:25<59:23,  2.16s/it] 76%|███████▌  | 5132/6779 [3:10:27<58:46,  2.14s/it]                                                     {'loss': 1.7011, 'learning_rate': 5.720510779039279e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5132/6779 [3:10:27<58:46,  2.14s/it] 76%|███████▌  | 5133/6779 [3:10:29<1:00:48,  2.22s/it]                                                       {'loss': 1.5521, 'learning_rate': 5.7139255812586544e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5133/6779 [3:10:29<1:00:48,  2.22s/it] 76%|███████▌  | 5134/6779 [3:10:32<59:56,  2.19s/it]                                                       {'loss': 1.6341, 'learning_rate': 5.7073435442252053e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5134/6779 [3:10:32<59:56,  2.19s/it] 76%|███████▌  | 5135/6779 [3:10:34<58:39,  2.14s/it]                                                     {'loss': 1.6438, 'learning_rate': 5.7007646693951934e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5135/6779 [3:10:34<58:39,  2.14s/it] 76%|███████▌  | 5136/6779 [3:10:36<59:10,  2.16s/it]                                                     {'loss': 1.6339, 'learning_rate': 5.6941889582241606e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5136/6779 [3:10:36<59:10,  2.16s/it] 76%|███████▌  | 5137/6779 [3:10:38<1:00:04,  2.20s/it]                                                       {'loss': 1.6391, 'learning_rate': 5.6876164121669694e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5137/6779 [3:10:38<1:00:04,  2.20s/it] 76%|███████▌  | 5138/6779 [3:10:40<1:01:03,  2.23s/it]                                                       {'loss': 1.6811, 'learning_rate': 5.681047032677769e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5138/6779 [3:10:40<1:01:03,  2.23s/it] 76%|███████▌  | 5139/6779 [3:10:43<1:00:27,  2.21s/it]                                                       {'loss': 1.5101, 'learning_rate': 5.6744808212100195e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5139/6779 [3:10:43<1:00:27,  2.21s/it] 76%|███████▌  | 5140/6779 [3:10:45<1:02:16,  2.28s/it]                                                       {'loss': 1.6459, 'learning_rate': 5.667917779216465e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5140/6779 [3:10:45<1:02:16,  2.28s/it] 76%|███████▌  | 5141/6779 [3:10:47<1:01:58,  2.27s/it]                                                       {'loss': 1.5526, 'learning_rate': 5.661357908149161e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5141/6779 [3:10:47<1:01:58,  2.27s/it] 76%|███████▌  | 5142/6779 [3:10:49<1:01:22,  2.25s/it]                                                       {'loss': 1.5833, 'learning_rate': 5.654801209459466e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5142/6779 [3:10:49<1:01:22,  2.25s/it] 76%|███████▌  | 5143/6779 [3:10:52<59:48,  2.19s/it]                                                       {'loss': 1.5735, 'learning_rate': 5.6482476845980134e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5143/6779 [3:10:52<59:48,  2.19s/it] 76%|███████▌  | 5144/6779 [3:10:54<59:45,  2.19s/it]                                                     {'loss': 1.7807, 'learning_rate': 5.6416973350147616e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5144/6779 [3:10:54<59:45,  2.19s/it] 76%|███████▌  | 5145/6779 [3:10:56<1:00:57,  2.24s/it]                                                       {'loss': 1.7605, 'learning_rate': 5.635150162158944e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5145/6779 [3:10:56<1:00:57,  2.24s/it] 76%|███████▌  | 5146/6779 [3:10:58<59:14,  2.18s/it]                                                       {'loss': 1.6921, 'learning_rate': 5.628606167479111e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5146/6779 [3:10:58<59:14,  2.18s/it] 76%|███████▌  | 5147/6779 [3:11:00<59:06,  2.17s/it]                                                     {'loss': 1.6627, 'learning_rate': 5.6220653524230826e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5147/6779 [3:11:00<59:06,  2.17s/it] 76%|███████▌  | 5148/6779 [3:11:03<1:00:08,  2.21s/it]                                                       {'loss': 1.6816, 'learning_rate': 5.6155277184380165e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5148/6779 [3:11:03<1:00:08,  2.21s/it] 76%|███████▌  | 5149/6779 [3:11:05<1:01:43,  2.27s/it]                                                       {'loss': 1.6332, 'learning_rate': 5.608993266970331e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5149/6779 [3:11:05<1:01:43,  2.27s/it] 76%|███████▌  | 5150/6779 [3:11:07<1:01:13,  2.26s/it]                                                       {'loss': 1.6394, 'learning_rate': 5.6024619994657465e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5150/6779 [3:11:07<1:01:13,  2.26s/it] 76%|███████▌  | 5151/6779 [3:11:09<1:00:53,  2.24s/it]                                                       {'loss': 1.6175, 'learning_rate': 5.595933917369296e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5151/6779 [3:11:09<1:00:53,  2.24s/it] 76%|███████▌  | 5152/6779 [3:11:11<59:24,  2.19s/it]                                                       {'loss': 1.6965, 'learning_rate': 5.589409022125285e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5152/6779 [3:11:11<59:24,  2.19s/it] 76%|███████▌  | 5153/6779 [3:11:14<59:49,  2.21s/it]                                                     {'loss': 1.8417, 'learning_rate': 5.5828873151773365e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5153/6779 [3:11:14<59:49,  2.21s/it] 76%|███████▌  | 5154/6779 [3:11:16<59:37,  2.20s/it]                                                     {'loss': 1.8144, 'learning_rate': 5.576368797968339e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5154/6779 [3:11:16<59:37,  2.20s/it] 76%|███████▌  | 5155/6779 [3:11:18<58:18,  2.15s/it]                                                     {'loss': 1.5722, 'learning_rate': 5.569853471940518e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5155/6779 [3:11:18<58:18,  2.15s/it] 76%|███████▌  | 5156/6779 [3:11:20<1:01:03,  2.26s/it]                                                       {'loss': 1.7548, 'learning_rate': 5.563341338535355e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5156/6779 [3:11:20<1:01:03,  2.26s/it] 76%|███████▌  | 5157/6779 [3:11:22<59:00,  2.18s/it]                                                       {'loss': 1.6929, 'learning_rate': 5.55683239919363e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5157/6779 [3:11:22<59:00,  2.18s/it] 76%|███████▌  | 5158/6779 [3:11:25<59:08,  2.19s/it]                                                     {'loss': 1.5943, 'learning_rate': 5.550326655355442e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5158/6779 [3:11:25<59:08,  2.19s/it] 76%|███████▌  | 5159/6779 [3:11:27<1:00:04,  2.23s/it]                                                       {'loss': 1.6535, 'learning_rate': 5.5438241084601494e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5159/6779 [3:11:27<1:00:04,  2.23s/it] 76%|███████▌  | 5160/6779 [3:11:29<59:54,  2.22s/it]                                                       {'loss': 1.6893, 'learning_rate': 5.5373247599464315e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5160/6779 [3:11:29<59:54,  2.22s/it] 76%|███████▌  | 5161/6779 [3:11:32<1:01:30,  2.28s/it]                                                       {'loss': 1.6917, 'learning_rate': 5.53082861125223e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5161/6779 [3:11:32<1:01:30,  2.28s/it] 76%|███████▌  | 5162/6779 [3:11:34<1:01:51,  2.30s/it]                                                       {'loss': 1.6435, 'learning_rate': 5.524335663814824e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5162/6779 [3:11:34<1:01:51,  2.30s/it] 76%|███████▌  | 5163/6779 [3:11:36<1:00:46,  2.26s/it]                                                       {'loss': 1.8095, 'learning_rate': 5.517845919070734e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5163/6779 [3:11:36<1:00:46,  2.26s/it] 76%|███████▌  | 5164/6779 [3:11:38<1:00:09,  2.23s/it]                                                       {'loss': 1.6571, 'learning_rate': 5.5113593784558095e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5164/6779 [3:11:38<1:00:09,  2.23s/it] 76%|███████▌  | 5165/6779 [3:11:41<1:03:06,  2.35s/it]                                                       {'loss': 1.6851, 'learning_rate': 5.504876043405172e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5165/6779 [3:11:41<1:03:06,  2.35s/it] 76%|███████▌  | 5166/6779 [3:11:43<1:01:02,  2.27s/it]                                                       {'loss': 1.8255, 'learning_rate': 5.498395915353227e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5166/6779 [3:11:43<1:01:02,  2.27s/it] 76%|███████▌  | 5167/6779 [3:11:45<59:22,  2.21s/it]                                                       {'loss': 1.659, 'learning_rate': 5.4919189957336956e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5167/6779 [3:11:45<59:22,  2.21s/it] 76%|███████▌  | 5168/6779 [3:11:47<59:21,  2.21s/it]                                                     {'loss': 1.7234, 'learning_rate': 5.48544528597956e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5168/6779 [3:11:47<59:21,  2.21s/it] 76%|███████▋  | 5169/6779 [3:11:50<1:00:46,  2.26s/it]                                                       {'loss': 1.667, 'learning_rate': 5.47897478752313e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5169/6779 [3:11:50<1:00:46,  2.26s/it] 76%|███████▋  | 5170/6779 [3:11:52<59:36,  2.22s/it]                                                       {'loss': 1.5888, 'learning_rate': 5.4725075017959627e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5170/6779 [3:11:52<59:36,  2.22s/it] 76%|███████▋  | 5171/6779 [3:11:54<59:24,  2.22s/it]                                                     {'loss': 1.6714, 'learning_rate': 5.466043430228935e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5171/6779 [3:11:54<59:24,  2.22s/it] 76%|███████▋  | 5172/6779 [3:11:56<57:53,  2.16s/it]                                                     {'loss': 1.5393, 'learning_rate': 5.4595825742521934e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5172/6779 [3:11:56<57:53,  2.16s/it] 76%|███████▋  | 5173/6779 [3:11:58<59:20,  2.22s/it]                                                     {'loss': 1.512, 'learning_rate': 5.4531249352951905e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5173/6779 [3:11:58<59:20,  2.22s/it] 76%|███████▋  | 5174/6779 [3:12:00<57:33,  2.15s/it]                                                     {'loss': 1.6989, 'learning_rate': 5.446670514786651e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5174/6779 [3:12:00<57:33,  2.15s/it] 76%|███████▋  | 5175/6779 [3:12:02<57:17,  2.14s/it]                                                     {'loss': 1.6139, 'learning_rate': 5.440219314154591e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5175/6779 [3:12:02<57:17,  2.14s/it] 76%|███████▋  | 5176/6779 [3:12:05<1:02:28,  2.34s/it]                                                       {'loss': 1.701, 'learning_rate': 5.433771334826321e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5176/6779 [3:12:05<1:02:28,  2.34s/it] 76%|███████▋  | 5177/6779 [3:12:07<1:01:11,  2.29s/it]                                                       {'loss': 1.4587, 'learning_rate': 5.427326578228438e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5177/6779 [3:12:07<1:01:11,  2.29s/it] 76%|███████▋  | 5178/6779 [3:12:10<59:34,  2.23s/it]                                                       {'loss': 1.6175, 'learning_rate': 5.420885045786825e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5178/6779 [3:12:10<59:34,  2.23s/it] 76%|███████▋  | 5179/6779 [3:12:12<59:58,  2.25s/it]                                                     {'loss': 1.6237, 'learning_rate': 5.414446738926642e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5179/6779 [3:12:12<59:58,  2.25s/it] 76%|███████▋  | 5180/6779 [3:12:14<59:14,  2.22s/it]                                                     {'loss': 1.6553, 'learning_rate': 5.408011659072354e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5180/6779 [3:12:14<59:14,  2.22s/it] 76%|███████▋  | 5181/6779 [3:12:16<1:01:03,  2.29s/it]                                                       {'loss': 1.614, 'learning_rate': 5.40157980764769e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5181/6779 [3:12:16<1:01:03,  2.29s/it] 76%|███████▋  | 5182/6779 [3:12:19<59:41,  2.24s/it]                                                       {'loss': 1.5565, 'learning_rate': 5.395151186075686e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5182/6779 [3:12:19<59:41,  2.24s/it] 76%|███████▋  | 5183/6779 [3:12:21<57:19,  2.16s/it]                                                     {'loss': 1.6419, 'learning_rate': 5.388725795778642e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5183/6779 [3:12:21<57:19,  2.16s/it] 76%|███████▋  | 5184/6779 [3:12:23<59:35,  2.24s/it]                                                     {'loss': 1.8433, 'learning_rate': 5.382303638178163e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5184/6779 [3:12:23<59:35,  2.24s/it] 76%|███████▋  | 5185/6779 [3:12:25<59:22,  2.23s/it]                                                     {'loss': 1.4545, 'learning_rate': 5.375884714695134e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5185/6779 [3:12:25<59:22,  2.23s/it] 77%|███████▋  | 5186/6779 [3:12:27<59:32,  2.24s/it]                                                     {'loss': 1.5962, 'learning_rate': 5.3694690267497096e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5186/6779 [3:12:27<59:32,  2.24s/it] 77%|███████▋  | 5187/6779 [3:12:29<57:36,  2.17s/it]                                                     {'loss': 1.7703, 'learning_rate': 5.3630565757613494e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5187/6779 [3:12:29<57:36,  2.17s/it] 77%|███████▋  | 5188/6779 [3:12:32<58:38,  2.21s/it]                                                     {'loss': 1.9288, 'learning_rate': 5.356647363148781e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5188/6779 [3:12:32<58:38,  2.21s/it] 77%|███████▋  | 5189/6779 [3:12:34<58:46,  2.22s/it]                                                     {'loss': 1.4884, 'learning_rate': 5.350241390330029e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5189/6779 [3:12:34<58:46,  2.22s/it] 77%|███████▋  | 5190/6779 [3:12:36<58:38,  2.21s/it]                                                     {'loss': 1.5526, 'learning_rate': 5.34383865872238e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5190/6779 [3:12:36<58:38,  2.21s/it] 77%|███████▋  | 5191/6779 [3:12:38<58:06,  2.20s/it]                                                     {'loss': 1.5618, 'learning_rate': 5.3374391697424286e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5191/6779 [3:12:38<58:06,  2.20s/it] 77%|███████▋  | 5192/6779 [3:12:41<1:01:04,  2.31s/it]                                                       {'loss': 1.579, 'learning_rate': 5.3310429248060446e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5192/6779 [3:12:41<1:01:04,  2.31s/it] 77%|███████▋  | 5193/6779 [3:12:43<59:17,  2.24s/it]                                                       {'loss': 1.6606, 'learning_rate': 5.3246499253283644e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5193/6779 [3:12:43<59:17,  2.24s/it] 77%|███████▋  | 5194/6779 [3:12:45<57:59,  2.20s/it]                                                     {'loss': 1.4611, 'learning_rate': 5.31826017272383e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5194/6779 [3:12:45<57:59,  2.20s/it] 77%|███████▋  | 5195/6779 [3:12:50<1:19:06,  3.00s/it]                                                       {'loss': 1.5436, 'learning_rate': 5.31187366840614e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5195/6779 [3:12:50<1:19:06,  3.00s/it] 77%|███████▋  | 5196/6779 [3:12:52<1:12:54,  2.76s/it]                                                       {'loss': 1.6193, 'learning_rate': 5.3054904137883035e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5196/6779 [3:12:52<1:12:54,  2.76s/it] 77%|███████▋  | 5197/6779 [3:12:55<1:10:14,  2.66s/it]                                                       {'loss': 1.6619, 'learning_rate': 5.2991104102825774e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5197/6779 [3:12:55<1:10:14,  2.66s/it] 77%|███████▋  | 5198/6779 [3:12:57<1:06:27,  2.52s/it]                                                       {'loss': 1.6859, 'learning_rate': 5.292733659300526e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5198/6779 [3:12:57<1:06:27,  2.52s/it] 77%|███████▋  | 5199/6779 [3:12:59<1:03:26,  2.41s/it]                                                       {'loss': 1.6886, 'learning_rate': 5.28636016225299e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5199/6779 [3:12:59<1:03:26,  2.41s/it] 77%|███████▋  | 5200/6779 [3:13:01<1:02:28,  2.37s/it]                                                       {'loss': 1.7907, 'learning_rate': 5.27998992055007e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5200/6779 [3:13:01<1:02:28,  2.37s/it] 77%|███████▋  | 5201/6779 [3:13:03<1:00:54,  2.32s/it]                                                       {'loss': 1.492, 'learning_rate': 5.273622935601179e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5201/6779 [3:13:03<1:00:54,  2.32s/it] 77%|███████▋  | 5202/6779 [3:13:06<1:01:54,  2.36s/it]                                                       {'loss': 1.534, 'learning_rate': 5.267259208814974e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5202/6779 [3:13:06<1:01:54,  2.36s/it] 77%|███████▋  | 5203/6779 [3:13:09<1:04:40,  2.46s/it]                                                       {'loss': 1.8723, 'learning_rate': 5.260898741599425e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5203/6779 [3:13:09<1:04:40,  2.46s/it] 77%|███████▋  | 5204/6779 [3:13:11<1:01:26,  2.34s/it]                                                       {'loss': 1.7129, 'learning_rate': 5.254541535361748e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5204/6779 [3:13:11<1:01:26,  2.34s/it] 77%|███████▋  | 5205/6779 [3:13:13<1:01:13,  2.33s/it]                                                       {'loss': 1.6841, 'learning_rate': 5.2481875915084646e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5205/6779 [3:13:13<1:01:13,  2.33s/it] 77%|███████▋  | 5206/6779 [3:13:15<1:00:11,  2.30s/it]                                                       {'loss': 1.7308, 'learning_rate': 5.241836911445366e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5206/6779 [3:13:15<1:00:11,  2.30s/it] 77%|███████▋  | 5207/6779 [3:13:18<1:00:41,  2.32s/it]                                                       {'loss': 1.7197, 'learning_rate': 5.23548949657751e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5207/6779 [3:13:18<1:00:41,  2.32s/it] 77%|███████▋  | 5208/6779 [3:13:20<59:46,  2.28s/it]                                                       {'loss': 1.7703, 'learning_rate': 5.2291453483092526e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5208/6779 [3:13:20<59:46,  2.28s/it] 77%|███████▋  | 5209/6779 [3:13:22<57:58,  2.22s/it]                                                     {'loss': 1.676, 'learning_rate': 5.2228044680442027e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5209/6779 [3:13:22<57:58,  2.22s/it] 77%|███████▋  | 5210/6779 [3:13:24<59:36,  2.28s/it]                                                     {'loss': 1.5664, 'learning_rate': 5.216466857185274e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5210/6779 [3:13:24<59:36,  2.28s/it] 77%|███████▋  | 5211/6779 [3:13:26<56:53,  2.18s/it]                                                     {'loss': 1.6059, 'learning_rate': 5.210132517134629e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5211/6779 [3:13:26<56:53,  2.18s/it] 77%|███████▋  | 5212/6779 [3:13:28<57:58,  2.22s/it]                                                     {'loss': 1.5314, 'learning_rate': 5.203801449293724e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5212/6779 [3:13:28<57:58,  2.22s/it] 77%|███████▋  | 5213/6779 [3:13:30<56:02,  2.15s/it]                                                     {'loss': 1.6679, 'learning_rate': 5.197473655063294e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5213/6779 [3:13:30<56:02,  2.15s/it] 77%|███████▋  | 5214/6779 [3:13:33<56:45,  2.18s/it]                                                     {'loss': 1.7486, 'learning_rate': 5.1911491358433316e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5214/6779 [3:13:33<56:45,  2.18s/it] 77%|███████▋  | 5215/6779 [3:13:35<56:45,  2.18s/it]                                                     {'loss': 1.5842, 'learning_rate': 5.184827893033128e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5215/6779 [3:13:35<56:45,  2.18s/it] 77%|███████▋  | 5216/6779 [3:13:37<57:38,  2.21s/it]                                                     {'loss': 1.6842, 'learning_rate': 5.1785099280312256e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5216/6779 [3:13:37<57:38,  2.21s/it] 77%|███████▋  | 5217/6779 [3:13:39<57:50,  2.22s/it]                                                     {'loss': 1.6243, 'learning_rate': 5.172195242235463e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5217/6779 [3:13:39<57:50,  2.22s/it] 77%|███████▋  | 5218/6779 [3:13:42<1:01:47,  2.37s/it]                                                       {'loss': 1.4966, 'learning_rate': 5.1658838370429285e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5218/6779 [3:13:42<1:01:47,  2.37s/it] 77%|███████▋  | 5219/6779 [3:13:44<59:46,  2.30s/it]                                                       {'loss': 1.5942, 'learning_rate': 5.159575713850022e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5219/6779 [3:13:44<59:46,  2.30s/it] 77%|███████▋  | 5220/6779 [3:13:46<58:13,  2.24s/it]                                                     {'loss': 1.5479, 'learning_rate': 5.153270874052385e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5220/6779 [3:13:46<58:13,  2.24s/it] 77%|███████▋  | 5221/6779 [3:13:49<57:29,  2.21s/it]                                                     {'loss': 1.5424, 'learning_rate': 5.146969319044934e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5221/6779 [3:13:49<57:29,  2.21s/it] 77%|███████▋  | 5222/6779 [3:13:51<57:38,  2.22s/it]                                                     {'loss': 1.7914, 'learning_rate': 5.1406710502218815e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5222/6779 [3:13:51<57:38,  2.22s/it] 77%|███████▋  | 5223/6779 [3:13:53<57:51,  2.23s/it]                                                     {'loss': 1.5418, 'learning_rate': 5.134376068976687e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5223/6779 [3:13:53<57:51,  2.23s/it] 77%|███████▋  | 5224/6779 [3:13:55<57:13,  2.21s/it]                                                     {'loss': 1.7065, 'learning_rate': 5.1280843767021046e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5224/6779 [3:13:55<57:13,  2.21s/it] 77%|███████▋  | 5225/6779 [3:13:57<57:37,  2.22s/it]                                                     {'loss': 1.7267, 'learning_rate': 5.121795974790136e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5225/6779 [3:13:57<57:37,  2.22s/it] 77%|███████▋  | 5226/6779 [3:14:00<56:21,  2.18s/it]                                                     {'loss': 1.7612, 'learning_rate': 5.115510864632089e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5226/6779 [3:14:00<56:21,  2.18s/it] 77%|███████▋  | 5227/6779 [3:14:02<57:29,  2.22s/it]                                                     {'loss': 1.7428, 'learning_rate': 5.1092290476185156e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5227/6779 [3:14:02<57:29,  2.22s/it] 77%|███████▋  | 5228/6779 [3:14:04<59:35,  2.30s/it]                                                     {'loss': 1.709, 'learning_rate': 5.102950525139241e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5228/6779 [3:14:04<59:35,  2.30s/it] 77%|███████▋  | 5229/6779 [3:14:07<59:35,  2.31s/it]                                                     {'loss': 1.793, 'learning_rate': 5.096675298583375e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5229/6779 [3:14:07<59:35,  2.31s/it] 77%|███████▋  | 5230/6779 [3:14:09<57:53,  2.24s/it]                                                     {'loss': 1.6504, 'learning_rate': 5.090403369339285e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5230/6779 [3:14:09<57:53,  2.24s/it] 77%|███████▋  | 5231/6779 [3:14:11<57:38,  2.23s/it]                                                     {'loss': 1.512, 'learning_rate': 5.084134738794621e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5231/6779 [3:14:11<57:38,  2.23s/it] 77%|███████▋  | 5232/6779 [3:14:13<57:27,  2.23s/it]                                                     {'loss': 1.7464, 'learning_rate': 5.077869408336284e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5232/6779 [3:14:13<57:27,  2.23s/it] 77%|███████▋  | 5233/6779 [3:14:16<58:19,  2.26s/it]                                                     {'loss': 1.5554, 'learning_rate': 5.07160737935048e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5233/6779 [3:14:16<58:19,  2.26s/it] 77%|███████▋  | 5234/6779 [3:14:18<1:00:09,  2.34s/it]                                                       {'loss': 1.7906, 'learning_rate': 5.065348653222646e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5234/6779 [3:14:18<1:00:09,  2.34s/it] 77%|███████▋  | 5235/6779 [3:14:20<59:14,  2.30s/it]                                                       {'loss': 1.6458, 'learning_rate': 5.059093231337513e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5235/6779 [3:14:20<59:14,  2.30s/it] 77%|███████▋  | 5236/6779 [3:14:23<59:23,  2.31s/it]                                                     {'loss': 1.6252, 'learning_rate': 5.0528411150790675e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5236/6779 [3:14:23<59:23,  2.31s/it] 77%|███████▋  | 5237/6779 [3:14:25<57:14,  2.23s/it]                                                     {'loss': 1.591, 'learning_rate': 5.0465923058305666e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5237/6779 [3:14:25<57:14,  2.23s/it] 77%|███████▋  | 5238/6779 [3:14:27<55:48,  2.17s/it]                                                     {'loss': 1.5946, 'learning_rate': 5.040346804974547e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5238/6779 [3:14:27<55:48,  2.17s/it] 77%|███████▋  | 5239/6779 [3:14:29<55:33,  2.16s/it]                                                     {'loss': 1.6668, 'learning_rate': 5.0341046138927915e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5239/6779 [3:14:29<55:33,  2.16s/it] 77%|███████▋  | 5240/6779 [3:14:31<55:06,  2.15s/it]                                                     {'loss': 1.7522, 'learning_rate': 5.027865733966386e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5240/6779 [3:14:31<55:06,  2.15s/it] 77%|███████▋  | 5241/6779 [3:14:34<59:24,  2.32s/it]                                                     {'loss': 1.6908, 'learning_rate': 5.021630166575646e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5241/6779 [3:14:34<59:24,  2.32s/it] 77%|███████▋  | 5242/6779 [3:14:36<59:44,  2.33s/it]                                                     {'loss': 1.6314, 'learning_rate': 5.0153979131001794e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5242/6779 [3:14:36<59:44,  2.33s/it] 77%|███████▋  | 5243/6779 [3:14:38<58:28,  2.28s/it]                                                     {'loss': 1.8574, 'learning_rate': 5.009168974918841e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5243/6779 [3:14:38<58:28,  2.28s/it] 77%|███████▋  | 5244/6779 [3:14:41<59:46,  2.34s/it]                                                     {'loss': 1.6008, 'learning_rate': 5.0029433534097746e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5244/6779 [3:14:41<59:46,  2.34s/it] 77%|███████▋  | 5245/6779 [3:14:43<59:04,  2.31s/it]                                                     {'loss': 1.6347, 'learning_rate': 4.9967210499503744e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5245/6779 [3:14:43<59:04,  2.31s/it] 77%|███████▋  | 5246/6779 [3:14:45<59:29,  2.33s/it]                                                     {'loss': 1.6776, 'learning_rate': 4.990502065917293e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5246/6779 [3:14:45<59:29,  2.33s/it] 77%|███████▋  | 5247/6779 [3:14:47<58:05,  2.27s/it]                                                     {'loss': 1.5962, 'learning_rate': 4.984286402686482e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5247/6779 [3:14:47<58:05,  2.27s/it] 77%|███████▋  | 5248/6779 [3:14:49<56:49,  2.23s/it]                                                     {'loss': 1.4793, 'learning_rate': 4.9780740616331176e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5248/6779 [3:14:49<56:49,  2.23s/it] 77%|███████▋  | 5249/6779 [3:14:52<56:20,  2.21s/it]                                                     {'loss': 1.6041, 'learning_rate': 4.971865044131676e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5249/6779 [3:14:52<56:20,  2.21s/it] 77%|███████▋  | 5250/6779 [3:14:54<54:50,  2.15s/it]                                                     {'loss': 1.6535, 'learning_rate': 4.965659351555867e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5250/6779 [3:14:54<54:50,  2.15s/it] 77%|███████▋  | 5251/6779 [3:14:56<55:41,  2.19s/it]                                                     {'loss': 1.6434, 'learning_rate': 4.959456985278692e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5251/6779 [3:14:56<55:41,  2.19s/it] 77%|███████▋  | 5252/6779 [3:14:58<54:51,  2.16s/it]                                                     {'loss': 1.6927, 'learning_rate': 4.953257946672394e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5252/6779 [3:14:58<54:51,  2.16s/it] 77%|███████▋  | 5253/6779 [3:15:00<53:55,  2.12s/it]                                                     {'loss': 1.6328, 'learning_rate': 4.9470622371085e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5253/6779 [3:15:00<53:55,  2.12s/it] 78%|███████▊  | 5254/6779 [3:15:02<54:27,  2.14s/it]                                                     {'loss': 1.8469, 'learning_rate': 4.9408698579577776e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5254/6779 [3:15:02<54:27,  2.14s/it] 78%|███████▊  | 5255/6779 [3:15:04<54:06,  2.13s/it]                                                     {'loss': 1.6667, 'learning_rate': 4.9346808105902796e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5255/6779 [3:15:04<54:06,  2.13s/it] 78%|███████▊  | 5256/6779 [3:15:07<54:21,  2.14s/it]                                                     {'loss': 1.5971, 'learning_rate': 4.928495096375316e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5256/6779 [3:15:07<54:21,  2.14s/it] 78%|███████▊  | 5257/6779 [3:15:09<55:47,  2.20s/it]                                                     {'loss': 1.7527, 'learning_rate': 4.922312716681445e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5257/6779 [3:15:09<55:47,  2.20s/it] 78%|███████▊  | 5258/6779 [3:15:11<55:16,  2.18s/it]                                                     {'loss': 1.7276, 'learning_rate': 4.91613367287651e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5258/6779 [3:15:11<55:16,  2.18s/it] 78%|███████▊  | 5259/6779 [3:15:13<55:35,  2.19s/it]                                                     {'loss': 1.7362, 'learning_rate': 4.909957966327592e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5259/6779 [3:15:13<55:35,  2.19s/it] 78%|███████▊  | 5260/6779 [3:15:16<56:36,  2.24s/it]                                                     {'loss': 1.5658, 'learning_rate': 4.903785598401056e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5260/6779 [3:15:16<56:36,  2.24s/it] 78%|███████▊  | 5261/6779 [3:15:18<57:05,  2.26s/it]                                                     {'loss': 1.7148, 'learning_rate': 4.897616570462509e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5261/6779 [3:15:18<57:05,  2.26s/it] 78%|███████▊  | 5262/6779 [3:15:20<56:21,  2.23s/it]                                                     {'loss': 1.7331, 'learning_rate': 4.8914508838768314e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5262/6779 [3:15:20<56:21,  2.23s/it] 78%|███████▊  | 5263/6779 [3:15:22<54:13,  2.15s/it]                                                     {'loss': 1.7035, 'learning_rate': 4.885288540008171e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5263/6779 [3:15:22<54:13,  2.15s/it] 78%|███████▊  | 5264/6779 [3:15:24<55:41,  2.21s/it]                                                     {'loss': 1.8813, 'learning_rate': 4.879129540219909e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5264/6779 [3:15:24<55:41,  2.21s/it] 78%|███████▊  | 5265/6779 [3:15:27<56:18,  2.23s/it]                                                     {'loss': 1.7589, 'learning_rate': 4.872973885874721e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5265/6779 [3:15:27<56:18,  2.23s/it] 78%|███████▊  | 5266/6779 [3:15:29<56:37,  2.25s/it]                                                     {'loss': 1.778, 'learning_rate': 4.8668215783345106e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5266/6779 [3:15:29<56:37,  2.25s/it] 78%|███████▊  | 5267/6779 [3:15:31<58:20,  2.31s/it]                                                     {'loss': 1.5544, 'learning_rate': 4.860672618960469e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5267/6779 [3:15:31<58:20,  2.31s/it] 78%|███████▊  | 5268/6779 [3:15:34<59:51,  2.38s/it]                                                     {'loss': 1.5877, 'learning_rate': 4.854527009113019e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5268/6779 [3:15:34<59:51,  2.38s/it] 78%|███████▊  | 5269/6779 [3:15:36<57:11,  2.27s/it]                                                     {'loss': 1.5079, 'learning_rate': 4.848384750151864e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5269/6779 [3:15:36<57:11,  2.27s/it] 78%|███████▊  | 5270/6779 [3:15:38<56:01,  2.23s/it]                                                     {'loss': 1.6247, 'learning_rate': 4.8422458434359665e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5270/6779 [3:15:38<56:01,  2.23s/it] 78%|███████▊  | 5271/6779 [3:15:40<55:04,  2.19s/it]                                                     {'loss': 1.6482, 'learning_rate': 4.8361102903235256e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5271/6779 [3:15:40<55:04,  2.19s/it] 78%|███████▊  | 5272/6779 [3:15:43<57:26,  2.29s/it]                                                     {'loss': 1.7578, 'learning_rate': 4.8299780921720253e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5272/6779 [3:15:43<57:26,  2.29s/it] 78%|███████▊  | 5273/6779 [3:15:45<56:27,  2.25s/it]                                                     {'loss': 1.6062, 'learning_rate': 4.8238492503381815e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5273/6779 [3:15:45<56:27,  2.25s/it] 78%|███████▊  | 5274/6779 [3:15:47<56:07,  2.24s/it]                                                     {'loss': 1.6177, 'learning_rate': 4.817723766177991e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5274/6779 [3:15:47<56:07,  2.24s/it] 78%|███████▊  | 5275/6779 [3:15:49<56:06,  2.24s/it]                                                     {'loss': 1.6369, 'learning_rate': 4.811601641046688e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5275/6779 [3:15:49<56:06,  2.24s/it] 78%|███████▊  | 5276/6779 [3:15:51<55:12,  2.20s/it]                                                     {'loss': 1.5981, 'learning_rate': 4.8054828762987766e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5276/6779 [3:15:51<55:12,  2.20s/it] 78%|███████▊  | 5277/6779 [3:15:54<54:32,  2.18s/it]                                                     {'loss': 1.7093, 'learning_rate': 4.799367473288021e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5277/6779 [3:15:54<54:32,  2.18s/it] 78%|███████▊  | 5278/6779 [3:15:56<55:12,  2.21s/it]                                                     {'loss': 1.763, 'learning_rate': 4.7932554333674206e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5278/6779 [3:15:56<55:12,  2.21s/it] 78%|███████▊  | 5279/6779 [3:15:58<54:32,  2.18s/it]                                                     {'loss': 1.4893, 'learning_rate': 4.787146757889258e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5279/6779 [3:15:58<54:32,  2.18s/it] 78%|███████▊  | 5280/6779 [3:16:00<53:24,  2.14s/it]                                                     {'loss': 1.572, 'learning_rate': 4.781041448205044e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5280/6779 [3:16:00<53:24,  2.14s/it] 78%|███████▊  | 5281/6779 [3:16:02<52:54,  2.12s/it]                                                     {'loss': 1.575, 'learning_rate': 4.774939505665572e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5281/6779 [3:16:02<52:54,  2.12s/it] 78%|███████▊  | 5282/6779 [3:16:04<51:54,  2.08s/it]                                                     {'loss': 1.6442, 'learning_rate': 4.7688409316208614e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5282/6779 [3:16:04<51:54,  2.08s/it] 78%|███████▊  | 5283/6779 [3:16:06<52:35,  2.11s/it]                                                     {'loss': 1.6652, 'learning_rate': 4.762745727420212e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5283/6779 [3:16:06<52:35,  2.11s/it] 78%|███████▊  | 5284/6779 [3:16:08<52:06,  2.09s/it]                                                     {'loss': 1.7372, 'learning_rate': 4.756653894412171e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5284/6779 [3:16:08<52:06,  2.09s/it] 78%|███████▊  | 5285/6779 [3:16:11<53:48,  2.16s/it]                                                     {'loss': 1.6537, 'learning_rate': 4.750565433944525e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5285/6779 [3:16:11<53:48,  2.16s/it] 78%|███████▊  | 5286/6779 [3:16:13<54:23,  2.19s/it]                                                     {'loss': 1.5978, 'learning_rate': 4.7444803473643394e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5286/6779 [3:16:13<54:23,  2.19s/it] 78%|███████▊  | 5287/6779 [3:16:15<55:38,  2.24s/it]                                                     {'loss': 1.6285, 'learning_rate': 4.7383986360179044e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5287/6779 [3:16:15<55:38,  2.24s/it] 78%|███████▊  | 5288/6779 [3:16:17<55:35,  2.24s/it]                                                     {'loss': 1.7549, 'learning_rate': 4.732320301250794e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5288/6779 [3:16:17<55:35,  2.24s/it] 78%|███████▊  | 5289/6779 [3:16:20<55:33,  2.24s/it]                                                     {'loss': 1.7587, 'learning_rate': 4.7262453444078024e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5289/6779 [3:16:20<55:33,  2.24s/it] 78%|███████▊  | 5290/6779 [3:16:22<55:17,  2.23s/it]                                                     {'loss': 1.6632, 'learning_rate': 4.720173766833016e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5290/6779 [3:16:22<55:17,  2.23s/it] 78%|███████▊  | 5291/6779 [3:16:24<55:19,  2.23s/it]                                                     {'loss': 1.5467, 'learning_rate': 4.714105569869738e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5291/6779 [3:16:24<55:19,  2.23s/it] 78%|███████▊  | 5292/6779 [3:16:26<54:27,  2.20s/it]                                                     {'loss': 1.7483, 'learning_rate': 4.708040754860532e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5292/6779 [3:16:26<54:27,  2.20s/it] 78%|███████▊  | 5293/6779 [3:16:28<54:59,  2.22s/it]                                                     {'loss': 1.5705, 'learning_rate': 4.701979323147234e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5293/6779 [3:16:28<54:59,  2.22s/it] 78%|███████▊  | 5294/6779 [3:16:31<53:29,  2.16s/it]                                                     {'loss': 1.5895, 'learning_rate': 4.695921276070898e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5294/6779 [3:16:31<53:29,  2.16s/it] 78%|███████▊  | 5295/6779 [3:16:33<54:23,  2.20s/it]                                                     {'loss': 1.5498, 'learning_rate': 4.689866614971865e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5295/6779 [3:16:33<54:23,  2.20s/it] 78%|███████▊  | 5296/6779 [3:16:35<53:33,  2.17s/it]                                                     {'loss': 1.5068, 'learning_rate': 4.683815341189688e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5296/6779 [3:16:35<53:33,  2.17s/it] 78%|███████▊  | 5297/6779 [3:16:37<53:04,  2.15s/it]                                                     {'loss': 1.7315, 'learning_rate': 4.6777674560632134e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5297/6779 [3:16:37<53:04,  2.15s/it] 78%|███████▊  | 5298/6779 [3:16:39<53:41,  2.18s/it]                                                     {'loss': 1.648, 'learning_rate': 4.6717229609305094e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5298/6779 [3:16:39<53:41,  2.18s/it] 78%|███████▊  | 5299/6779 [3:16:41<52:53,  2.14s/it]                                                     {'loss': 1.4067, 'learning_rate': 4.66568185712889e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5299/6779 [3:16:41<52:53,  2.14s/it] 78%|███████▊  | 5300/6779 [3:16:43<53:02,  2.15s/it]                                                     {'loss': 1.6531, 'learning_rate': 4.659644145994941e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5300/6779 [3:16:43<53:02,  2.15s/it] 78%|███████▊  | 5301/6779 [3:16:46<52:16,  2.12s/it]                                                     {'loss': 1.699, 'learning_rate': 4.6536098288644804e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5301/6779 [3:16:46<52:16,  2.12s/it] 78%|███████▊  | 5302/6779 [3:16:48<53:09,  2.16s/it]                                                     {'loss': 1.6985, 'learning_rate': 4.647578907072587e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5302/6779 [3:16:48<53:09,  2.16s/it] 78%|███████▊  | 5303/6779 [3:16:50<53:50,  2.19s/it]                                                     {'loss': 1.7303, 'learning_rate': 4.641551381953566e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5303/6779 [3:16:50<53:50,  2.19s/it] 78%|███████▊  | 5304/6779 [3:16:52<52:52,  2.15s/it]                                                     {'loss': 1.588, 'learning_rate': 4.635527254841014e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5304/6779 [3:16:52<52:52,  2.15s/it] 78%|███████▊  | 5305/6779 [3:16:54<53:56,  2.20s/it]                                                     {'loss': 1.7224, 'learning_rate': 4.629506527067729e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5305/6779 [3:16:54<53:56,  2.20s/it] 78%|███████▊  | 5306/6779 [3:16:56<52:54,  2.16s/it]                                                     {'loss': 1.5375, 'learning_rate': 4.623489199965789e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5306/6779 [3:16:56<52:54,  2.16s/it] 78%|███████▊  | 5307/6779 [3:16:59<57:47,  2.36s/it]                                                     {'loss': 1.7412, 'learning_rate': 4.617475274866503e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5307/6779 [3:16:59<57:47,  2.36s/it] 78%|███████▊  | 5308/6779 [3:17:02<58:10,  2.37s/it]                                                     {'loss': 1.723, 'learning_rate': 4.611464753100427e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5308/6779 [3:17:02<58:10,  2.37s/it] 78%|███████▊  | 5309/6779 [3:17:04<57:23,  2.34s/it]                                                     {'loss': 1.7288, 'learning_rate': 4.605457635997381e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5309/6779 [3:17:04<57:23,  2.34s/it] 78%|███████▊  | 5310/6779 [3:17:06<55:59,  2.29s/it]                                                     {'loss': 1.6788, 'learning_rate': 4.599453924886401e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5310/6779 [3:17:06<55:59,  2.29s/it] 78%|███████▊  | 5311/6779 [3:17:08<55:29,  2.27s/it]                                                     {'loss': 1.7393, 'learning_rate': 4.593453621095811e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5311/6779 [3:17:08<55:29,  2.27s/it] 78%|███████▊  | 5312/6779 [3:17:11<56:52,  2.33s/it]                                                     {'loss': 1.6011, 'learning_rate': 4.587456725953143e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5312/6779 [3:17:11<56:52,  2.33s/it] 78%|███████▊  | 5313/6779 [3:17:13<55:50,  2.29s/it]                                                     {'loss': 1.7018, 'learning_rate': 4.581463240785202e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5313/6779 [3:17:13<55:50,  2.29s/it] 78%|███████▊  | 5314/6779 [3:17:15<56:44,  2.32s/it]                                                     {'loss': 1.703, 'learning_rate': 4.575473166918016e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5314/6779 [3:17:15<56:44,  2.32s/it] 78%|███████▊  | 5315/6779 [3:17:18<55:08,  2.26s/it]                                                     {'loss': 1.7382, 'learning_rate': 4.5694865056768764e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5315/6779 [3:17:18<55:08,  2.26s/it] 78%|███████▊  | 5316/6779 [3:17:20<55:05,  2.26s/it]                                                     {'loss': 1.7184, 'learning_rate': 4.5635032583863124e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5316/6779 [3:17:20<55:05,  2.26s/it] 78%|███████▊  | 5317/6779 [3:17:22<56:08,  2.30s/it]                                                     {'loss': 1.7387, 'learning_rate': 4.557523426370085e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5317/6779 [3:17:22<56:08,  2.30s/it] 78%|███████▊  | 5318/6779 [3:17:24<55:22,  2.27s/it]                                                     {'loss': 1.6128, 'learning_rate': 4.551547010951231e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5318/6779 [3:17:24<55:22,  2.27s/it] 78%|███████▊  | 5319/6779 [3:17:27<55:15,  2.27s/it]                                                     {'loss': 1.6848, 'learning_rate': 4.545574013452001e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5319/6779 [3:17:27<55:15,  2.27s/it] 78%|███████▊  | 5320/6779 [3:17:29<54:53,  2.26s/it]                                                     {'loss': 1.6633, 'learning_rate': 4.539604435193909e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5320/6779 [3:17:29<54:53,  2.26s/it] 78%|███████▊  | 5321/6779 [3:17:31<54:59,  2.26s/it]                                                     {'loss': 1.605, 'learning_rate': 4.533638277497696e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5321/6779 [3:17:31<54:59,  2.26s/it] 79%|███████▊  | 5322/6779 [3:17:33<54:16,  2.24s/it]                                                     {'loss': 1.7186, 'learning_rate': 4.527675541683365e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5322/6779 [3:17:33<54:16,  2.24s/it] 79%|███████▊  | 5323/6779 [3:17:35<53:17,  2.20s/it]                                                     {'loss': 1.7666, 'learning_rate': 4.521716229070139e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5323/6779 [3:17:35<53:17,  2.20s/it] 79%|███████▊  | 5324/6779 [3:17:38<53:29,  2.21s/it]                                                     {'loss': 1.5431, 'learning_rate': 4.515760340976505e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5324/6779 [3:17:38<53:29,  2.21s/it] 79%|███████▊  | 5325/6779 [3:17:40<55:04,  2.27s/it]                                                     {'loss': 1.6206, 'learning_rate': 4.509807878720187e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5325/6779 [3:17:40<55:04,  2.27s/it] 79%|███████▊  | 5326/6779 [3:17:42<54:02,  2.23s/it]                                                     {'loss': 1.4984, 'learning_rate': 4.5038588436181364e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5326/6779 [3:17:42<54:02,  2.23s/it] 79%|███████▊  | 5327/6779 [3:17:44<54:17,  2.24s/it]                                                     {'loss': 1.7075, 'learning_rate': 4.4979132369865703e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5327/6779 [3:17:44<54:17,  2.24s/it] 79%|███████▊  | 5328/6779 [3:17:47<55:09,  2.28s/it]                                                     {'loss': 1.6498, 'learning_rate': 4.4919710601409226e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5328/6779 [3:17:47<55:09,  2.28s/it] 79%|███████▊  | 5329/6779 [3:17:49<53:16,  2.20s/it]                                                     {'loss': 1.8893, 'learning_rate': 4.486032314395892e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5329/6779 [3:17:49<53:16,  2.20s/it] 79%|███████▊  | 5330/6779 [3:17:51<53:08,  2.20s/it]                                                     {'loss': 1.519, 'learning_rate': 4.480097001065395e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5330/6779 [3:17:51<53:08,  2.20s/it] 79%|███████▊  | 5331/6779 [3:17:53<53:15,  2.21s/it]                                                     {'loss': 1.608, 'learning_rate': 4.4741651214626146e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5331/6779 [3:17:53<53:15,  2.21s/it] 79%|███████▊  | 5332/6779 [3:17:56<53:34,  2.22s/it]                                                     {'loss': 1.5338, 'learning_rate': 4.468236676899942e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5332/6779 [3:17:56<53:34,  2.22s/it] 79%|███████▊  | 5333/6779 [3:17:58<54:50,  2.28s/it]                                                     {'loss': 1.6575, 'learning_rate': 4.4623116686890384e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5333/6779 [3:17:58<54:50,  2.28s/it] 79%|███████▊  | 5334/6779 [3:18:00<54:13,  2.25s/it]                                                     {'loss': 1.6029, 'learning_rate': 4.456390098140792e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5334/6779 [3:18:00<54:13,  2.25s/it] 79%|███████▊  | 5335/6779 [3:18:02<52:57,  2.20s/it]                                                     {'loss': 1.6309, 'learning_rate': 4.450471966565326e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5335/6779 [3:18:02<52:57,  2.20s/it] 79%|███████▊  | 5336/6779 [3:18:04<52:41,  2.19s/it]                                                     {'loss': 1.6445, 'learning_rate': 4.444557275272014e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5336/6779 [3:18:04<52:41,  2.19s/it] 79%|███████▊  | 5337/6779 [3:18:07<53:47,  2.24s/it]                                                     {'loss': 1.5348, 'learning_rate': 4.438646025569453e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5337/6779 [3:18:07<53:47,  2.24s/it] 79%|███████▊  | 5338/6779 [3:18:09<54:54,  2.29s/it]                                                     {'loss': 1.6221, 'learning_rate': 4.4327382187654995e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5338/6779 [3:18:09<54:54,  2.29s/it] 79%|███████▉  | 5339/6779 [3:18:11<53:23,  2.22s/it]                                                     {'loss': 1.6922, 'learning_rate': 4.426833856167223e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5339/6779 [3:18:11<53:23,  2.22s/it] 79%|███████▉  | 5340/6779 [3:18:14<54:03,  2.25s/it]                                                     {'loss': 1.4577, 'learning_rate': 4.4209329390809506e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5340/6779 [3:18:14<54:03,  2.25s/it] 79%|███████▉  | 5341/6779 [3:18:16<54:27,  2.27s/it]                                                     {'loss': 1.4496, 'learning_rate': 4.4150354688122476e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5341/6779 [3:18:16<54:27,  2.27s/it] 79%|███████▉  | 5342/6779 [3:18:18<53:21,  2.23s/it]                                                     {'loss': 1.6485, 'learning_rate': 4.4091414466658987e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5342/6779 [3:18:18<53:21,  2.23s/it] 79%|███████▉  | 5343/6779 [3:18:20<52:25,  2.19s/it]                                                     {'loss': 1.5785, 'learning_rate': 4.4032508739459456e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5343/6779 [3:18:20<52:25,  2.19s/it] 79%|███████▉  | 5344/6779 [3:18:22<53:14,  2.23s/it]                                                     {'loss': 1.6042, 'learning_rate': 4.39736375195565e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5344/6779 [3:18:22<53:14,  2.23s/it] 79%|███████▉  | 5345/6779 [3:18:25<52:54,  2.21s/it]                                                     {'loss': 1.5154, 'learning_rate': 4.39148008199753e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5345/6779 [3:18:25<52:54,  2.21s/it] 79%|███████▉  | 5346/6779 [3:18:27<53:25,  2.24s/it]                                                     {'loss': 1.6472, 'learning_rate': 4.3855998653733154e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5346/6779 [3:18:27<53:25,  2.24s/it] 79%|███████▉  | 5347/6779 [3:18:29<53:58,  2.26s/it]                                                     {'loss': 1.717, 'learning_rate': 4.379723103383988e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5347/6779 [3:18:29<53:58,  2.26s/it] 79%|███████▉  | 5348/6779 [3:18:32<55:49,  2.34s/it]                                                     {'loss': 1.6136, 'learning_rate': 4.373849797329774e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5348/6779 [3:18:32<55:49,  2.34s/it] 79%|███████▉  | 5349/6779 [3:18:34<53:30,  2.25s/it]                                                     {'loss': 1.5375, 'learning_rate': 4.367979948510106e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5349/6779 [3:18:34<53:30,  2.25s/it] 79%|███████▉  | 5350/6779 [3:18:37<57:19,  2.41s/it]                                                     {'loss': 1.667, 'learning_rate': 4.362113558223684e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5350/6779 [3:18:37<57:19,  2.41s/it] 79%|███████▉  | 5351/6779 [3:18:39<56:37,  2.38s/it]                                                     {'loss': 1.8143, 'learning_rate': 4.3562506277684144e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5351/6779 [3:18:39<56:37,  2.38s/it] 79%|███████▉  | 5352/6779 [3:18:41<56:51,  2.39s/it]                                                     {'loss': 1.5424, 'learning_rate': 4.350391158441465e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5352/6779 [3:18:41<56:51,  2.39s/it] 79%|███████▉  | 5353/6779 [3:18:43<54:29,  2.29s/it]                                                     {'loss': 1.6417, 'learning_rate': 4.3445351515392086e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5353/6779 [3:18:43<54:29,  2.29s/it] 79%|███████▉  | 5354/6779 [3:18:46<54:40,  2.30s/it]                                                     {'loss': 1.6509, 'learning_rate': 4.3386826083572764e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5354/6779 [3:18:46<54:40,  2.30s/it] 79%|███████▉  | 5355/6779 [3:18:48<55:15,  2.33s/it]                                                     {'loss': 1.6496, 'learning_rate': 4.3328335301905276e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5355/6779 [3:18:48<55:15,  2.33s/it] 79%|███████▉  | 5356/6779 [3:18:50<54:17,  2.29s/it]                                                     {'loss': 1.6489, 'learning_rate': 4.3269879183330456e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5356/6779 [3:18:50<54:17,  2.29s/it] 79%|███████▉  | 5357/6779 [3:18:52<53:59,  2.28s/it]                                                     {'loss': 1.7899, 'learning_rate': 4.321145774078157e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5357/6779 [3:18:52<53:59,  2.28s/it] 79%|███████▉  | 5358/6779 [3:18:55<52:27,  2.21s/it]                                                     {'loss': 1.5825, 'learning_rate': 4.3153070987184106e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5358/6779 [3:18:55<52:27,  2.21s/it] 79%|███████▉  | 5359/6779 [3:18:57<52:56,  2.24s/it]                                                     {'loss': 1.6446, 'learning_rate': 4.309471893545605e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5359/6779 [3:18:57<52:56,  2.24s/it] 79%|███████▉  | 5360/6779 [3:18:59<51:24,  2.17s/it]                                                     {'loss': 1.5767, 'learning_rate': 4.303640159850741e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5360/6779 [3:18:59<51:24,  2.17s/it] 79%|███████▉  | 5361/6779 [3:19:01<52:14,  2.21s/it]                                                     {'loss': 1.698, 'learning_rate': 4.297811898924098e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5361/6779 [3:19:01<52:14,  2.21s/it] 79%|███████▉  | 5362/6779 [3:19:03<52:54,  2.24s/it]                                                     {'loss': 1.6187, 'learning_rate': 4.2919871120551426e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5362/6779 [3:19:03<52:54,  2.24s/it] 79%|███████▉  | 5363/6779 [3:19:06<53:05,  2.25s/it]                                                     {'loss': 1.659, 'learning_rate': 4.286165800532587e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5363/6779 [3:19:06<53:05,  2.25s/it] 79%|███████▉  | 5364/6779 [3:19:08<52:38,  2.23s/it]                                                     {'loss': 1.6613, 'learning_rate': 4.2803479656443867e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5364/6779 [3:19:08<52:38,  2.23s/it] 79%|███████▉  | 5365/6779 [3:19:10<51:45,  2.20s/it]                                                     {'loss': 1.7404, 'learning_rate': 4.274533608677711e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5365/6779 [3:19:10<51:45,  2.20s/it] 79%|███████▉  | 5366/6779 [3:19:12<52:28,  2.23s/it]                                                     {'loss': 1.7485, 'learning_rate': 4.268722730918975e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5366/6779 [3:19:12<52:28,  2.23s/it] 79%|███████▉  | 5367/6779 [3:19:15<52:35,  2.23s/it]                                                     {'loss': 1.5247, 'learning_rate': 4.262915333653803e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5367/6779 [3:19:15<52:35,  2.23s/it] 79%|███████▉  | 5368/6779 [3:19:17<53:00,  2.25s/it]                                                     {'loss': 1.6845, 'learning_rate': 4.2571114181670815e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5368/6779 [3:19:17<53:00,  2.25s/it] 79%|███████▉  | 5369/6779 [3:19:19<52:34,  2.24s/it]                                                     {'loss': 1.5112, 'learning_rate': 4.251310985742891e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5369/6779 [3:19:19<52:34,  2.24s/it] 79%|███████▉  | 5370/6779 [3:19:21<51:36,  2.20s/it]                                                     {'loss': 1.6323, 'learning_rate': 4.245514037664573e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5370/6779 [3:19:21<51:36,  2.20s/it] 79%|███████▉  | 5371/6779 [3:19:24<52:34,  2.24s/it]                                                     {'loss': 1.6338, 'learning_rate': 4.239720575214676e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5371/6779 [3:19:24<52:34,  2.24s/it] 79%|█████���█▉  | 5372/6779 [3:19:26<52:35,  2.24s/it]                                                     {'loss': 1.6702, 'learning_rate': 4.233930599674978e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5372/6779 [3:19:26<52:35,  2.24s/it] 79%|███████▉  | 5373/6779 [3:19:28<51:17,  2.19s/it]                                                     {'loss': 1.7724, 'learning_rate': 4.228144112326502e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5373/6779 [3:19:28<51:17,  2.19s/it] 79%|███████▉  | 5374/6779 [3:19:30<49:42,  2.12s/it]                                                     {'loss': 1.6674, 'learning_rate': 4.222361114449478e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5374/6779 [3:19:30<49:42,  2.12s/it] 79%|███████▉  | 5375/6779 [3:19:32<50:14,  2.15s/it]                                                     {'loss': 1.7564, 'learning_rate': 4.216581607323391e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5375/6779 [3:19:32<50:14,  2.15s/it] 79%|███████▉  | 5376/6779 [3:19:34<50:28,  2.16s/it]                                                     {'loss': 1.6824, 'learning_rate': 4.2108055922269254e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5376/6779 [3:19:34<50:28,  2.16s/it] 79%|███████▉  | 5377/6779 [3:19:36<51:16,  2.19s/it]                                                     {'loss': 1.7706, 'learning_rate': 4.205033070438016e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5377/6779 [3:19:37<51:16,  2.19s/it] 79%|███████▉  | 5378/6779 [3:19:39<51:44,  2.22s/it]                                                     {'loss': 1.6673, 'learning_rate': 4.19926404323381e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5378/6779 [3:19:39<51:44,  2.22s/it] 79%|███████▉  | 5379/6779 [3:19:41<49:59,  2.14s/it]                                                     {'loss': 1.7452, 'learning_rate': 4.1934985118906766e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5379/6779 [3:19:41<49:59,  2.14s/it] 79%|███████▉  | 5380/6779 [3:19:43<51:43,  2.22s/it]                                                     {'loss': 1.7164, 'learning_rate': 4.1877364776842344e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5380/6779 [3:19:43<51:43,  2.22s/it] 79%|███████▉  | 5381/6779 [3:19:45<51:51,  2.23s/it]                                                     {'loss': 1.4646, 'learning_rate': 4.181977941889299e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5381/6779 [3:19:45<51:51,  2.23s/it] 79%|███████▉  | 5382/6779 [3:19:47<50:26,  2.17s/it]                                                     {'loss': 1.6569, 'learning_rate': 4.176222905779947e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5382/6779 [3:19:47<50:26,  2.17s/it] 79%|███████▉  | 5383/6779 [3:19:49<49:50,  2.14s/it]                                                     {'loss': 1.6276, 'learning_rate': 4.1704713706294475e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5383/6779 [3:19:49<49:50,  2.14s/it] 79%|███████▉  | 5384/6779 [3:19:52<49:33,  2.13s/it]                                                     {'loss': 1.632, 'learning_rate': 4.164723337710317e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5384/6779 [3:19:52<49:33,  2.13s/it] 79%|███████▉  | 5385/6779 [3:19:54<50:13,  2.16s/it]                                                     {'loss': 1.6889, 'learning_rate': 4.15897880829428e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5385/6779 [3:19:54<50:13,  2.16s/it] 79%|███████▉  | 5386/6779 [3:19:56<50:32,  2.18s/it]                                                     {'loss': 1.7076, 'learning_rate': 4.153237783652304e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5386/6779 [3:19:56<50:32,  2.18s/it] 79%|███████▉  | 5387/6779 [3:19:59<55:02,  2.37s/it]                                                     {'loss': 1.691, 'learning_rate': 4.147500265054569e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5387/6779 [3:19:59<55:02,  2.37s/it] 79%|███████▉  | 5388/6779 [3:20:01<53:56,  2.33s/it]                                                     {'loss': 1.6228, 'learning_rate': 4.141766253770469e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5388/6779 [3:20:01<53:56,  2.33s/it] 79%|███████▉  | 5389/6779 [3:20:03<54:06,  2.34s/it]                                                     {'loss': 1.723, 'learning_rate': 4.1360357510686586e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5389/6779 [3:20:03<54:06,  2.34s/it] 80%|███████▉  | 5390/6779 [3:20:06<53:58,  2.33s/it]                                                     {'loss': 1.7209, 'learning_rate': 4.130308758216974e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5390/6779 [3:20:06<53:58,  2.33s/it] 80%|███████▉  | 5391/6779 [3:20:08<54:28,  2.35s/it]                                                     {'loss': 1.7469, 'learning_rate': 4.1245852764825086e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5391/6779 [3:20:08<54:28,  2.35s/it] 80%|███████▉  | 5392/6779 [3:20:10<52:36,  2.28s/it]                                                     {'loss': 1.7025, 'learning_rate': 4.11886530713155e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5392/6779 [3:20:10<52:36,  2.28s/it] 80%|███████▉  | 5393/6779 [3:20:12<52:15,  2.26s/it]                                                     {'loss': 1.6193, 'learning_rate': 4.113148851429633e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5393/6779 [3:20:13<52:15,  2.26s/it] 80%|███████▉  | 5394/6779 [3:20:15<51:21,  2.22s/it]                                                     {'loss': 1.741, 'learning_rate': 4.107435910641495e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5394/6779 [3:20:15<51:21,  2.22s/it] 80%|███████▉  | 5395/6779 [3:20:17<51:10,  2.22s/it]                                                     {'loss': 1.8018, 'learning_rate': 4.101726486031112e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5395/6779 [3:20:17<51:10,  2.22s/it] 80%|███████▉  | 5396/6779 [3:20:19<51:04,  2.22s/it]                                                     {'loss': 1.7898, 'learning_rate': 4.096020578861679e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5396/6779 [3:20:19<51:04,  2.22s/it] 80%|███████▉  | 5397/6779 [3:20:21<51:29,  2.24s/it]                                                     {'loss': 1.6663, 'learning_rate': 4.0903181903956014e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5397/6779 [3:20:21<51:29,  2.24s/it] 80%|███████▉  | 5398/6779 [3:20:24<53:11,  2.31s/it]                                                     {'loss': 1.6127, 'learning_rate': 4.0846193218945206e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5398/6779 [3:20:24<53:11,  2.31s/it] 80%|███████▉  | 5399/6779 [3:20:26<52:54,  2.30s/it]                                                     {'loss': 1.5707, 'learning_rate': 4.078923974619284e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5399/6779 [3:20:26<52:54,  2.30s/it] 80%|███████▉  | 5400/6779 [3:20:29<53:46,  2.34s/it]                                                     {'loss': 1.7207, 'learning_rate': 4.07323214982998e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5400/6779 [3:20:29<53:46,  2.34s/it] 80%|███████▉  | 5401/6779 [3:20:31<52:15,  2.28s/it]                                                     {'loss': 1.6327, 'learning_rate': 4.067543848785895e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5401/6779 [3:20:31<52:15,  2.28s/it] 80%|███████▉  | 5402/6779 [3:20:33<50:43,  2.21s/it]                                                     {'loss': 1.6506, 'learning_rate': 4.061859072745551e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5402/6779 [3:20:33<50:43,  2.21s/it] 80%|███████▉  | 5403/6779 [3:20:35<51:02,  2.23s/it]                                                     {'loss': 1.623, 'learning_rate': 4.0561778229666914e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5403/6779 [3:20:35<51:02,  2.23s/it] 80%|███████▉  | 5404/6779 [3:20:37<51:02,  2.23s/it]                                                     {'loss': 1.4654, 'learning_rate': 4.050500100706267e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5404/6779 [3:20:37<51:02,  2.23s/it] 80%|███████▉  | 5405/6779 [3:20:40<52:15,  2.28s/it]                                                     {'loss': 1.4795, 'learning_rate': 4.044825907220462e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5405/6779 [3:20:40<52:15,  2.28s/it] 80%|███████▉  | 5406/6779 [3:20:42<50:55,  2.23s/it]                                                     {'loss': 1.4884, 'learning_rate': 4.0391552437646626e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5406/6779 [3:20:42<50:55,  2.23s/it] 80%|███████▉  | 5407/6779 [3:20:44<49:59,  2.19s/it]                                                     {'loss': 1.5904, 'learning_rate': 4.033488111593497e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5407/6779 [3:20:44<49:59,  2.19s/it] 80%|███████▉  | 5408/6779 [3:20:46<50:24,  2.21s/it]                                                     {'loss': 1.621, 'learning_rate': 4.0278245119607896e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5408/6779 [3:20:46<50:24,  2.21s/it] 80%|███████▉  | 5409/6779 [3:20:48<51:43,  2.27s/it]                                                     {'loss': 1.7418, 'learning_rate': 4.022164446119603e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5409/6779 [3:20:48<51:43,  2.27s/it] 80%|███████▉  | 5410/6779 [3:20:51<50:19,  2.21s/it]                                                     {'loss': 1.4539, 'learning_rate': 4.016507915322196e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5410/6779 [3:20:51<50:19,  2.21s/it] 80%|███████▉  | 5411/6779 [3:20:53<50:53,  2.23s/it]                                                     {'loss': 1.6018, 'learning_rate': 4.010854920820064e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5411/6779 [3:20:53<50:53,  2.23s/it] 80%|███████▉  | 5412/6779 [3:20:55<53:19,  2.34s/it]                                                     {'loss': 1.6011, 'learning_rate': 4.005205463863919e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5412/6779 [3:20:55<53:19,  2.34s/it] 80%|███████▉  | 5413/6779 [3:20:58<51:38,  2.27s/it]                                                     {'loss': 1.5628, 'learning_rate': 3.999559545703675e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5413/6779 [3:20:58<51:38,  2.27s/it] 80%|███████▉  | 5414/6779 [3:21:00<50:38,  2.23s/it]                                                     {'loss': 1.6773, 'learning_rate': 3.993917167588484e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5414/6779 [3:21:00<50:38,  2.23s/it] 80%|███████▉  | 5415/6779 [3:21:02<50:01,  2.20s/it]                                                     {'loss': 1.7134, 'learning_rate': 3.988278330766688e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5415/6779 [3:21:02<50:01,  2.20s/it] 80%|███████▉  | 5416/6779 [3:21:05<54:05,  2.38s/it]                                                     {'loss': 1.659, 'learning_rate': 3.982643036485878e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5416/6779 [3:21:05<54:05,  2.38s/it] 80%|███████▉  | 5417/6779 [3:21:07<52:42,  2.32s/it]                                                     {'loss': 1.5384, 'learning_rate': 3.977011285992831e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5417/6779 [3:21:07<52:42,  2.32s/it] 80%|███████▉  | 5418/6779 [3:21:09<51:00,  2.25s/it]                                                     {'loss': 1.7626, 'learning_rate': 3.97138308053356e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5418/6779 [3:21:09<51:00,  2.25s/it] 80%|███████▉  | 5419/6779 [3:21:11<50:23,  2.22s/it]                                                     {'loss': 1.4086, 'learning_rate': 3.9657584213532894e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5419/6779 [3:21:11<50:23,  2.22s/it] 80%|███████▉  | 5420/6779 [3:21:13<50:58,  2.25s/it]                                                     {'loss': 1.6157, 'learning_rate': 3.960137309696448e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5420/6779 [3:21:13<50:58,  2.25s/it] 80%|███████▉  | 5421/6779 [3:21:16<52:38,  2.33s/it]                                                     {'loss': 1.7166, 'learning_rate': 3.9545197468067e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5421/6779 [3:21:16<52:38,  2.33s/it] 80%|███████▉  | 5422/6779 [3:21:18<50:55,  2.25s/it]                                                     {'loss': 1.6799, 'learning_rate': 3.9489057339268995e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5422/6779 [3:21:18<50:55,  2.25s/it] 80%|███████▉  | 5423/6779 [3:21:20<51:31,  2.28s/it]                                                     {'loss': 1.577, 'learning_rate': 3.943295272299143e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5423/6779 [3:21:20<51:31,  2.28s/it] 80%|████████  | 5424/6779 [3:21:23<51:46,  2.29s/it]                                                     {'loss': 1.7693, 'learning_rate': 3.937688363164711e-05, 'epoch': 0.8}
+ 80%|████████  | 5424/6779 [3:21:23<51:46,  2.29s/it] 80%|████████  | 5425/6779 [3:21:25<50:30,  2.24s/it]                                                     {'loss': 1.6029, 'learning_rate': 3.932085007764124e-05, 'epoch': 0.8}
+ 80%|████████  | 5425/6779 [3:21:25<50:30,  2.24s/it] 80%|████████  | 5426/6779 [3:21:27<49:31,  2.20s/it]                                                     {'loss': 1.7427, 'learning_rate': 3.92648520733711e-05, 'epoch': 0.8}
+ 80%|████████  | 5426/6779 [3:21:27<49:31,  2.20s/it] 80%|████████  | 5427/6779 [3:21:29<49:51,  2.21s/it]                                                     {'loss': 1.4473, 'learning_rate': 3.9208889631225933e-05, 'epoch': 0.8}
+ 80%|████████  | 5427/6779 [3:21:29<49:51,  2.21s/it] 80%|████████  | 5428/6779 [3:21:31<49:57,  2.22s/it]                                                     {'loss': 1.512, 'learning_rate': 3.915296276358737e-05, 'epoch': 0.8}
+ 80%|████████  | 5428/6779 [3:21:31<49:57,  2.22s/it] 80%|████████  | 5429/6779 [3:21:34<50:25,  2.24s/it]                                                     {'loss': 1.5804, 'learning_rate': 3.909707148282895e-05, 'epoch': 0.8}
+ 80%|████████  | 5429/6779 [3:21:34<50:25,  2.24s/it] 80%|████████  | 5430/6779 [3:21:36<52:24,  2.33s/it]                                                     {'loss': 1.5938, 'learning_rate': 3.904121580131652e-05, 'epoch': 0.8}
+ 80%|████████  | 5430/6779 [3:21:36<52:24,  2.33s/it] 80%|████████  | 5431/6779 [3:21:38<51:50,  2.31s/it]                                                     {'loss': 1.6862, 'learning_rate': 3.898539573140783e-05, 'epoch': 0.8}
+ 80%|████████  | 5431/6779 [3:21:38<51:50,  2.31s/it] 80%|████████  | 5432/6779 [3:21:40<50:43,  2.26s/it]                                                     {'loss': 1.8308, 'learning_rate': 3.8929611285453096e-05, 'epoch': 0.8}
+ 80%|████████  | 5432/6779 [3:21:41<50:43,  2.26s/it] 80%|████████  | 5433/6779 [3:21:43<50:14,  2.24s/it]                                                     {'loss': 1.7367, 'learning_rate': 3.887386247579432e-05, 'epoch': 0.8}
+ 80%|████████  | 5433/6779 [3:21:43<50:14,  2.24s/it] 80%|████████  | 5434/6779 [3:21:45<48:44,  2.17s/it]                                                     {'loss': 1.6492, 'learning_rate': 3.8818149314765704e-05, 'epoch': 0.8}
+ 80%|████████  | 5434/6779 [3:21:45<48:44,  2.17s/it] 80%|████████  | 5435/6779 [3:21:47<48:49,  2.18s/it]                                                     {'loss': 1.5373, 'learning_rate': 3.8762471814693725e-05, 'epoch': 0.8}
+ 80%|████████  | 5435/6779 [3:21:47<48:49,  2.18s/it] 80%|████████  | 5436/6779 [3:21:50<52:16,  2.34s/it]                                                     {'loss': 1.606, 'learning_rate': 3.87068299878967e-05, 'epoch': 0.8}
+ 80%|████████  | 5436/6779 [3:21:50<52:16,  2.34s/it] 80%|████████  | 5437/6779 [3:21:52<51:11,  2.29s/it]                                                     {'loss': 1.4342, 'learning_rate': 3.8651223846685355e-05, 'epoch': 0.8}
+ 80%|████████  | 5437/6779 [3:21:52<51:11,  2.29s/it] 80%|████████  | 5438/6779 [3:21:54<51:34,  2.31s/it]                                                     {'loss': 1.588, 'learning_rate': 3.859565340336215e-05, 'epoch': 0.8}
+ 80%|████████  | 5438/6779 [3:21:54<51:34,  2.31s/it] 80%|████████  | 5439/6779 [3:21:56<51:13,  2.29s/it]                                                     {'loss': 1.6008, 'learning_rate': 3.8540118670222134e-05, 'epoch': 0.8}
+ 80%|████████  | 5439/6779 [3:21:56<51:13,  2.29s/it] 80%|████████  | 5440/6779 [3:21:58<49:52,  2.23s/it]                                                     {'loss': 1.7838, 'learning_rate': 3.8484619659552016e-05, 'epoch': 0.8}
+ 80%|████████  | 5440/6779 [3:21:59<49:52,  2.23s/it] 80%|████████  | 5441/6779 [3:22:01<50:37,  2.27s/it]                                                     {'loss': 1.6808, 'learning_rate': 3.8429156383630825e-05, 'epoch': 0.8}
+ 80%|████████  | 5441/6779 [3:22:01<50:37,  2.27s/it] 80%|████████  | 5442/6779 [3:22:03<49:07,  2.20s/it]                                                     {'loss': 1.531, 'learning_rate': 3.837372885472963e-05, 'epoch': 0.8}
+ 80%|████████  | 5442/6779 [3:22:03<49:07,  2.20s/it] 80%|████████  | 5443/6779 [3:22:05<48:28,  2.18s/it]                                                     {'loss': 1.5832, 'learning_rate': 3.831833708511152e-05, 'epoch': 0.8}
+ 80%|████████  | 5443/6779 [3:22:05<48:28,  2.18s/it] 80%|████████  | 5444/6779 [3:22:07<50:08,  2.25s/it]                                                     {'loss': 1.506, 'learning_rate': 3.826298108703186e-05, 'epoch': 0.8}
+ 80%|████████  | 5444/6779 [3:22:07<50:08,  2.25s/it] 80%|████████  | 5445/6779 [3:22:10<49:42,  2.24s/it]                                                     {'loss': 1.572, 'learning_rate': 3.8207660872737796e-05, 'epoch': 0.8}
+ 80%|████████  | 5445/6779 [3:22:10<49:42,  2.24s/it] 80%|████████  | 5446/6779 [3:22:12<50:02,  2.25s/it]                                                     {'loss': 1.6099, 'learning_rate': 3.815237645446896e-05, 'epoch': 0.8}
+ 80%|████████  | 5446/6779 [3:22:12<50:02,  2.25s/it] 80%|████████  | 5447/6779 [3:22:14<48:12,  2.17s/it]                                                     {'loss': 1.6214, 'learning_rate': 3.809712784445674e-05, 'epoch': 0.8}
+ 80%|████████  | 5447/6779 [3:22:14<48:12,  2.17s/it] 80%|████████  | 5448/6779 [3:22:16<47:38,  2.15s/it]                                                     {'loss': 1.6437, 'learning_rate': 3.804191505492476e-05, 'epoch': 0.8}
+ 80%|████████  | 5448/6779 [3:22:16<47:38,  2.15s/it] 80%|████████  | 5449/6779 [3:22:18<47:56,  2.16s/it]                                                     {'loss': 1.6989, 'learning_rate': 3.7986738098088615e-05, 'epoch': 0.8}
+ 80%|████████  | 5449/6779 [3:22:18<47:56,  2.16s/it] 80%|████████  | 5450/6779 [3:22:20<47:05,  2.13s/it]                                                     {'loss': 1.6319, 'learning_rate': 3.7931596986156005e-05, 'epoch': 0.8}
+ 80%|████████  | 5450/6779 [3:22:20<47:05,  2.13s/it] 80%|████████  | 5451/6779 [3:22:22<46:47,  2.11s/it]                                                     {'loss': 1.7734, 'learning_rate': 3.7876491731326835e-05, 'epoch': 0.8}
+ 80%|████████  | 5451/6779 [3:22:22<46:47,  2.11s/it] 80%|████████  | 5452/6779 [3:22:25<48:25,  2.19s/it]                                                     {'loss': 1.6796, 'learning_rate': 3.7821422345792754e-05, 'epoch': 0.8}
+ 80%|████████  | 5452/6779 [3:22:25<48:25,  2.19s/it] 80%|████████  | 5453/6779 [3:22:27<48:52,  2.21s/it]                                                     {'loss': 1.6103, 'learning_rate': 3.776638884173793e-05, 'epoch': 0.8}
+ 80%|████████  | 5453/6779 [3:22:27<48:52,  2.21s/it] 80%|████████  | 5454/6779 [3:22:29<48:47,  2.21s/it]                                                     {'loss': 1.7609, 'learning_rate': 3.771139123133818e-05, 'epoch': 0.8}
+ 80%|████████  | 5454/6779 [3:22:29<48:47,  2.21s/it] 80%|████████  | 5455/6779 [3:22:31<48:39,  2.21s/it]                                                     {'loss': 1.6331, 'learning_rate': 3.765642952676165e-05, 'epoch': 0.8}
+ 80%|████████  | 5455/6779 [3:22:31<48:39,  2.21s/it] 80%|████████  | 5456/6779 [3:22:33<47:45,  2.17s/it]                                                     {'loss': 1.9033, 'learning_rate': 3.7601503740168334e-05, 'epoch': 0.8}
+ 80%|████████  | 5456/6779 [3:22:33<47:45,  2.17s/it] 80%|████████  | 5457/6779 [3:22:36<48:10,  2.19s/it]                                                     {'loss': 1.6658, 'learning_rate': 3.754661388371048e-05, 'epoch': 0.8}
+ 80%|████████  | 5457/6779 [3:22:36<48:10,  2.19s/it] 81%|████████  | 5458/6779 [3:22:38<47:27,  2.16s/it]                                                     {'loss': 1.5925, 'learning_rate': 3.749175996953225e-05, 'epoch': 0.81}
+ 81%|████████  | 5458/6779 [3:22:38<47:27,  2.16s/it] 81%|████████  | 5459/6779 [3:22:40<48:07,  2.19s/it]                                                     {'loss': 1.6015, 'learning_rate': 3.7436942009769795e-05, 'epoch': 0.81}
+ 81%|████████  | 5459/6779 [3:22:40<48:07,  2.19s/it] 81%|████████  | 5460/6779 [3:22:42<48:22,  2.20s/it]                                                     {'loss': 1.7909, 'learning_rate': 3.738216001655157e-05, 'epoch': 0.81}
+ 81%|████████  | 5460/6779 [3:22:42<48:22,  2.20s/it] 81%|████████  | 5461/6779 [3:22:44<47:30,  2.16s/it]                                                     {'loss': 1.5045, 'learning_rate': 3.7327414001997815e-05, 'epoch': 0.81}
+ 81%|████████  | 5461/6779 [3:22:44<47:30,  2.16s/it] 81%|████████  | 5462/6779 [3:22:47<48:29,  2.21s/it]                                                     {'loss': 1.6251, 'learning_rate': 3.727270397822096e-05, 'epoch': 0.81}
+ 81%|████████  | 5462/6779 [3:22:47<48:29,  2.21s/it] 81%|████████  | 5463/6779 [3:22:49<49:06,  2.24s/it]                                                     {'loss': 1.5644, 'learning_rate': 3.721802995732535e-05, 'epoch': 0.81}
+ 81%|████████  | 5463/6779 [3:22:49<49:06,  2.24s/it] 81%|████████  | 5464/6779 [3:22:51<49:42,  2.27s/it]                                                     {'loss': 1.5351, 'learning_rate': 3.7163391951407545e-05, 'epoch': 0.81}
+ 81%|████████  | 5464/6779 [3:22:51<49:42,  2.27s/it] 81%|████████  | 5465/6779 [3:22:54<53:30,  2.44s/it]                                                     {'loss': 1.8229, 'learning_rate': 3.710878997255587e-05, 'epoch': 0.81}
+ 81%|████████  | 5465/6779 [3:22:54<53:30,  2.44s/it] 81%|████████  | 5466/6779 [3:22:57<53:43,  2.45s/it]                                                     {'loss': 1.7479, 'learning_rate': 3.705422403285093e-05, 'epoch': 0.81}
+ 81%|████████  | 5466/6779 [3:22:57<53:43,  2.45s/it] 81%|████████  | 5467/6779 [3:22:59<51:33,  2.36s/it]                                                     {'loss': 1.7772, 'learning_rate': 3.69996941443653e-05, 'epoch': 0.81}
+ 81%|██████��█  | 5467/6779 [3:22:59<51:33,  2.36s/it] 81%|████████  | 5468/6779 [3:23:01<49:33,  2.27s/it]                                                     {'loss': 1.7103, 'learning_rate': 3.6945200319163444e-05, 'epoch': 0.81}
+ 81%|████████  | 5468/6779 [3:23:01<49:33,  2.27s/it] 81%|████████  | 5469/6779 [3:23:03<49:15,  2.26s/it]                                                     {'loss': 1.6231, 'learning_rate': 3.689074256930203e-05, 'epoch': 0.81}
+ 81%|████████  | 5469/6779 [3:23:03<49:15,  2.26s/it] 81%|████████  | 5470/6779 [3:23:05<48:21,  2.22s/it]                                                     {'loss': 1.5125, 'learning_rate': 3.6836320906829556e-05, 'epoch': 0.81}
+ 81%|████████  | 5470/6779 [3:23:05<48:21,  2.22s/it] 81%|████████  | 5471/6779 [3:23:08<49:21,  2.26s/it]                                                     {'loss': 1.6793, 'learning_rate': 3.6781935343786757e-05, 'epoch': 0.81}
+ 81%|████████  | 5471/6779 [3:23:08<49:21,  2.26s/it] 81%|████████  | 5472/6779 [3:23:10<48:02,  2.21s/it]                                                     {'loss': 1.7229, 'learning_rate': 3.672758589220613e-05, 'epoch': 0.81}
+ 81%|████████  | 5472/6779 [3:23:10<48:02,  2.21s/it] 81%|████████  | 5473/6779 [3:23:12<48:51,  2.24s/it]                                                     {'loss': 1.7808, 'learning_rate': 3.667327256411239e-05, 'epoch': 0.81}
+ 81%|████████  | 5473/6779 [3:23:12<48:51,  2.24s/it] 81%|████████  | 5474/6779 [3:23:14<48:37,  2.24s/it]                                                     {'loss': 1.6643, 'learning_rate': 3.6618995371522226e-05, 'epoch': 0.81}
+ 81%|████████  | 5474/6779 [3:23:14<48:37,  2.24s/it] 81%|████████  | 5475/6779 [3:23:16<49:08,  2.26s/it]                                                     {'loss': 1.8049, 'learning_rate': 3.6564754326444174e-05, 'epoch': 0.81}
+ 81%|████████  | 5475/6779 [3:23:16<49:08,  2.26s/it] 81%|████████  | 5476/6779 [3:23:19<49:50,  2.29s/it]                                                     {'loss': 1.5365, 'learning_rate': 3.651054944087899e-05, 'epoch': 0.81}
+ 81%|████████  | 5476/6779 [3:23:19<49:50,  2.29s/it] 81%|████████  | 5477/6779 [3:23:21<50:01,  2.31s/it]                                                     {'loss': 1.6296, 'learning_rate': 3.645638072681925e-05, 'epoch': 0.81}
+ 81%|████████  | 5477/6779 [3:23:21<50:01,  2.31s/it] 81%|████████  | 5478/6779 [3:23:23<48:43,  2.25s/it]                                                     {'loss': 1.6047, 'learning_rate': 3.6402248196249714e-05, 'epoch': 0.81}
+ 81%|████████  | 5478/6779 [3:23:23<48:43,  2.25s/it] 81%|████████  | 5479/6779 [3:23:26<48:46,  2.25s/it]                                                     {'loss': 1.5093, 'learning_rate': 3.634815186114686e-05, 'epoch': 0.81}
+ 81%|████████  | 5479/6779 [3:23:26<48:46,  2.25s/it] 81%|████████  | 5480/6779 [3:23:27<46:39,  2.16s/it]                                                     {'loss': 1.6054, 'learning_rate': 3.6294091733479443e-05, 'epoch': 0.81}
+ 81%|████████  | 5480/6779 [3:23:27<46:39,  2.16s/it] 81%|████████  | 5481/6779 [3:23:30<47:13,  2.18s/it]                                                     {'loss': 1.6504, 'learning_rate': 3.624006782520812e-05, 'epoch': 0.81}
+ 81%|████████  | 5481/6779 [3:23:30<47:13,  2.18s/it] 81%|████████  | 5482/6779 [3:23:32<48:22,  2.24s/it]                                                     {'loss': 1.7579, 'learning_rate': 3.61860801482854e-05, 'epoch': 0.81}
+ 81%|████████  | 5482/6779 [3:23:32<48:22,  2.24s/it] 81%|████████  | 5483/6779 [3:23:34<47:23,  2.19s/it]                                                     {'loss': 1.6337, 'learning_rate': 3.6132128714655964e-05, 'epoch': 0.81}
+ 81%|████████  | 5483/6779 [3:23:34<47:23,  2.19s/it] 81%|████████  | 5484/6779 [3:23:36<47:31,  2.20s/it]                                                     {'loss': 1.5752, 'learning_rate': 3.6078213536256313e-05, 'epoch': 0.81}
+ 81%|████████  | 5484/6779 [3:23:36<47:31,  2.20s/it] 81%|████████  | 5485/6779 [3:23:39<47:22,  2.20s/it]                                                     {'loss': 1.5749, 'learning_rate': 3.602433462501511e-05, 'epoch': 0.81}
+ 81%|████████  | 5485/6779 [3:23:39<47:22,  2.20s/it] 81%|████████  | 5486/6779 [3:23:41<48:09,  2.23s/it]                                                     {'loss': 1.7664, 'learning_rate': 3.597049199285274e-05, 'epoch': 0.81}
+ 81%|████████  | 5486/6779 [3:23:41<48:09,  2.23s/it] 81%|████████  | 5487/6779 [3:23:43<47:51,  2.22s/it]                                                     {'loss': 1.6578, 'learning_rate': 3.591668565168187e-05, 'epoch': 0.81}
+ 81%|████████  | 5487/6779 [3:23:43<47:51,  2.22s/it] 81%|████████  | 5488/6779 [3:23:45<47:13,  2.19s/it]                                                     {'loss': 1.5084, 'learning_rate': 3.586291561340685e-05, 'epoch': 0.81}
+ 81%|████████  | 5488/6779 [3:23:45<47:13,  2.19s/it] 81%|████████  | 5489/6779 [3:23:47<45:57,  2.14s/it]                                                     {'loss': 1.5847, 'learning_rate': 3.5809181889924145e-05, 'epoch': 0.81}
+ 81%|████████  | 5489/6779 [3:23:47<45:57,  2.14s/it] 81%|████████  | 5490/6779 [3:23:49<44:27,  2.07s/it]                                                     {'loss': 1.5964, 'learning_rate': 3.575548449312227e-05, 'epoch': 0.81}
+ 81%|████████  | 5490/6779 [3:23:49<44:27,  2.07s/it] 81%|████████  | 5491/6779 [3:23:51<45:58,  2.14s/it]                                                     {'loss': 1.797, 'learning_rate': 3.570182343488147e-05, 'epoch': 0.81}
+ 81%|████████  | 5491/6779 [3:23:51<45:58,  2.14s/it] 81%|████████  | 5492/6779 [3:23:54<49:33,  2.31s/it]                                                     {'loss': 1.5605, 'learning_rate': 3.5648198727074186e-05, 'epoch': 0.81}
+ 81%|████████  | 5492/6779 [3:23:54<49:33,  2.31s/it] 81%|████████  | 5493/6779 [3:23:56<47:40,  2.22s/it]                                                     {'loss': 1.7403, 'learning_rate': 3.55946103815646e-05, 'epoch': 0.81}
+ 81%|████████  | 5493/6779 [3:23:56<47:40,  2.22s/it] 81%|████████  | 5494/6779 [3:23:59<48:21,  2.26s/it]                                                     {'loss': 1.6177, 'learning_rate': 3.554105841020905e-05, 'epoch': 0.81}
+ 81%|████████  | 5494/6779 [3:23:59<48:21,  2.26s/it] 81%|████████  | 5495/6779 [3:24:01<46:53,  2.19s/it]                                                     {'loss': 1.6294, 'learning_rate': 3.548754282485565e-05, 'epoch': 0.81}
+ 81%|████████  | 5495/6779 [3:24:01<46:53,  2.19s/it] 81%|████████  | 5496/6779 [3:24:03<46:26,  2.17s/it]                                                     {'loss': 1.6732, 'learning_rate': 3.543406363734461e-05, 'epoch': 0.81}
+ 81%|████████  | 5496/6779 [3:24:03<46:26,  2.17s/it] 81%|████████  | 5497/6779 [3:24:05<47:27,  2.22s/it]                                                     {'loss': 1.5342, 'learning_rate': 3.538062085950804e-05, 'epoch': 0.81}
+ 81%|████████  | 5497/6779 [3:24:05<47:27,  2.22s/it] 81%|████████  | 5498/6779 [3:24:07<47:44,  2.24s/it]                                                     {'loss': 1.6381, 'learning_rate': 3.5327214503169895e-05, 'epoch': 0.81}
+ 81%|████████  | 5498/6779 [3:24:07<47:44,  2.24s/it] 81%|████████  | 5499/6779 [3:24:10<48:17,  2.26s/it]                                                     {'loss': 1.6973, 'learning_rate': 3.5273844580146264e-05, 'epoch': 0.81}
+ 81%|████████  | 5499/6779 [3:24:10<48:17,  2.26s/it] 81%|████████  | 5500/6779 [3:24:12<48:10,  2.26s/it]                                                     {'loss': 1.5892, 'learning_rate': 3.522051110224498e-05, 'epoch': 0.81}
+ 81%|████████  | 5500/6779 [3:24:12<48:10,  2.26s/it] 81%|████████  | 5501/6779 [3:24:14<48:55,  2.30s/it]                                                     {'loss': 1.5756, 'learning_rate': 3.516721408126598e-05, 'epoch': 0.81}
+ 81%|████████  | 5501/6779 [3:24:14<48:55,  2.30s/it] 81%|████████  | 5502/6779 [3:24:16<47:20,  2.22s/it]                                                     {'loss': 1.5904, 'learning_rate': 3.511395352900089e-05, 'epoch': 0.81}
+ 81%|████████  | 5502/6779 [3:24:16<47:20,  2.22s/it] 81%|████████  | 5503/6779 [3:24:18<45:44,  2.15s/it]                                                     {'loss': 1.6127, 'learning_rate': 3.5060729457233664e-05, 'epoch': 0.81}
+ 81%|████████  | 5503/6779 [3:24:18<45:44,  2.15s/it] 81%|████████  | 5504/6779 [3:24:20<46:06,  2.17s/it]                                                     {'loss': 1.6181, 'learning_rate': 3.500754187773985e-05, 'epoch': 0.81}
+ 81%|████████  | 5504/6779 [3:24:21<46:06,  2.17s/it] 81%|████████  | 5505/6779 [3:24:23<46:19,  2.18s/it]                                                     {'loss': 1.5523, 'learning_rate': 3.495439080228695e-05, 'epoch': 0.81}
+ 81%|████████  | 5505/6779 [3:24:23<46:19,  2.18s/it] 81%|████████  | 5506/6779 [3:24:25<45:36,  2.15s/it]                                                     {'loss': 1.6096, 'learning_rate': 3.490127624263459e-05, 'epoch': 0.81}
+ 81%|████████  | 5506/6779 [3:24:25<45:36,  2.15s/it] 81%|████████  | 5507/6779 [3:24:27<45:21,  2.14s/it]                                                     {'loss': 1.7445, 'learning_rate': 3.484819821053409e-05, 'epoch': 0.81}
+ 81%|████████  | 5507/6779 [3:24:27<45:21,  2.14s/it] 81%|████████▏ | 5508/6779 [3:24:29<45:09,  2.13s/it]                                                     {'loss': 1.6484, 'learning_rate': 3.4795156717728883e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5508/6779 [3:24:29<45:09,  2.13s/it] 81%|████████▏ | 5509/6779 [3:24:31<45:35,  2.15s/it]                                                     {'loss': 1.6049, 'learning_rate': 3.4742151775954076e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5509/6779 [3:24:31<45:35,  2.15s/it] 81%|████████▏ | 5510/6779 [3:24:33<45:26,  2.15s/it]                                                     {'loss': 1.5723, 'learning_rate': 3.4689183396937054e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5510/6779 [3:24:33<45:26,  2.15s/it] 81%|████████▏ | 5511/6779 [3:24:36<46:17,  2.19s/it]                                                     {'loss': 1.8218, 'learning_rate': 3.4636251592396715e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5511/6779 [3:24:36<46:17,  2.19s/it] 81%|████████▏ | 5512/6779 [3:24:38<46:15,  2.19s/it]                                                     {'loss': 1.5954, 'learning_rate': 3.458335637404417e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5512/6779 [3:24:38<46:15,  2.19s/it] 81%|████████▏ | 5513/6779 [3:24:40<46:49,  2.22s/it]                                                     {'loss': 1.6696, 'learning_rate': 3.453049775358228e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5513/6779 [3:24:40<46:49,  2.22s/it] 81%|████████▏ | 5514/6779 [3:24:42<45:46,  2.17s/it]                                                     {'loss': 1.7756, 'learning_rate': 3.447767574270575e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5514/6779 [3:24:42<45:46,  2.17s/it] 81%|████████▏ | 5515/6779 [3:24:44<45:21,  2.15s/it]                                                     {'loss': 1.7002, 'learning_rate': 3.4424890353101414e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5515/6779 [3:24:44<45:21,  2.15s/it] 81%|████████▏ | 5516/6779 [3:24:46<45:35,  2.17s/it]                                                     {'loss': 1.5732, 'learning_rate': 3.4372141596447704e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5516/6779 [3:24:46<45:35,  2.17s/it] 81%|████████▏ | 5517/6779 [3:24:49<46:25,  2.21s/it]                                                     {'loss': 1.7697, 'learning_rate': 3.431942948441529e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5517/6779 [3:24:49<46:25,  2.21s/it] 81%|████████▏ | 5518/6779 [3:24:51<45:46,  2.18s/it]                                                     {'loss': 1.5175, 'learning_rate': 3.426675402866642e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5518/6779 [3:24:51<45:46,  2.18s/it] 81%|████████▏ | 5519/6779 [3:24:53<45:23,  2.16s/it]                                                     {'loss': 1.7019, 'learning_rate': 3.421411524085547e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5519/6779 [3:24:53<45:23,  2.16s/it] 81%|████████▏ | 5520/6779 [3:24:55<44:09,  2.10s/it]                                                     {'loss': 1.6955, 'learning_rate': 3.4161513132628565e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5520/6779 [3:24:55<44:09,  2.10s/it] 81%|████████▏ | 5521/6779 [3:24:57<45:31,  2.17s/it]                                                     {'loss': 1.7884, 'learning_rate': 3.410894771562365e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5521/6779 [3:24:57<45:31,  2.17s/it] 81%|████████▏ | 5522/6779 [3:25:00<46:27,  2.22s/it]                                                     {'loss': 1.577, 'learning_rate': 3.405641900147081e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5522/6779 [3:25:00<46:27,  2.22s/it] 81%|████████▏ | 5523/6779 [3:25:02<46:39,  2.23s/it]                                                     {'loss': 1.641, 'learning_rate': 3.4003927001791666e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5523/6779 [3:25:02<46:39,  2.23s/it] 81%|████████▏ | 5524/6779 [3:25:04<45:42,  2.19s/it]                                                     {'loss': 1.7297, 'learning_rate': 3.39514717282001e-05, 'epoch': 0.81}
+ 81%|███████���▏ | 5524/6779 [3:25:04<45:42,  2.19s/it] 82%|████████▏ | 5525/6779 [3:25:06<46:27,  2.22s/it]                                                     {'loss': 1.4679, 'learning_rate': 3.389905319230153e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5525/6779 [3:25:06<46:27,  2.22s/it] 82%|████████▏ | 5526/6779 [3:25:08<46:12,  2.21s/it]                                                     {'loss': 1.6898, 'learning_rate': 3.384667140569347e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5526/6779 [3:25:08<46:12,  2.21s/it] 82%|████████▏ | 5527/6779 [3:25:11<47:26,  2.27s/it]                                                     {'loss': 1.7341, 'learning_rate': 3.379432637996516e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5527/6779 [3:25:11<47:26,  2.27s/it] 82%|████████▏ | 5528/6779 [3:25:13<45:40,  2.19s/it]                                                     {'loss': 1.7929, 'learning_rate': 3.374201812669782e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5528/6779 [3:25:13<45:40,  2.19s/it] 82%|████████▏ | 5529/6779 [3:25:15<45:10,  2.17s/it]                                                     {'loss': 1.6428, 'learning_rate': 3.368974665746443e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5529/6779 [3:25:15<45:10,  2.17s/it] 82%|████████▏ | 5530/6779 [3:25:18<47:10,  2.27s/it]                                                     {'loss': 1.7913, 'learning_rate': 3.3637511983829827e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5530/6779 [3:25:18<47:10,  2.27s/it] 82%|████████▏ | 5531/6779 [3:25:20<47:03,  2.26s/it]                                                     {'loss': 1.6175, 'learning_rate': 3.358531411735091e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5531/6779 [3:25:20<47:03,  2.26s/it] 82%|████████▏ | 5532/6779 [3:25:22<45:59,  2.21s/it]                                                     {'loss': 1.5762, 'learning_rate': 3.3533153069576165e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5532/6779 [3:25:22<45:59,  2.21s/it] 82%|████████▏ | 5533/6779 [3:25:25<51:38,  2.49s/it]                                                     {'loss': 1.8062, 'learning_rate': 3.348102885204616e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5533/6779 [3:25:25<51:38,  2.49s/it] 82%|████████▏ | 5534/6779 [3:25:27<50:36,  2.44s/it]                                                     {'loss': 1.7359, 'learning_rate': 3.342894147629308e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5534/6779 [3:25:27<50:36,  2.44s/it] 82%|████████▏ | 5535/6779 [3:25:29<48:26,  2.34s/it]                                                     {'loss': 1.6831, 'learning_rate': 3.33768909538412e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5535/6779 [3:25:29<48:26,  2.34s/it] 82%|████████▏ | 5536/6779 [3:25:32<47:50,  2.31s/it]                                                     {'loss': 1.6553, 'learning_rate': 3.332487729620643e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5536/6779 [3:25:32<47:50,  2.31s/it] 82%|████████▏ | 5537/6779 [3:25:34<46:34,  2.25s/it]                                                     {'loss': 1.5581, 'learning_rate': 3.327290051489666e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5537/6779 [3:25:34<46:34,  2.25s/it] 82%|████████▏ | 5538/6779 [3:25:36<46:58,  2.27s/it]                                                     {'loss': 1.6086, 'learning_rate': 3.3220960621411664e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5538/6779 [3:25:36<46:58,  2.27s/it] 82%|████████▏ | 5539/6779 [3:25:38<46:04,  2.23s/it]                                                     {'loss': 1.6739, 'learning_rate': 3.316905762724283e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5539/6779 [3:25:38<46:04,  2.23s/it] 82%|████████▏ | 5540/6779 [3:25:40<46:02,  2.23s/it]                                                     {'loss': 1.7714, 'learning_rate': 3.311719154387367e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5540/6779 [3:25:40<46:02,  2.23s/it] 82%|████████▏ | 5541/6779 [3:25:43<47:59,  2.33s/it]                                                     {'loss': 1.8518, 'learning_rate': 3.3065362382779244e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5541/6779 [3:25:43<47:59,  2.33s/it] 82%|████████▏ | 5542/6779 [3:25:45<46:36,  2.26s/it]                                                     {'loss': 1.6531, 'learning_rate': 3.30135701554267e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5542/6779 [3:25:45<46:36,  2.26s/it] 82%|████████▏ | 5543/6779 [3:25:47<46:14,  2.25s/it]                                                     {'loss': 1.6396, 'learning_rate': 3.296181487327481e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5543/6779 [3:25:47<46:14,  2.25s/it] 82%|████████▏ | 5544/6779 [3:25:50<46:29,  2.26s/it]                                                     {'loss': 1.6655, 'learning_rate': 3.291009654777428e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5544/6779 [3:25:50<46:29,  2.26s/it] 82%|████████▏ | 5545/6779 [3:25:52<44:48,  2.18s/it]                                                     {'loss': 1.5599, 'learning_rate': 3.285841519036772e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5545/6779 [3:25:52<44:48,  2.18s/it] 82%|████████▏ | 5546/6779 [3:25:54<43:47,  2.13s/it]                                                     {'loss': 1.4636, 'learning_rate': 3.280677081248933e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5546/6779 [3:25:54<43:47,  2.13s/it] 82%|████████▏ | 5547/6779 [3:25:56<43:49,  2.13s/it]                                                     {'loss': 1.592, 'learning_rate': 3.275516342556535e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5547/6779 [3:25:56<43:49,  2.13s/it] 82%|████████▏ | 5548/6779 [3:25:58<43:13,  2.11s/it]                                                     {'loss': 1.5143, 'learning_rate': 3.2703593041013644e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5548/6779 [3:25:58<43:13,  2.11s/it] 82%|████████▏ | 5549/6779 [3:26:00<43:54,  2.14s/it]                                                     {'loss': 1.655, 'learning_rate': 3.265205967024412e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5549/6779 [3:26:00<43:54,  2.14s/it] 82%|████████▏ | 5550/6779 [3:26:02<44:12,  2.16s/it]                                                     {'loss': 1.48, 'learning_rate': 3.260056332465826e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5550/6779 [3:26:02<44:12,  2.16s/it] 82%|████████▏ | 5551/6779 [3:26:04<43:55,  2.15s/it]                                                     {'loss': 1.6023, 'learning_rate': 3.2549104015649477e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5551/6779 [3:26:04<43:55,  2.15s/it] 82%|████████▏ | 5552/6779 [3:26:06<43:33,  2.13s/it]                                                     {'loss': 1.6379, 'learning_rate': 3.249768175460308e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5552/6779 [3:26:06<43:33,  2.13s/it] 82%|████████▏ | 5553/6779 [3:26:09<43:21,  2.12s/it]                                                     {'loss': 1.674, 'learning_rate': 3.244629655289593e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5553/6779 [3:26:09<43:21,  2.12s/it] 82%|████████▏ | 5554/6779 [3:26:11<44:18,  2.17s/it]                                                     {'loss': 1.7881, 'learning_rate': 3.239494842189694e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5554/6779 [3:26:11<44:18,  2.17s/it] 82%|████████▏ | 5555/6779 [3:26:13<43:13,  2.12s/it]                                                     {'loss': 1.563, 'learning_rate': 3.234363737296666e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5555/6779 [3:26:13<43:13,  2.12s/it] 82%|████████▏ | 5556/6779 [3:26:15<43:08,  2.12s/it]                                                     {'loss': 1.5543, 'learning_rate': 3.229236341745754e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5556/6779 [3:26:15<43:08,  2.12s/it] 82%|████████▏ | 5557/6779 [3:26:17<42:59,  2.11s/it]                                                     {'loss': 1.7072, 'learning_rate': 3.224112656671368e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5557/6779 [3:26:17<42:59,  2.11s/it] 82%|████████▏ | 5558/6779 [3:26:19<44:15,  2.18s/it]                                                     {'loss': 1.5403, 'learning_rate': 3.218992683207114e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5558/6779 [3:26:19<44:15,  2.18s/it] 82%|████████▏ | 5559/6779 [3:26:22<46:25,  2.28s/it]                                                     {'loss': 1.5171, 'learning_rate': 3.213876422485773e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5559/6779 [3:26:22<46:25,  2.28s/it] 82%|████████▏ | 5560/6779 [3:26:24<45:08,  2.22s/it]                                                     {'loss': 1.5515, 'learning_rate': 3.208763875639291e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5560/6779 [3:26:24<45:08,  2.22s/it] 82%|████████▏ | 5561/6779 [3:26:26<45:02,  2.22s/it]                                                     {'loss': 1.6761, 'learning_rate': 3.203655043798815e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5561/6779 [3:26:26<45:02,  2.22s/it] 82%|████████▏ | 5562/6779 [3:26:28<44:27,  2.19s/it]                                                     {'loss': 1.6266, 'learning_rate': 3.1985499280946407e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5562/6779 [3:26:28<44:27,  2.19s/it] 82%|████████▏ | 5563/6779 [3:26:31<45:17,  2.23s/it]                                                     {'loss': 1.7137, 'learning_rate': 3.193448529656276e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5563/6779 [3:26:31<45:17,  2.23s/it] 82%|████████▏ | 5564/6779 [3:26:33<44:10,  2.18s/it]                                                     {'loss': 1.6358, 'learning_rate': 3.1883508496123713e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5564/6779 [3:26:33<44:10,  2.18s/it] 82%|████████▏ | 5565/6779 [3:26:35<43:54,  2.17s/it]                                                     {'loss': 1.744, 'learning_rate': 3.183256889090787e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5565/6779 [3:26:35<43:54,  2.17s/it] 82%|████████▏ | 5566/6779 [3:26:37<43:16,  2.14s/it]                                                     {'loss': 1.7495, 'learning_rate': 3.178166649218533e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5566/6779 [3:26:37<43:16,  2.14s/it] 82%|████████▏ | 5567/6779 [3:26:39<45:21,  2.25s/it]                                                     {'loss': 1.7662, 'learning_rate': 3.173080131121813e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5567/6779 [3:26:39<45:21,  2.25s/it] 82%|████████▏ | 5568/6779 [3:26:42<44:25,  2.20s/it]                                                     {'loss': 1.4835, 'learning_rate': 3.1679973359260095e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5568/6779 [3:26:42<44:25,  2.20s/it] 82%|████████▏ | 5569/6779 [3:26:44<44:21,  2.20s/it]                                                     {'loss': 1.6916, 'learning_rate': 3.162918264755661e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5569/6779 [3:26:44<44:21,  2.20s/it] 82%|████████▏ | 5570/6779 [3:26:46<44:17,  2.20s/it]                                                     {'loss': 1.7101, 'learning_rate': 3.157842918734508e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5570/6779 [3:26:46<44:17,  2.20s/it] 82%|████████▏ | 5571/6779 [3:26:48<44:25,  2.21s/it]                                                     {'loss': 1.5508, 'learning_rate': 3.152771298985444e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5571/6779 [3:26:48<44:25,  2.21s/it] 82%|████████▏ | 5572/6779 [3:26:50<43:27,  2.16s/it]                                                     {'loss': 1.6426, 'learning_rate': 3.147703406630555e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5572/6779 [3:26:50<43:27,  2.16s/it] 82%|████████▏ | 5573/6779 [3:26:52<43:20,  2.16s/it]                                                     {'loss': 1.5568, 'learning_rate': 3.142639242791085e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5573/6779 [3:26:52<43:20,  2.16s/it] 82%|████████▏ | 5574/6779 [3:26:54<43:22,  2.16s/it]                                                     {'loss': 1.7117, 'learning_rate': 3.137578808587482e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5574/6779 [3:26:54<43:22,  2.16s/it] 82%|████████▏ | 5575/6779 [3:26:57<43:41,  2.18s/it]                                                     {'loss': 1.6042, 'learning_rate': 3.132522105139342e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5575/6779 [3:26:57<43:41,  2.18s/it] 82%|████████▏ | 5576/6779 [3:26:59<44:19,  2.21s/it]                                                     {'loss': 1.7235, 'learning_rate': 3.127469133565435e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5576/6779 [3:26:59<44:19,  2.21s/it] 82%|████████▏ | 5577/6779 [3:27:01<43:25,  2.17s/it]                                                     {'loss': 1.6436, 'learning_rate': 3.122419894983728e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5577/6779 [3:27:01<43:25,  2.17s/it] 82%|████████▏ | 5578/6779 [3:27:03<44:03,  2.20s/it]                                                     {'loss': 1.6024, 'learning_rate': 3.117374390511336e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5578/6779 [3:27:03<44:03,  2.20s/it] 82%|████████▏ | 5579/6779 [3:27:06<45:37,  2.28s/it]                                                     {'loss': 1.657, 'learning_rate': 3.112332621264573e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5579/6779 [3:27:06<45:37,  2.28s/it] 82%|████████▏ | 5580/6779 [3:27:08<45:13,  2.26s/it]                                                     {'loss': 1.6809, 'learning_rate': 3.107294588358895e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5580/6779 [3:27:08<45:13,  2.26s/it] 82%|████████▏ | 5581/6779 [3:27:10<45:10,  2.26s/it]                                                     {'loss': 1.5063, 'learning_rate': 3.102260292908976e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5581/6779 [3:27:10<45:10,  2.26s/it] 82%|████████▏ | 5582/6779 [3:27:12<43:13,  2.17s/it]                                                     {'loss': 1.8369, 'learning_rate': 3.0972297360286176e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5582/6779 [3:27:12<43:13,  2.17s/it] 82%|████████▏ | 5583/6779 [3:27:14<42:40,  2.14s/it]                                                     {'loss': 1.5639, 'learning_rate': 3.0922029188308264e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5583/6779 [3:27:14<42:40,  2.14s/it] 82%|████████▏ | 5584/6779 [3:27:17<43:39,  2.19s/it]                                                     {'loss': 1.6914, 'learning_rate': 3.087179842427763e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5584/6779 [3:27:17<43:39,  2.19s/it] 82%|████████▏ | 5585/6779 [3:27:19<42:59,  2.16s/it]                                                     {'loss': 1.6542, 'learning_rate': 3.0821605079307624e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5585/6779 [3:27:19<42:59,  2.16s/it] 82%|████████▏ | 5586/6779 [3:27:21<46:10,  2.32s/it]                                                     {'loss': 1.7359, 'learning_rate': 3.077144916450345e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5586/6779 [3:27:21<46:10,  2.32s/it] 82%|████████▏ | 5587/6779 [3:27:24<45:44,  2.30s/it]                                                     {'loss': 1.8139, 'learning_rate': 3.0721330690961816e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5587/6779 [3:27:24<45:44,  2.30s/it] 82%|████████▏ | 5588/6779 [3:27:26<45:15,  2.28s/it]                                                     {'loss': 1.7339, 'learning_rate': 3.067124966977144e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5588/6779 [3:27:26<45:15,  2.28s/it] 82%|████████▏ | 5589/6779 [3:27:28<46:50,  2.36s/it]                                                     {'loss': 1.6962, 'learning_rate': 3.0621206112012444e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5589/6779 [3:27:28<46:50,  2.36s/it] 82%|████████▏ | 5590/6779 [3:27:31<47:14,  2.38s/it]                                                     {'loss': 1.5484, 'learning_rate': 3.057120002875689e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5590/6779 [3:27:31<47:14,  2.38s/it] 82%|████████▏ | 5591/6779 [3:27:33<45:09,  2.28s/it]                                                     {'loss': 1.5749, 'learning_rate': 3.052123143106844e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5591/6779 [3:27:33<45:09,  2.28s/it] 82%|████████▏ | 5592/6779 [3:27:35<44:00,  2.22s/it]                                                     {'loss': 1.5845, 'learning_rate': 3.0471300330002407e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5592/6779 [3:27:35<44:00,  2.22s/it] 83%|████████▎ | 5593/6779 [3:27:37<44:19,  2.24s/it]                                                     {'loss': 1.5633, 'learning_rate': 3.0421406736605983e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5593/6779 [3:27:37<44:19,  2.24s/it] 83%|████████▎ | 5594/6779 [3:27:40<49:07,  2.49s/it]                                                     {'loss': 1.5351, 'learning_rate': 3.0371550661917836e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5594/6779 [3:27:40<49:07,  2.49s/it] 83%|████████▎ | 5595/6779 [3:27:42<46:39,  2.36s/it]                                                     {'loss': 1.6333, 'learning_rate': 3.0321732116968625e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5595/6779 [3:27:42<46:39,  2.36s/it] 83%|████████▎ | 5596/6779 [3:27:45<44:56,  2.28s/it]                                                     {'loss': 1.5444, 'learning_rate': 3.0271951112780404e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5596/6779 [3:27:45<44:56,  2.28s/it] 83%|████████▎ | 5597/6779 [3:27:47<46:13,  2.35s/it]                                                     {'loss': 1.6159, 'learning_rate': 3.0222207660367187e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5597/6779 [3:27:47<46:13,  2.35s/it] 83%|████████▎ | 5598/6779 [3:27:49<44:30,  2.26s/it]                                                     {'loss': 1.7062, 'learning_rate': 3.0172501770734407e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5598/6779 [3:27:49<44:30,  2.26s/it] 83%|████████▎ | 5599/6779 [3:27:51<44:06,  2.24s/it]                                                     {'loss': 1.6438, 'learning_rate': 3.012283345487945e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5599/6779 [3:27:51<44:06,  2.24s/it] 83%|██████���█▎ | 5600/6779 [3:27:53<43:31,  2.22s/it]                                                     {'loss': 1.5038, 'learning_rate': 3.0073202723791216e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5600/6779 [3:27:53<43:31,  2.22s/it] 83%|████████▎ | 5601/6779 [3:27:56<44:42,  2.28s/it]                                                     {'loss': 1.6761, 'learning_rate': 3.002360958845025e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5601/6779 [3:27:56<44:42,  2.28s/it] 83%|████████▎ | 5602/6779 [3:27:58<44:12,  2.25s/it]                                                     {'loss': 1.5814, 'learning_rate': 2.997405405982905e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5602/6779 [3:27:58<44:12,  2.25s/it] 83%|████████▎ | 5603/6779 [3:28:00<43:17,  2.21s/it]                                                     {'loss': 1.7292, 'learning_rate': 2.9924536148891478e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5603/6779 [3:28:00<43:17,  2.21s/it] 83%|████████▎ | 5604/6779 [3:28:02<42:32,  2.17s/it]                                                     {'loss': 1.5921, 'learning_rate': 2.9875055866593294e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5604/6779 [3:28:02<42:32,  2.17s/it] 83%|████████▎ | 5605/6779 [3:28:04<42:35,  2.18s/it]                                                     {'loss': 1.6055, 'learning_rate': 2.9825613223881775e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5605/6779 [3:28:04<42:35,  2.18s/it] 83%|████████▎ | 5606/6779 [3:28:07<42:32,  2.18s/it]                                                     {'loss': 1.7402, 'learning_rate': 2.9776208231696023e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5606/6779 [3:28:07<42:32,  2.18s/it] 83%|████████▎ | 5607/6779 [3:28:09<43:48,  2.24s/it]                                                     {'loss': 1.6469, 'learning_rate': 2.9726840900966646e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5607/6779 [3:28:09<43:48,  2.24s/it] 83%|████████▎ | 5608/6779 [3:28:11<43:13,  2.21s/it]                                                     {'loss': 1.5576, 'learning_rate': 2.9677511242616062e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5608/6779 [3:28:11<43:13,  2.21s/it] 83%|████████▎ | 5609/6779 [3:28:13<43:49,  2.25s/it]                                                     {'loss': 1.6247, 'learning_rate': 2.9628219267558298e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5609/6779 [3:28:13<43:49,  2.25s/it] 83%|████████▎ | 5610/6779 [3:28:16<42:50,  2.20s/it]                                                     {'loss': 1.6398, 'learning_rate': 2.9578964986699008e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5610/6779 [3:28:16<42:50,  2.20s/it] 83%|████████▎ | 5611/6779 [3:28:18<43:56,  2.26s/it]                                                     {'loss': 1.5448, 'learning_rate': 2.9529748410935586e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5611/6779 [3:28:18<43:56,  2.26s/it] 83%|████████▎ | 5612/6779 [3:28:20<44:08,  2.27s/it]                                                     {'loss': 1.5058, 'learning_rate': 2.948056955115697e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5612/6779 [3:28:20<44:08,  2.27s/it] 83%|████████▎ | 5613/6779 [3:28:23<44:40,  2.30s/it]                                                     {'loss': 1.7415, 'learning_rate': 2.943142841824389e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5613/6779 [3:28:23<44:40,  2.30s/it] 83%|████████▎ | 5614/6779 [3:28:25<44:00,  2.27s/it]                                                     {'loss': 1.6011, 'learning_rate': 2.938232502306859e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5614/6779 [3:28:25<44:00,  2.27s/it] 83%|████████▎ | 5615/6779 [3:28:27<43:16,  2.23s/it]                                                     {'loss': 1.6684, 'learning_rate': 2.9333259376495093e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5615/6779 [3:28:27<43:16,  2.23s/it] 83%|████████▎ | 5616/6779 [3:28:29<42:09,  2.18s/it]                                                     {'loss': 1.6071, 'learning_rate': 2.9284231489379023e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5616/6779 [3:28:29<42:09,  2.18s/it] 83%|████████▎ | 5617/6779 [3:28:31<40:50,  2.11s/it]                                                     {'loss': 1.6837, 'learning_rate': 2.923524137256759e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5617/6779 [3:28:31<40:50,  2.11s/it] 83%|████████▎ | 5618/6779 [3:28:33<41:23,  2.14s/it]                                                     {'loss': 1.692, 'learning_rate': 2.918628903689975e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5618/6779 [3:28:33<41:23,  2.14s/it] 83%|████████▎ | 5619/6779 [3:28:35<41:27,  2.14s/it]                                                     {'loss': 1.5799, 'learning_rate': 2.9137374493205973e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5619/6779 [3:28:35<41:27,  2.14s/it] 83%|████████▎ | 5620/6779 [3:28:38<41:39,  2.16s/it]                                                     {'loss': 1.438, 'learning_rate': 2.908849775230853e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5620/6779 [3:28:38<41:39,  2.16s/it] 83%|████████▎ | 5621/6779 [3:28:40<41:43,  2.16s/it]                                                     {'loss': 1.6661, 'learning_rate': 2.9039658825021154e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5621/6779 [3:28:40<41:43,  2.16s/it] 83%|████████▎ | 5622/6779 [3:28:42<42:35,  2.21s/it]                                                     {'loss': 1.4791, 'learning_rate': 2.8990857722149333e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5622/6779 [3:28:42<42:35,  2.21s/it] 83%|████████▎ | 5623/6779 [3:28:44<42:42,  2.22s/it]                                                     {'loss': 1.6552, 'learning_rate': 2.894209445449021e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5623/6779 [3:28:44<42:42,  2.22s/it] 83%|████████▎ | 5624/6779 [3:28:47<45:02,  2.34s/it]                                                     {'loss': 1.5334, 'learning_rate': 2.8893369032832395e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5624/6779 [3:28:47<45:02,  2.34s/it] 83%|████████▎ | 5625/6779 [3:28:49<44:17,  2.30s/it]                                                     {'loss': 1.6815, 'learning_rate': 2.8844681467956335e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5625/6779 [3:28:49<44:17,  2.30s/it] 83%|████████▎ | 5626/6779 [3:28:51<43:57,  2.29s/it]                                                     {'loss': 1.4741, 'learning_rate': 2.879603177063388e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5626/6779 [3:28:51<43:57,  2.29s/it] 83%|████████▎ | 5627/6779 [3:28:53<42:51,  2.23s/it]                                                     {'loss': 1.5697, 'learning_rate': 2.874741995162873e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5627/6779 [3:28:53<42:51,  2.23s/it] 83%|████████▎ | 5628/6779 [3:28:56<42:25,  2.21s/it]                                                     {'loss': 1.3762, 'learning_rate': 2.869884602169597e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5628/6779 [3:28:56<42:25,  2.21s/it] 83%|████████▎ | 5629/6779 [3:28:58<42:33,  2.22s/it]                                                     {'loss': 1.7195, 'learning_rate': 2.865030999158249e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5629/6779 [3:28:58<42:33,  2.22s/it] 83%|████████▎ | 5630/6779 [3:29:00<41:29,  2.17s/it]                                                     {'loss': 1.4582, 'learning_rate': 2.8601811872026797e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5630/6779 [3:29:00<41:29,  2.17s/it] 83%|████████▎ | 5631/6779 [3:29:02<40:24,  2.11s/it]                                                     {'loss': 1.4681, 'learning_rate': 2.855335167375881e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5631/6779 [3:29:02<40:24,  2.11s/it] 83%|████████▎ | 5632/6779 [3:29:04<40:19,  2.11s/it]                                                     {'loss': 1.5937, 'learning_rate': 2.850492940750029e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5632/6779 [3:29:04<40:19,  2.11s/it] 83%|████████▎ | 5633/6779 [3:29:06<40:16,  2.11s/it]                                                     {'loss': 1.5523, 'learning_rate': 2.84565450839644e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5633/6779 [3:29:06<40:16,  2.11s/it] 83%|████████▎ | 5634/6779 [3:29:08<40:26,  2.12s/it]                                                     {'loss': 1.5769, 'learning_rate': 2.840819871385616e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5634/6779 [3:29:08<40:26,  2.12s/it] 83%|████████▎ | 5635/6779 [3:29:10<40:24,  2.12s/it]                                                     {'loss': 1.5974, 'learning_rate': 2.8359890307871894e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5635/6779 [3:29:10<40:24,  2.12s/it] 83%|████████▎ | 5636/6779 [3:29:13<40:41,  2.14s/it]                                                     {'loss': 1.6528, 'learning_rate': 2.8311619876699748e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5636/6779 [3:29:13<40:41,  2.14s/it] 83%|████████▎ | 5637/6779 [3:29:15<43:38,  2.29s/it]                                                     {'loss': 1.8736, 'learning_rate': 2.826338743101944e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5637/6779 [3:29:15<43:38,  2.29s/it] 83%|████████▎ | 5638/6779 [3:29:18<44:32,  2.34s/it]                                                     {'loss': 1.7771, 'learning_rate': 2.8215192981502147e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5638/6779 [3:29:18<44:32,  2.34s/it] 83%|████████▎ | 5639/6779 [3:29:20<46:07,  2.43s/it]                                                     {'loss': 1.6791, 'learning_rate': 2.8167036538810853e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5639/6779 [3:29:20<46:07,  2.43s/it] 83%|████████▎ | 5640/6779 [3:29:22<43:54,  2.31s/it]                                                     {'loss': 1.6929, 'learning_rate': 2.811891811359988e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5640/6779 [3:29:22<43:54,  2.31s/it] 83%|████████▎ | 5641/6779 [3:29:24<43:07,  2.27s/it]                                                     {'loss': 1.5434, 'learning_rate': 2.8070837716515375e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5641/6779 [3:29:24<43:07,  2.27s/it] 83%|████████▎ | 5642/6779 [3:29:27<43:24,  2.29s/it]                                                     {'loss': 1.5349, 'learning_rate': 2.8022795358194897e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5642/6779 [3:29:27<43:24,  2.29s/it] 83%|████████▎ | 5643/6779 [3:29:29<42:59,  2.27s/it]                                                     {'loss': 1.7724, 'learning_rate': 2.7974791049267723e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5643/6779 [3:29:29<42:59,  2.27s/it] 83%|████████▎ | 5644/6779 [3:29:31<42:38,  2.25s/it]                                                     {'loss': 1.6335, 'learning_rate': 2.7926824800354534e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5644/6779 [3:29:31<42:38,  2.25s/it] 83%|████████▎ | 5645/6779 [3:29:33<41:14,  2.18s/it]                                                     {'loss': 1.5976, 'learning_rate': 2.7878896622067885e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5645/6779 [3:29:33<41:14,  2.18s/it] 83%|████████▎ | 5646/6779 [3:29:35<41:08,  2.18s/it]                                                     {'loss': 1.5914, 'learning_rate': 2.7831006525011625e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5646/6779 [3:29:35<41:08,  2.18s/it] 83%|████████▎ | 5647/6779 [3:29:38<41:29,  2.20s/it]                                                     {'loss': 1.5825, 'learning_rate': 2.778315451978124e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5647/6779 [3:29:38<41:29,  2.20s/it] 83%|████████▎ | 5648/6779 [3:29:40<40:47,  2.16s/it]                                                     {'loss': 1.8169, 'learning_rate': 2.7735340616963923e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5648/6779 [3:29:40<40:47,  2.16s/it] 83%|████████▎ | 5649/6779 [3:29:42<40:32,  2.15s/it]                                                     {'loss': 1.7444, 'learning_rate': 2.7687564827138258e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5649/6779 [3:29:42<40:32,  2.15s/it] 83%|████████▎ | 5650/6779 [3:29:44<40:32,  2.15s/it]                                                     {'loss': 1.7536, 'learning_rate': 2.7639827160874565e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5650/6779 [3:29:44<40:32,  2.15s/it] 83%|████████▎ | 5651/6779 [3:29:46<40:04,  2.13s/it]                                                     {'loss': 1.6431, 'learning_rate': 2.7592127628734532e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5651/6779 [3:29:46<40:04,  2.13s/it] 83%|████████▎ | 5652/6779 [3:29:48<40:31,  2.16s/it]                                                     {'loss': 1.713, 'learning_rate': 2.754446624127167e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5652/6779 [3:29:48<40:31,  2.16s/it] 83%|████████▎ | 5653/6779 [3:29:50<40:04,  2.14s/it]                                                     {'loss': 1.7515, 'learning_rate': 2.7496843009030793e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5653/6779 [3:29:50<40:04,  2.14s/it] 83%|████████▎ | 5654/6779 [3:29:52<38:44,  2.07s/it]                                                     {'loss': 1.4655, 'learning_rate': 2.7449257942548445e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5654/6779 [3:29:52<38:44,  2.07s/it] 83%|████████▎ | 5655/6779 [3:29:55<40:06,  2.14s/it]                                                     {'loss': 1.6231, 'learning_rate': 2.7401711052352673e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5655/6779 [3:29:55<40:06,  2.14s/it] 83%|████████▎ | 5656/6779 [3:29:57<41:43,  2.23s/it]                                                     {'loss': 1.7325, 'learning_rate': 2.7354202348962997e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5656/6779 [3:29:57<41:43,  2.23s/it] 83%|████████▎ | 5657/6779 [3:29:59<41:15,  2.21s/it]                                                     {'loss': 1.5015, 'learning_rate': 2.7306731842890633e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5657/6779 [3:29:59<41:15,  2.21s/it] 83%|████████▎ | 5658/6779 [3:30:01<40:19,  2.16s/it]                                                     {'loss': 1.6715, 'learning_rate': 2.7259299544638172e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5658/6779 [3:30:01<40:19,  2.16s/it] 83%|████████▎ | 5659/6779 [3:30:03<40:18,  2.16s/it]                                                     {'loss': 1.6534, 'learning_rate': 2.721190546470003e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5659/6779 [3:30:03<40:18,  2.16s/it] 83%|████████▎ | 5660/6779 [3:30:06<41:23,  2.22s/it]                                                     {'loss': 1.7679, 'learning_rate': 2.716454961356183e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5660/6779 [3:30:06<41:23,  2.22s/it] 84%|████████▎ | 5661/6779 [3:30:08<41:53,  2.25s/it]                                                     {'loss': 1.7886, 'learning_rate': 2.7117232001700997e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5661/6779 [3:30:08<41:53,  2.25s/it] 84%|████████▎ | 5662/6779 [3:30:11<43:08,  2.32s/it]                                                     {'loss': 1.6918, 'learning_rate': 2.7069952639586405e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5662/6779 [3:30:11<43:08,  2.32s/it] 84%|████████▎ | 5663/6779 [3:30:13<42:30,  2.29s/it]                                                     {'loss': 1.6887, 'learning_rate': 2.7022711537678346e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5663/6779 [3:30:13<42:30,  2.29s/it] 84%|████████▎ | 5664/6779 [3:30:15<42:28,  2.29s/it]                                                     {'loss': 1.6617, 'learning_rate': 2.6975508706428864e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5664/6779 [3:30:15<42:28,  2.29s/it] 84%|████████▎ | 5665/6779 [3:30:17<41:31,  2.24s/it]                                                     {'loss': 1.4203, 'learning_rate': 2.6928344156281314e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5665/6779 [3:30:17<41:31,  2.24s/it] 84%|████████▎ | 5666/6779 [3:30:20<42:08,  2.27s/it]                                                     {'loss': 1.6012, 'learning_rate': 2.6881217897670883e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5666/6779 [3:30:20<42:08,  2.27s/it] 84%|████████▎ | 5667/6779 [3:30:22<43:11,  2.33s/it]                                                     {'loss': 1.6437, 'learning_rate': 2.6834129941023945e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5667/6779 [3:30:22<43:11,  2.33s/it] 84%|████████▎ | 5668/6779 [3:30:24<41:48,  2.26s/it]                                                     {'loss': 1.462, 'learning_rate': 2.678708029675865e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5668/6779 [3:30:24<41:48,  2.26s/it] 84%|████████▎ | 5669/6779 [3:30:27<44:03,  2.38s/it]                                                     {'loss': 1.6661, 'learning_rate': 2.6740068975284517e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5669/6779 [3:30:27<44:03,  2.38s/it] 84%|████████▎ | 5670/6779 [3:30:29<41:41,  2.26s/it]                                                     {'loss': 1.694, 'learning_rate': 2.6693095987002692e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5670/6779 [3:30:29<41:41,  2.26s/it] 84%|████████▎ | 5671/6779 [3:30:31<43:00,  2.33s/it]                                                     {'loss': 1.6, 'learning_rate': 2.6646161342305776e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5671/6779 [3:30:31<43:00,  2.33s/it] 84%|████████▎ | 5672/6779 [3:30:34<43:17,  2.35s/it]                                                     {'loss': 1.5279, 'learning_rate': 2.6599265051577793e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5672/6779 [3:30:34<43:17,  2.35s/it] 84%|████████▎ | 5673/6779 [3:30:36<42:05,  2.28s/it]                                                     {'loss': 1.6627, 'learning_rate': 2.6552407125194623e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5673/6779 [3:30:36<42:05,  2.28s/it] 84%|████████▎ | 5674/6779 [3:30:38<40:43,  2.21s/it]                                                     {'loss': 1.7039, 'learning_rate': 2.6505587573523237e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5674/6779 [3:30:38<40:43,  2.21s/it] 84%|████████▎ | 5675/6779 [3:30:40<40:32,  2.20s/it]                                                     {'loss': 1.7706, 'learning_rate': 2.6458806406922422e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5675/6779 [3:30:40<40:32,  2.20s/it] 84%|████████▎ | 5676/6779 [3:30:42<40:06,  2.18s/it]                                                     {'loss': 1.5241, 'learning_rate': 2.641206363574227e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5676/6779 [3:30:42<40:06,  2.18s/it] 84%|████████▎ | 5677/6779 [3:30:44<39:55,  2.17s/it]                                                     {'loss': 1.6799, 'learning_rate': 2.6365359270324576e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5677/6779 [3:30:44<39:55,  2.17s/it] 84%|████████▍ | 5678/6779 [3:30:47<40:17,  2.20s/it]                                                     {'loss': 1.6805, 'learning_rate': 2.6318693321002387e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5678/6779 [3:30:47<40:17,  2.20s/it] 84%|████████▍ | 5679/6779 [3:30:49<40:02,  2.18s/it]                                                     {'loss': 1.6184, 'learning_rate': 2.6272065798100487e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5679/6779 [3:30:49<40:02,  2.18s/it] 84%|████████▍ | 5680/6779 [3:30:51<40:57,  2.24s/it]                                                     {'loss': 1.6013, 'learning_rate': 2.622547671193507e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5680/6779 [3:30:51<40:57,  2.24s/it] 84%|████████▍ | 5681/6779 [3:30:53<40:38,  2.22s/it]                                                     {'loss': 1.648, 'learning_rate': 2.6178926072813736e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5681/6779 [3:30:53<40:38,  2.22s/it] 84%|████████▍ | 5682/6779 [3:30:56<41:27,  2.27s/it]                                                     {'loss': 1.5386, 'learning_rate': 2.613241389103578e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5682/6779 [3:30:56<41:27,  2.27s/it] 84%|████████▍ | 5683/6779 [3:30:58<40:03,  2.19s/it]                                                     {'loss': 1.6956, 'learning_rate': 2.6085940176891765e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5683/6779 [3:30:58<40:03,  2.19s/it] 84%|████████▍ | 5684/6779 [3:31:00<39:48,  2.18s/it]                                                     {'loss': 1.6998, 'learning_rate': 2.6039504940663916e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5684/6779 [3:31:00<39:48,  2.18s/it] 84%|████████▍ | 5685/6779 [3:31:02<40:25,  2.22s/it]                                                     {'loss': 1.7176, 'learning_rate': 2.5993108192625814e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5685/6779 [3:31:02<40:25,  2.22s/it] 84%|████████▍ | 5686/6779 [3:31:04<39:45,  2.18s/it]                                                     {'loss': 1.6919, 'learning_rate': 2.5946749943042605e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5686/6779 [3:31:04<39:45,  2.18s/it] 84%|████████▍ | 5687/6779 [3:31:06<39:06,  2.15s/it]                                                     {'loss': 1.6365, 'learning_rate': 2.590043020217099e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5687/6779 [3:31:06<39:06,  2.15s/it] 84%|████████▍ | 5688/6779 [3:31:08<39:22,  2.17s/it]                                                     {'loss': 1.6419, 'learning_rate': 2.585414898025893e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5688/6779 [3:31:08<39:22,  2.17s/it] 84%|████████▍ | 5689/6779 [3:31:11<38:42,  2.13s/it]                                                     {'loss': 1.6334, 'learning_rate': 2.580790628754608e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5689/6779 [3:31:11<38:42,  2.13s/it] 84%|████████▍ | 5690/6779 [3:31:13<40:23,  2.23s/it]                                                     {'loss': 1.7429, 'learning_rate': 2.5761702134263433e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5690/6779 [3:31:13<40:23,  2.23s/it] 84%|████████▍ | 5691/6779 [3:31:15<38:57,  2.15s/it]                                                     {'loss': 1.5324, 'learning_rate': 2.5715536530633564e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5691/6779 [3:31:15<38:57,  2.15s/it] 84%|████████▍ | 5692/6779 [3:31:17<39:32,  2.18s/it]                                                     {'loss': 1.8116, 'learning_rate': 2.5669409486870377e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5692/6779 [3:31:17<39:32,  2.18s/it] 84%|████████▍ | 5693/6779 [3:31:19<38:25,  2.12s/it]                                                     {'loss': 1.5923, 'learning_rate': 2.5623321013179392e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5693/6779 [3:31:19<38:25,  2.12s/it] 84%|████████▍ | 5694/6779 [3:31:22<39:44,  2.20s/it]                                                     {'loss': 1.6284, 'learning_rate': 2.557727111975756e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5694/6779 [3:31:22<39:44,  2.20s/it] 84%|████████▍ | 5695/6779 [3:31:24<39:43,  2.20s/it]                                                     {'loss': 1.6601, 'learning_rate': 2.5531259816793185e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5695/6779 [3:31:24<39:43,  2.20s/it] 84%|████████▍ | 5696/6779 [3:31:26<39:24,  2.18s/it]                                                     {'loss': 1.6295, 'learning_rate': 2.5485287114466205e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5696/6779 [3:31:26<39:24,  2.18s/it] 84%|████████▍ | 5697/6779 [3:31:28<38:46,  2.15s/it]                                                     {'loss': 1.5543, 'learning_rate': 2.543935302294782e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5697/6779 [3:31:28<38:46,  2.15s/it] 84%|████████▍ | 5698/6779 [3:31:30<39:19,  2.18s/it]                                                     {'loss': 1.6446, 'learning_rate': 2.5393457552400945e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5698/6779 [3:31:30<39:19,  2.18s/it] 84%|████████▍ | 5699/6779 [3:31:32<39:18,  2.18s/it]                                                     {'loss': 1.6542, 'learning_rate': 2.5347600712979657e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5699/6779 [3:31:32<39:18,  2.18s/it] 84%|████████▍ | 5700/6779 [3:31:35<42:36,  2.37s/it]                                                     {'loss': 1.5526, 'learning_rate': 2.5301782514829684e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5700/6779 [3:31:35<42:36,  2.37s/it] 84%|████████▍ | 5701/6779 [3:31:38<42:23,  2.36s/it]                                                     {'loss': 1.539, 'learning_rate': 2.5256002968088232e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5701/6779 [3:31:38<42:23,  2.36s/it] 84%|████████▍ | 5702/6779 [3:31:40<41:24,  2.31s/it]                                                     {'loss': 1.6121, 'learning_rate': 2.521026208288375e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5702/6779 [3:31:40<41:24,  2.31s/it] 84%|████████▍ | 5703/6779 [3:31:42<40:02,  2.23s/it]                                                     {'loss': 1.5428, 'learning_rate': 2.5164559869336345e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5703/6779 [3:31:42<40:02,  2.23s/it] 84%|████████▍ | 5704/6779 [3:31:44<40:07,  2.24s/it]                                                     {'loss': 1.5816, 'learning_rate': 2.511889633755744e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5704/6779 [3:31:44<40:07,  2.24s/it] 84%|████████▍ | 5705/6779 [3:31:46<39:49,  2.22s/it]                                                     {'loss': 1.6225, 'learning_rate': 2.5073271497649976e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5705/6779 [3:31:46<39:49,  2.22s/it] 84%|████████▍ | 5706/6779 [3:31:48<39:17,  2.20s/it]                                                     {'loss': 1.3848, 'learning_rate': 2.5027685359708252e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5706/6779 [3:31:48<39:17,  2.20s/it] 84%|████████▍ | 5707/6779 [3:31:50<37:58,  2.13s/it]                                                     {'loss': 1.5972, 'learning_rate': 2.4982137933818073e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5707/6779 [3:31:50<37:58,  2.13s/it] 84%|████████▍ | 5708/6779 [3:31:52<36:43,  2.06s/it]                                                     {'loss': 1.6558, 'learning_rate': 2.4936629230056687e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5708/6779 [3:31:52<36:43,  2.06s/it] 84%|████████▍ | 5709/6779 [3:31:54<37:40,  2.11s/it]                                                     {'loss': 1.737, 'learning_rate': 2.48911592584927e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5709/6779 [3:31:54<37:40,  2.11s/it] 84%|████████▍ | 5710/6779 [3:31:57<38:32,  2.16s/it]                                                     {'loss': 1.806, 'learning_rate': 2.4845728029186257e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5710/6779 [3:31:57<38:32,  2.16s/it] 84%|████████▍ | 5711/6779 [3:31:59<38:44,  2.18s/it]                                                     {'loss': 1.4878, 'learning_rate': 2.480033555218879e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5711/6779 [3:31:59<38:44,  2.18s/it] 84%|████████▍ | 5712/6779 [3:32:01<38:32,  2.17s/it]                                                     {'loss': 1.5433, 'learning_rate': 2.47549818375433e-05, 'epoch': 0.84}
+ 84%|████��███▍ | 5712/6779 [3:32:01<38:32,  2.17s/it] 84%|████████▍ | 5713/6779 [3:32:04<39:40,  2.23s/it]                                                     {'loss': 1.4747, 'learning_rate': 2.470966689528409e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5713/6779 [3:32:04<39:40,  2.23s/it] 84%|████████▍ | 5714/6779 [3:32:06<38:59,  2.20s/it]                                                     {'loss': 1.6793, 'learning_rate': 2.466439073543696e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5714/6779 [3:32:06<38:59,  2.20s/it] 84%|████████▍ | 5715/6779 [3:32:08<39:10,  2.21s/it]                                                     {'loss': 1.5148, 'learning_rate': 2.4619153368019144e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5715/6779 [3:32:08<39:10,  2.21s/it] 84%|████████▍ | 5716/6779 [3:32:10<39:40,  2.24s/it]                                                     {'loss': 1.5181, 'learning_rate': 2.457395480303928e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5716/6779 [3:32:10<39:40,  2.24s/it] 84%|████████▍ | 5717/6779 [3:32:12<39:32,  2.23s/it]                                                     {'loss': 1.6311, 'learning_rate': 2.4528795050497368e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5717/6779 [3:32:12<39:32,  2.23s/it] 84%|████████▍ | 5718/6779 [3:32:15<39:08,  2.21s/it]                                                     {'loss': 1.5976, 'learning_rate': 2.4483674120384815e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5718/6779 [3:32:15<39:08,  2.21s/it] 84%|████████▍ | 5719/6779 [3:32:17<39:09,  2.22s/it]                                                     {'loss': 1.6537, 'learning_rate': 2.4438592022684547e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5719/6779 [3:32:17<39:09,  2.22s/it] 84%|████████▍ | 5720/6779 [3:32:19<38:25,  2.18s/it]                                                     {'loss': 1.6264, 'learning_rate': 2.4393548767370767e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5720/6779 [3:32:19<38:25,  2.18s/it] 84%|████████▍ | 5721/6779 [3:32:21<37:48,  2.14s/it]                                                     {'loss': 1.5559, 'learning_rate': 2.434854436440921e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5721/6779 [3:32:21<37:48,  2.14s/it] 84%|████████▍ | 5722/6779 [3:32:23<37:41,  2.14s/it]                                                     {'loss': 1.76, 'learning_rate': 2.4303578823756846e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5722/6779 [3:32:23<37:41,  2.14s/it] 84%|████████▍ | 5723/6779 [3:32:25<37:36,  2.14s/it]                                                     {'loss': 1.6614, 'learning_rate': 2.4258652155362337e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5723/6779 [3:32:25<37:36,  2.14s/it] 84%|████████▍ | 5724/6779 [3:32:28<39:39,  2.26s/it]                                                     {'loss': 1.6295, 'learning_rate': 2.421376436916538e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5724/6779 [3:32:28<39:39,  2.26s/it] 84%|████████▍ | 5725/6779 [3:32:30<38:18,  2.18s/it]                                                     {'loss': 1.565, 'learning_rate': 2.4168915475097408e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5725/6779 [3:32:30<38:18,  2.18s/it] 84%|████████▍ | 5726/6779 [3:32:32<38:49,  2.21s/it]                                                     {'loss': 1.654, 'learning_rate': 2.412410548308097e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5726/6779 [3:32:32<38:49,  2.21s/it] 84%|████████▍ | 5727/6779 [3:32:34<38:17,  2.18s/it]                                                     {'loss': 1.6983, 'learning_rate': 2.4079334403030163e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5727/6779 [3:32:34<38:17,  2.18s/it] 84%|████████▍ | 5728/6779 [3:32:36<38:00,  2.17s/it]                                                     {'loss': 1.6545, 'learning_rate': 2.403460224485048e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5728/6779 [3:32:36<38:00,  2.17s/it] 85%|████████▍ | 5729/6779 [3:32:38<37:51,  2.16s/it]                                                     {'loss': 1.5266, 'learning_rate': 2.3989909018438627e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5729/6779 [3:32:38<37:51,  2.16s/it] 85%|████████▍ | 5730/6779 [3:32:41<39:15,  2.25s/it]                                                     {'loss': 1.5709, 'learning_rate': 2.3945254733683053e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5730/6779 [3:32:41<39:15,  2.25s/it] 85%|████████▍ | 5731/6779 [3:32:43<37:43,  2.16s/it]                                                     {'loss': 1.5499, 'learning_rate': 2.390063940046321e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5731/6779 [3:32:43<37:43,  2.16s/it] 85%|████████▍ | 5732/6779 [3:32:45<37:07,  2.13s/it]                                                     {'loss': 1.5795, 'learning_rate': 2.38560630286502e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5732/6779 [3:32:45<37:07,  2.13s/it] 85%|████████▍ | 5733/6779 [3:32:47<38:18,  2.20s/it]                                                     {'loss': 1.5755, 'learning_rate': 2.3811525628106314e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5733/6779 [3:32:47<38:18,  2.20s/it] 85%|████████▍ | 5734/6779 [3:32:49<37:49,  2.17s/it]                                                     {'loss': 1.6351, 'learning_rate': 2.376702720868531e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5734/6779 [3:32:49<37:49,  2.17s/it] 85%|████████▍ | 5735/6779 [3:32:51<37:33,  2.16s/it]                                                     {'loss': 1.6259, 'learning_rate': 2.3722567780232387e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5735/6779 [3:32:51<37:33,  2.16s/it] 85%|████████▍ | 5736/6779 [3:32:54<38:11,  2.20s/it]                                                     {'loss': 1.5623, 'learning_rate': 2.3678147352583913e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5736/6779 [3:32:54<38:11,  2.20s/it] 85%|████████▍ | 5737/6779 [3:32:57<42:09,  2.43s/it]                                                     {'loss': 1.5479, 'learning_rate': 2.3633765935567963e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5737/6779 [3:32:57<42:09,  2.43s/it] 85%|████████▍ | 5738/6779 [3:32:59<40:49,  2.35s/it]                                                     {'loss': 1.635, 'learning_rate': 2.3589423539003596e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5738/6779 [3:32:59<40:49,  2.35s/it] 85%|████████▍ | 5739/6779 [3:33:01<40:07,  2.32s/it]                                                     {'loss': 1.6604, 'learning_rate': 2.3545120172701562e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5739/6779 [3:33:01<40:07,  2.32s/it] 85%|████████▍ | 5740/6779 [3:33:03<39:32,  2.28s/it]                                                     {'loss': 1.5148, 'learning_rate': 2.3500855846463708e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5740/6779 [3:33:03<39:32,  2.28s/it] 85%|████████▍ | 5741/6779 [3:33:05<37:48,  2.19s/it]                                                     {'loss': 1.751, 'learning_rate': 2.3456630570083494e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5741/6779 [3:33:05<37:48,  2.19s/it] 85%|████████▍ | 5742/6779 [3:33:08<38:29,  2.23s/it]                                                     {'loss': 1.5681, 'learning_rate': 2.3412444353345554e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5742/6779 [3:33:08<38:29,  2.23s/it] 85%|████████▍ | 5743/6779 [3:33:10<38:03,  2.20s/it]                                                     {'loss': 1.5634, 'learning_rate': 2.3368297206025846e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5743/6779 [3:33:10<38:03,  2.20s/it] 85%|████████▍ | 5744/6779 [3:33:12<37:23,  2.17s/it]                                                     {'loss': 1.6041, 'learning_rate': 2.3324189137891983e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5744/6779 [3:33:12<37:23,  2.17s/it] 85%|████████▍ | 5745/6779 [3:33:14<36:19,  2.11s/it]                                                     {'loss': 1.5932, 'learning_rate': 2.328012015870258e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5745/6779 [3:33:14<36:19,  2.11s/it] 85%|████████▍ | 5746/6779 [3:33:16<36:17,  2.11s/it]                                                     {'loss': 1.7653, 'learning_rate': 2.3236090278207855e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5746/6779 [3:33:16<36:17,  2.11s/it] 85%|████████▍ | 5747/6779 [3:33:18<35:52,  2.09s/it]                                                     {'loss': 1.6959, 'learning_rate': 2.3192099506149178e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5747/6779 [3:33:18<35:52,  2.09s/it] 85%|████████▍ | 5748/6779 [3:33:20<36:04,  2.10s/it]                                                     {'loss': 1.6121, 'learning_rate': 2.314814785225945e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5748/6779 [3:33:20<36:04,  2.10s/it] 85%|████████▍ | 5749/6779 [3:33:22<36:32,  2.13s/it]                                                     {'loss': 1.5952, 'learning_rate': 2.3104235326262736e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5749/6779 [3:33:22<36:32,  2.13s/it] 85%|████████▍ | 5750/6779 [3:33:25<37:37,  2.19s/it]                                                     {'loss': 1.5936, 'learning_rate': 2.30603619378746e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5750/6779 [3:33:25<37:37,  2.19s/it] 85%|████████▍ | 5751/6779 [3:33:27<37:04,  2.16s/it]                                                     {'loss': 1.4965, 'learning_rate': 2.3016527696801936e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5751/6779 [3:33:27<37:04,  2.16s/it] 85%|████████▍ | 5752/6779 [3:33:29<37:12,  2.17s/it]                                                     {'loss': 1.7227, 'learning_rate': 2.297273261274282e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5752/6779 [3:33:29<37:12,  2.17s/it] 85%|████████▍ | 5753/6779 [3:33:31<36:34,  2.14s/it]                                                     {'loss': 1.5715, 'learning_rate': 2.292897669538685e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5753/6779 [3:33:31<36:34,  2.14s/it] 85%|████████▍ | 5754/6779 [3:33:34<38:52,  2.28s/it]                                                     {'loss': 1.696, 'learning_rate': 2.2885259954414818e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5754/6779 [3:33:34<38:52,  2.28s/it] 85%|████████▍ | 5755/6779 [3:33:36<38:33,  2.26s/it]                                                     {'loss': 1.8113, 'learning_rate': 2.2841582399498962e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5755/6779 [3:33:36<38:33,  2.26s/it] 85%|████████▍ | 5756/6779 [3:33:38<38:12,  2.24s/it]                                                     {'loss': 1.6363, 'learning_rate': 2.2797944040302754e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5756/6779 [3:33:38<38:12,  2.24s/it] 85%|████████▍ | 5757/6779 [3:33:40<38:32,  2.26s/it]                                                     {'loss': 1.595, 'learning_rate': 2.275434488648107e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5757/6779 [3:33:40<38:32,  2.26s/it] 85%|████████▍ | 5758/6779 [3:33:43<38:43,  2.28s/it]                                                     {'loss': 1.6624, 'learning_rate': 2.2710784947680084e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5758/6779 [3:33:43<38:43,  2.28s/it] 85%|████████▍ | 5759/6779 [3:33:45<38:32,  2.27s/it]                                                     {'loss': 1.6232, 'learning_rate': 2.2667264233537267e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5759/6779 [3:33:45<38:32,  2.27s/it] 85%|████████▍ | 5760/6779 [3:33:47<39:00,  2.30s/it]                                                     {'loss': 1.6215, 'learning_rate': 2.2623782753681466e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5760/6779 [3:33:47<39:00,  2.30s/it] 85%|████████▍ | 5761/6779 [3:33:50<39:05,  2.30s/it]                                                     {'loss': 1.7096, 'learning_rate': 2.2580340517732745e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5761/6779 [3:33:50<39:05,  2.30s/it] 85%|████████▍ | 5762/6779 [3:33:52<39:44,  2.34s/it]                                                     {'loss': 1.5874, 'learning_rate': 2.253693753530266e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5762/6779 [3:33:52<39:44,  2.34s/it] 85%|████████▌ | 5763/6779 [3:33:54<37:42,  2.23s/it]                                                     {'loss': 1.7023, 'learning_rate': 2.2493573815993886e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5763/6779 [3:33:54<37:42,  2.23s/it] 85%|████████▌ | 5764/6779 [3:33:57<39:34,  2.34s/it]                                                     {'loss': 1.5806, 'learning_rate': 2.2450249369400523e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5764/6779 [3:33:57<39:34,  2.34s/it] 85%|████████▌ | 5765/6779 [3:33:59<38:06,  2.25s/it]                                                     {'loss': 1.6068, 'learning_rate': 2.2406964205108038e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5765/6779 [3:33:59<38:06,  2.25s/it] 85%|████████▌ | 5766/6779 [3:34:03<47:29,  2.81s/it]                                                     {'loss': 1.4316, 'learning_rate': 2.236371833269304e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5766/6779 [3:34:03<47:29,  2.81s/it] 85%|████████▌ | 5767/6779 [3:34:05<43:49,  2.60s/it]                                                     {'loss': 1.7301, 'learning_rate': 2.2320511761723584e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5767/6779 [3:34:05<43:49,  2.60s/it] 85%|████████▌ | 5768/6779 [3:34:07<41:44,  2.48s/it]                                                     {'loss': 1.5971, 'learning_rate': 2.2277344501758958e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5768/6779 [3:34:07<41:44,  2.48s/it] 85%|████████▌ | 5769/6779 [3:34:09<40:17,  2.39s/it]                                                     {'loss': 1.7367, 'learning_rate': 2.223421656234983e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5769/6779 [3:34:09<40:17,  2.39s/it] 85%|████████▌ | 5770/6779 [3:34:11<39:37,  2.36s/it]                                                     {'loss': 1.6914, 'learning_rate': 2.2191127953038015e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5770/6779 [3:34:11<39:37,  2.36s/it] 85%|████████▌ | 5771/6779 [3:34:14<39:03,  2.32s/it]                                                     {'loss': 1.7042, 'learning_rate': 2.21480786833568e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5771/6779 [3:34:14<39:03,  2.32s/it] 85%|████████▌ | 5772/6779 [3:34:16<39:57,  2.38s/it]                                                     {'loss': 1.6796, 'learning_rate': 2.2105068762830715e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5772/6779 [3:34:16<39:57,  2.38s/it] 85%|████████▌ | 5773/6779 [3:34:18<38:46,  2.31s/it]                                                     {'loss': 1.5759, 'learning_rate': 2.206209820097549e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5773/6779 [3:34:18<38:46,  2.31s/it] 85%|████████▌ | 5774/6779 [3:34:20<37:39,  2.25s/it]                                                     {'loss': 1.7195, 'learning_rate': 2.2019167007298314e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5774/6779 [3:34:20<37:39,  2.25s/it] 85%|████████▌ | 5775/6779 [3:34:23<36:43,  2.19s/it]                                                     {'loss': 1.6787, 'learning_rate': 2.1976275191297458e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5775/6779 [3:34:23<36:43,  2.19s/it] 85%|████████▌ | 5776/6779 [3:34:25<36:01,  2.16s/it]                                                     {'loss': 1.6355, 'learning_rate': 2.193342276246273e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5776/6779 [3:34:25<36:01,  2.16s/it] 85%|████████▌ | 5777/6779 [3:34:27<35:57,  2.15s/it]                                                     {'loss': 1.6892, 'learning_rate': 2.1890609730274946e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5777/6779 [3:34:27<35:57,  2.15s/it] 85%|████████▌ | 5778/6779 [3:34:29<35:11,  2.11s/it]                                                     {'loss': 1.4686, 'learning_rate': 2.184783610420644e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5778/6779 [3:34:29<35:11,  2.11s/it] 85%|████████▌ | 5779/6779 [3:34:31<34:57,  2.10s/it]                                                     {'loss': 1.7383, 'learning_rate': 2.1805101893720758e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5779/6779 [3:34:31<34:57,  2.10s/it] 85%|████████▌ | 5780/6779 [3:34:33<35:08,  2.11s/it]                                                     {'loss': 1.6147, 'learning_rate': 2.17624071082726e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5780/6779 [3:34:33<35:08,  2.11s/it] 85%|████████▌ | 5781/6779 [3:34:35<36:35,  2.20s/it]                                                     {'loss': 1.6307, 'learning_rate': 2.171975175730818e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5781/6779 [3:34:35<36:35,  2.20s/it] 85%|████████▌ | 5782/6779 [3:34:38<36:59,  2.23s/it]                                                     {'loss': 1.7539, 'learning_rate': 2.167713585026474e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5782/6779 [3:34:38<36:59,  2.23s/it] 85%|████████▌ | 5783/6779 [3:34:40<36:14,  2.18s/it]                                                     {'loss': 1.5865, 'learning_rate': 2.1634559396570976e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5783/6779 [3:34:40<36:14,  2.18s/it] 85%|████████▌ | 5784/6779 [3:34:43<40:38,  2.45s/it]                                                     {'loss': 1.5843, 'learning_rate': 2.159202240564675e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5784/6779 [3:34:43<40:38,  2.45s/it] 85%|████████▌ | 5785/6779 [3:34:45<39:23,  2.38s/it]                                                     {'loss': 1.809, 'learning_rate': 2.154952488690325e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5785/6779 [3:34:45<39:23,  2.38s/it] 85%|████████▌ | 5786/6779 [3:34:47<38:06,  2.30s/it]                                                     {'loss': 1.6143, 'learning_rate': 2.1507066849742907e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5786/6779 [3:34:47<38:06,  2.30s/it] 85%|████████▌ | 5787/6779 [3:34:49<37:10,  2.25s/it]                                                     {'loss': 1.7053, 'learning_rate': 2.1464648303559453e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5787/6779 [3:34:49<37:10,  2.25s/it] 85%|████████▌ | 5788/6779 [3:34:52<36:56,  2.24s/it]                                                     {'loss': 1.7141, 'learning_rate': 2.1422269257737847e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5788/6779 [3:34:52<36:56,  2.24s/it] 85%|████████▌ | 5789/6779 [3:34:53<35:36,  2.16s/it]                                                     {'loss': 1.7073, 'learning_rate': 2.1379929721654257e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5789/6779 [3:34:54<35:36,  2.16s/it] 85%|████████▌ | 5790/6779 [3:34:56<36:25,  2.21s/it]                                                     {'loss': 1.7196, 'learning_rate': 2.1337629704676233e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5790/6779 [3:34:56<36:25,  2.21s/it] 85%|████████▌ | 5791/6779 [3:34:58<36:17,  2.20s/it]                                                     {'loss': 1.7097, 'learning_rate': 2.1295369216162464e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5791/6779 [3:34:58<36:17,  2.20s/it] 85%|████████▌ | 5792/6779 [3:35:00<35:35,  2.16s/it]                                                     {'loss': 1.6364, 'learning_rate': 2.1253148265462964e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5792/6779 [3:35:00<35:35,  2.16s/it] 85%|████████▌ | 5793/6779 [3:35:02<35:56,  2.19s/it]                                                     {'loss': 1.7096, 'learning_rate': 2.121096686191897e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5793/6779 [3:35:02<35:56,  2.19s/it] 85%|████████▌ | 5794/6779 [3:35:05<36:11,  2.20s/it]                                                     {'loss': 1.701, 'learning_rate': 2.1168825014863038e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5794/6779 [3:35:05<36:11,  2.20s/it] 85%|████████▌ | 5795/6779 [3:35:07<36:20,  2.22s/it]                                                     {'loss': 1.5568, 'learning_rate': 2.1126722733618843e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5795/6779 [3:35:07<36:20,  2.22s/it] 85%|████████▌ | 5796/6779 [3:35:09<35:14,  2.15s/it]                                                     {'loss': 1.5544, 'learning_rate': 2.1084660027501424e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5796/6779 [3:35:09<35:14,  2.15s/it] 86%|████████▌ | 5797/6779 [3:35:11<35:10,  2.15s/it]                                                     {'loss': 1.668, 'learning_rate': 2.1042636905817026e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5797/6779 [3:35:11<35:10,  2.15s/it] 86%|████████▌ | 5798/6779 [3:35:13<35:02,  2.14s/it]                                                     {'loss': 1.6581, 'learning_rate': 2.1000653377863033e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5798/6779 [3:35:13<35:02,  2.14s/it] 86%|████████▌ | 5799/6779 [3:35:15<35:22,  2.17s/it]                                                     {'loss': 1.7212, 'learning_rate': 2.095870945292826e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5799/6779 [3:35:15<35:22,  2.17s/it] 86%|████████▌ | 5800/6779 [3:35:18<36:52,  2.26s/it]                                                     {'loss': 1.6951, 'learning_rate': 2.0916805140292573e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5800/6779 [3:35:18<36:52,  2.26s/it] 86%|████████▌ | 5801/6779 [3:35:20<36:14,  2.22s/it]                                                     {'loss': 1.7579, 'learning_rate': 2.0874940449227286e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5801/6779 [3:35:20<36:14,  2.22s/it] 86%|████████▌ | 5802/6779 [3:35:22<36:02,  2.21s/it]                                                     {'loss': 1.7144, 'learning_rate': 2.0833115388994728e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5802/6779 [3:35:22<36:02,  2.21s/it] 86%|████████▌ | 5803/6779 [3:35:24<36:10,  2.22s/it]                                                     {'loss': 1.6012, 'learning_rate': 2.0791329968848626e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5803/6779 [3:35:24<36:10,  2.22s/it] 86%|████████▌ | 5804/6779 [3:35:27<36:48,  2.27s/it]                                                     {'loss': 1.5963, 'learning_rate': 2.074958419803381e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5804/6779 [3:35:27<36:48,  2.27s/it] 86%|████████▌ | 5805/6779 [3:35:29<36:57,  2.28s/it]                                                     {'loss': 1.7273, 'learning_rate': 2.0707878085786404e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5805/6779 [3:35:29<36:57,  2.28s/it] 86%|████████▌ | 5806/6779 [3:35:31<36:24,  2.25s/it]                                                     {'loss': 1.7668, 'learning_rate': 2.0666211641333777e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5806/6779 [3:35:31<36:24,  2.25s/it] 86%|████████▌ | 5807/6779 [3:35:34<36:56,  2.28s/it]                                                     {'loss': 1.5254, 'learning_rate': 2.0624584873894427e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5807/6779 [3:35:34<36:56,  2.28s/it] 86%|████████▌ | 5808/6779 [3:35:36<36:12,  2.24s/it]                                                     {'loss': 1.7818, 'learning_rate': 2.0582997792678248e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5808/6779 [3:35:36<36:12,  2.24s/it] 86%|████████▌ | 5809/6779 [3:35:38<36:14,  2.24s/it]                                                     {'loss': 1.659, 'learning_rate': 2.054145040688613e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5809/6779 [3:35:38<36:14,  2.24s/it] 86%|████████▌ | 5810/6779 [3:35:40<36:16,  2.25s/it]                                                     {'loss': 1.5461, 'learning_rate': 2.049994272571043e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5810/6779 [3:35:40<36:16,  2.25s/it] 86%|████████▌ | 5811/6779 [3:35:43<36:49,  2.28s/it]                                                     {'loss': 1.735, 'learning_rate': 2.0458474758334445e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5811/6779 [3:35:43<36:49,  2.28s/it] 86%|████████▌ | 5812/6779 [3:35:45<36:48,  2.28s/it]                                                     {'loss': 1.755, 'learning_rate': 2.0417046513932925e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5812/6779 [3:35:45<36:48,  2.28s/it] 86%|████████▌ | 5813/6779 [3:35:48<39:23,  2.45s/it]                                                     {'loss': 1.7451, 'learning_rate': 2.0375658001671715e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5813/6779 [3:35:48<39:23,  2.45s/it] 86%|████████▌ | 5814/6779 [3:35:50<38:42,  2.41s/it]                                                     {'loss': 1.6494, 'learning_rate': 2.033430923070778e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5814/6779 [3:35:50<38:42,  2.41s/it] 86%|████████▌ | 5815/6779 [3:35:52<37:09,  2.31s/it]                                                     {'loss': 1.6259, 'learning_rate': 2.0293000210189583e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5815/6779 [3:35:52<37:09,  2.31s/it] 86%|████████▌ | 5816/6779 [3:35:54<36:01,  2.24s/it]                                                     {'loss': 1.5525, 'learning_rate': 2.0251730949256475e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5816/6779 [3:35:54<36:01,  2.24s/it] 86%|████████▌ | 5817/6779 [3:35:56<35:29,  2.21s/it]                                                     {'loss': 1.8206, 'learning_rate': 2.021050145703922e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5817/6779 [3:35:56<35:29,  2.21s/it] 86%|████████▌ | 5818/6779 [3:35:58<35:04,  2.19s/it]                                                     {'loss': 1.6, 'learning_rate': 2.0169311742659657e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5818/6779 [3:35:58<35:04,  2.19s/it] 86%|████████▌ | 5819/6779 [3:36:01<34:22,  2.15s/it]                                                     {'loss': 1.6452, 'learning_rate': 2.0128161815230917e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5819/6779 [3:36:01<34:22,  2.15s/it] 86%|████████▌ | 5820/6779 [3:36:03<34:53,  2.18s/it]                                                     {'loss': 1.6896, 'learning_rate': 2.008705168385723e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5820/6779 [3:36:03<34:53,  2.18s/it] 86%|████████▌ | 5821/6779 [3:36:05<35:11,  2.20s/it]                                                     {'loss': 1.8396, 'learning_rate': 2.0045981357634114e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5821/6779 [3:36:05<35:11,  2.20s/it] 86%|████████▌ | 5822/6779 [3:36:07<35:29,  2.23s/it]                                                     {'loss': 1.8569, 'learning_rate': 2.0004950845648284e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5822/6779 [3:36:07<35:29,  2.23s/it] 86%|████████▌ | 5823/6779 [3:36:09<34:24,  2.16s/it]                                                     {'loss': 1.6062, 'learning_rate': 1.9963960156977524e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5823/6779 [3:36:09<34:24,  2.16s/it] 86%|████████▌ | 5824/6779 [3:36:11<34:08,  2.14s/it]                                                     {'loss': 1.4569, 'learning_rate': 1.9923009300690977e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5824/6779 [3:36:11<34:08,  2.14s/it] 86%|████████▌ | 5825/6779 [3:36:14<36:27,  2.29s/it]                                                     {'loss': 1.4315, 'learning_rate': 1.9882098285848793e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5825/6779 [3:36:14<36:27,  2.29s/it] 86%|████████▌ | 5826/6779 [3:36:16<36:00,  2.27s/it]                                                     {'loss': 1.6889, 'learning_rate': 1.984122712150249e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5826/6779 [3:36:16<36:00,  2.27s/it] 86%|████████▌ | 5827/6779 [3:36:18<35:47,  2.26s/it]                                                     {'loss': 1.6488, 'learning_rate': 1.9800395816694596e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5827/6779 [3:36:18<35:47,  2.26s/it] 86%|████████▌ | 5828/6779 [3:36:20<34:16,  2.16s/it]                                                     {'loss': 1.6524, 'learning_rate': 1.975960438045894e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5828/6779 [3:36:20<34:16,  2.16s/it] 86%|████████▌ | 5829/6779 [3:36:23<35:25,  2.24s/it]                                                     {'loss': 1.5568, 'learning_rate': 1.971885282182053e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5829/6779 [3:36:23<35:25,  2.24s/it] 86%|████████▌ | 5830/6779 [3:36:25<34:41,  2.19s/it]                                                     {'loss': 1.7322, 'learning_rate': 1.967814114979545e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5830/6779 [3:36:25<34:41,  2.19s/it] 86%|████████▌ | 5831/6779 [3:36:27<34:20,  2.17s/it]                                                     {'loss': 1.5343, 'learning_rate': 1.9637469373391105e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5831/6779 [3:36:27<34:20,  2.17s/it] 86%|████████▌ | 5832/6779 [3:36:29<34:04,  2.16s/it]                                                     {'loss': 1.6035, 'learning_rate': 1.959683750160588e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5832/6779 [3:36:29<34:04,  2.16s/it] 86%|████████▌ | 5833/6779 [3:36:31<32:44,  2.08s/it]                                                     {'loss': 1.4081, 'learning_rate': 1.9556245543429563e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5833/6779 [3:36:31<32:44,  2.08s/it] 86%|████████▌ | 5834/6779 [3:36:33<33:47,  2.15s/it]                                                     {'loss': 1.6995, 'learning_rate': 1.9515693507842904e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5834/6779 [3:36:33<33:47,  2.15s/it] 86%|████████▌ | 5835/6779 [3:36:36<35:40,  2.27s/it]                                                     {'loss': 1.5808, 'learning_rate': 1.947518140381792e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5835/6779 [3:36:36<35:40,  2.27s/it] 86%|████████▌ | 5836/6779 [3:36:38<35:44,  2.27s/it]                                                     {'loss': 1.6271, 'learning_rate': 1.943470924031785e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5836/6779 [3:36:38<35:44,  2.27s/it] 86%|████████▌ | 5837/6779 [3:36:41<36:00,  2.29s/it]                                                     {'loss': 1.7009, 'learning_rate': 1.9394277026296946e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5837/6779 [3:36:41<36:00,  2.29s/it] 86%|████████▌ | 5838/6779 [3:36:43<34:32,  2.20s/it]                                                     {'loss': 1.4894, 'learning_rate': 1.935388477070077e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5838/6779 [3:36:43<34:32,  2.20s/it] 86%|████████▌ | 5839/6779 [3:36:45<35:18,  2.25s/it]                                                     {'loss': 1.7721, 'learning_rate': 1.9313532482465903e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5839/6779 [3:36:45<35:18,  2.25s/it] 86%|████████▌ | 5840/6779 [3:36:47<35:29,  2.27s/it]                                                     {'loss': 1.6133, 'learning_rate': 1.9273220170520223e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5840/6779 [3:36:47<35:29,  2.27s/it] 86%|████████▌ | 5841/6779 [3:36:49<34:47,  2.23s/it]                                                     {'loss': 1.6054, 'learning_rate': 1.9232947843782643e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5841/6779 [3:36:49<34:47,  2.23s/it] 86%|████████▌ | 5842/6779 [3:36:51<34:24,  2.20s/it]                                                     {'loss': 1.6199, 'learning_rate': 1.9192715511163328e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5842/6779 [3:36:52<34:24,  2.20s/it] 86%|████████▌ | 5843/6779 [3:36:54<34:13,  2.19s/it]                                                     {'loss': 1.78, 'learning_rate': 1.915252318156353e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5843/6779 [3:36:54<34:13,  2.19s/it] 86%|████████▌ | 5844/6779 [3:36:56<34:56,  2.24s/it]                                                     {'loss': 1.7464, 'learning_rate': 1.9112370863875674e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5844/6779 [3:36:56<34:56,  2.24s/it] 86%|████████▌ | 5845/6779 [3:36:58<33:50,  2.17s/it]                                                     {'loss': 1.553, 'learning_rate': 1.9072258566983335e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5845/6779 [3:36:58<33:50,  2.17s/it] 86%|████████▌ | 5846/6779 [3:37:01<38:36,  2.48s/it]                                                     {'loss': 1.5476, 'learning_rate': 1.90321862997612e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5846/6779 [3:37:01<38:36,  2.48s/it] 86%|████████▋ | 5847/6779 [3:37:03<37:13,  2.40s/it]                                                     {'loss': 1.6507, 'learning_rate': 1.8992154071075173e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5847/6779 [3:37:03<37:13,  2.40s/it] 86%|████████▋ | 5848/6779 [3:37:06<36:15,  2.34s/it]                                                     {'loss': 1.5934, 'learning_rate': 1.8952161889782193e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5848/6779 [3:37:06<36:15,  2.34s/it] 86%|████████▋ | 5849/6779 [3:37:08<34:33,  2.23s/it]                                                     {'loss': 1.5419, 'learning_rate': 1.8912209764730428e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5849/6779 [3:37:08<34:33,  2.23s/it] 86%|████████▋ | 5850/6779 [3:37:10<34:58,  2.26s/it]                                                     {'loss': 1.6334, 'learning_rate': 1.8872297704759202e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5850/6779 [3:37:10<34:58,  2.26s/it] 86%|████████▋ | 5851/6779 [3:37:12<35:14,  2.28s/it]                                                     {'loss': 1.7074, 'learning_rate': 1.8832425718698854e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5851/6779 [3:37:12<35:14,  2.28s/it] 86%|████████▋ | 5852/6779 [3:37:14<34:58,  2.26s/it]                                                     {'loss': 1.551, 'learning_rate': 1.8792593815370972e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5852/6779 [3:37:15<34:58,  2.26s/it] 86%|████████▋ | 5853/6779 [3:37:17<33:51,  2.19s/it]                                                     {'loss': 1.5685, 'learning_rate': 1.875280200358822e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5853/6779 [3:37:17<33:51,  2.19s/it] 86%|████████▋ | 5854/6779 [3:37:19<33:44,  2.19s/it]                                                     {'loss': 1.5171, 'learning_rate': 1.8713050292154422e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5854/6779 [3:37:19<33:44,  2.19s/it] 86%|████████▋ | 5855/6779 [3:37:21<33:46,  2.19s/it]                                                     {'loss': 1.6281, 'learning_rate': 1.8673338689864473e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5855/6779 [3:37:21<33:46,  2.19s/it] 86%|████████▋ | 5856/6779 [3:37:23<33:38,  2.19s/it]                                                     {'loss': 1.6728, 'learning_rate': 1.8633667205504478e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5856/6779 [3:37:23<33:38,  2.19s/it] 86%|████████▋ | 5857/6779 [3:37:25<34:24,  2.24s/it]                                                     {'loss': 1.6467, 'learning_rate': 1.8594035847851575e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5857/6779 [3:37:25<34:24,  2.24s/it] 86%|████████▋ | 5858/6779 [3:37:28<35:27,  2.31s/it]                                                     {'loss': 1.7046, 'learning_rate': 1.855444462567417e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5858/6779 [3:37:28<35:27,  2.31s/it] 86%|████████▋ | 5859/6779 [3:37:30<35:03,  2.29s/it]                                                     {'loss': 1.771, 'learning_rate': 1.8514893547731614e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5859/6779 [3:37:30<35:03,  2.29s/it] 86%|████████▋ | 5860/6779 [3:37:32<34:25,  2.25s/it]                                                     {'loss': 1.7738, 'learning_rate': 1.847538262277444e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5860/6779 [3:37:32<34:25,  2.25s/it] 86%|████████▋ | 5861/6779 [3:37:35<34:19,  2.24s/it]                                                     {'loss': 1.7285, 'learning_rate': 1.847538262277444e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5861/6779 [3:37:35<34:19,  2.24s/it] 86%|████████▋ | 5862/6779 [3:37:37<33:43,  2.21s/it]                                                     {'loss': 1.7524, 'learning_rate': 1.8435911859544387e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5862/6779 [3:37:37<33:43,  2.21s/it] 86%|████████▋ | 5863/6779 [3:37:39<33:30,  2.20s/it]                                                     {'loss': 1.6288, 'learning_rate': 1.839648126677411e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5863/6779 [3:37:39<33:30,  2.20s/it] 87%|████████▋ | 5864/6779 [3:37:41<35:26,  2.32s/it]                                                     {'loss': 1.5606, 'learning_rate': 1.8357090853187597e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5864/6779 [3:37:41<35:26,  2.32s/it] 87%|████████▋ | 5865/6779 [3:37:43<33:56,  2.23s/it]                                                     {'loss': 1.6452, 'learning_rate': 1.83177406274998e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5865/6779 [3:37:43<33:56,  2.23s/it] 87%|████████▋ | 5866/6779 [3:37:46<34:25,  2.26s/it]                                                     {'loss': 1.6655, 'learning_rate': 1.8278430598416895e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5866/6779 [3:37:46<34:25,  2.26s/it] 87%|████████▋ | 5867/6779 [3:37:48<34:47,  2.29s/it]                                                     {'loss': 1.5077, 'learning_rate': 1.8239160774636032e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5867/6779 [3:37:48<34:47,  2.29s/it] 87%|████████▋ | 5868/6779 [3:37:50<34:12,  2.25s/it]                                                     {'loss': 1.4846, 'learning_rate': 1.8199931164845574e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5868/6779 [3:37:50<34:12,  2.25s/it] 87%|████████▋ | 5869/6779 [3:37:53<33:58,  2.24s/it]                                                     {'loss': 1.6779, 'learning_rate': 1.816074177772491e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5869/6779 [3:37:53<33:58,  2.24s/it] 87%|████████▋ | 5870/6779 [3:37:55<33:31,  2.21s/it]                                                     {'loss': 1.6731, 'learning_rate': 1.812159262194455e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5870/6779 [3:37:55<33:31,  2.21s/it] 87%|████████▋ | 5871/6779 [3:37:57<33:21,  2.20s/it]                                                     {'loss': 1.6891, 'learning_rate': 1.8082483706166142e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5871/6779 [3:37:57<33:21,  2.20s/it] 87%|████████▋ | 5872/6779 [3:38:00<35:57,  2.38s/it]                                                     {'loss': 1.4606, 'learning_rate': 1.804341503904239e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5872/6779 [3:38:00<35:57,  2.38s/it] 87%|████████▋ | 5873/6779 [3:38:02<35:07,  2.33s/it]                                                     {'loss': 1.6512, 'learning_rate': 1.8004386629217173e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5873/6779 [3:38:02<35:07,  2.33s/it] 87%|████████▋ | 5874/6779 [3:38:04<35:25,  2.35s/it]                                                     {'loss': 1.6592, 'learning_rate': 1.79653984853253e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5874/6779 [3:38:04<35:25,  2.35s/it] 87%|████████▋ | 5875/6779 [3:38:06<33:44,  2.24s/it]                                                     {'loss': 1.5891, 'learning_rate': 1.792645061599285e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5875/6779 [3:38:06<33:44,  2.24s/it] 87%|████████▋ | 5876/6779 [3:38:08<32:54,  2.19s/it]                                                     {'loss': 1.5536, 'learning_rate': 1.7887543029836883e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5876/6779 [3:38:08<32:54,  2.19s/it] 87%|████████▋ | 5877/6779 [3:38:10<32:39,  2.17s/it]                                                     {'loss': 1.5658, 'learning_rate': 1.7848675735465558e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5877/6779 [3:38:10<32:39,  2.17s/it] 87%|████████▋ | 5878/6779 [3:38:13<32:22,  2.16s/it]                                                     {'loss': 1.4479, 'learning_rate': 1.780984874147813e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5878/6779 [3:38:13<32:22,  2.16s/it] 87%|████████▋ | 5879/6779 [3:38:15<32:14,  2.15s/it]                                                     {'loss': 1.6358, 'learning_rate': 1.777106205646497e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5879/6779 [3:38:15<32:14,  2.15s/it] 87%|████████▋ | 5880/6779 [3:38:17<31:41,  2.11s/it]                                                     {'loss': 1.6626, 'learning_rate': 1.7732315689007527e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5880/6779 [3:38:17<31:41,  2.11s/it] 87%|████████▋ | 5881/6779 [3:38:19<32:35,  2.18s/it]                                                     {'loss': 1.669, 'learning_rate': 1.7693609647678255e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5881/6779 [3:38:19<32:35,  2.18s/it] 87%|████████▋ | 5882/6779 [3:38:21<31:11,  2.09s/it]                                                     {'loss': 1.5751, 'learning_rate': 1.765494394104079e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5882/6779 [3:38:21<31:11,  2.09s/it] 87%|████████▋ | 5883/6779 [3:38:23<31:48,  2.13s/it]                                                     {'loss': 1.5889, 'learning_rate': 1.7616318577649736e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5883/6779 [3:38:23<31:48,  2.13s/it] 87%|████████▋ | 5884/6779 [3:38:25<31:51,  2.14s/it]                                                     {'loss': 1.7158, 'learning_rate': 1.7577733566050902e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5884/6779 [3:38:25<31:51,  2.14s/it] 87%|████████▋ | 5885/6779 [3:38:27<31:55,  2.14s/it]                                                     {'loss': 1.7355, 'learning_rate': 1.7539188914781035e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5885/6779 [3:38:27<31:55,  2.14s/it] 87%|████████▋ | 5886/6779 [3:38:29<31:14,  2.10s/it]                                                     {'loss': 1.7025, 'learning_rate': 1.750068463236798e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5886/6779 [3:38:29<31:14,  2.10s/it] 87%|████████▋ | 5887/6779 [3:38:32<31:37,  2.13s/it]                                                     {'loss': 1.6343, 'learning_rate': 1.746222072733079e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5887/6779 [3:38:32<31:37,  2.13s/it] 87%|████████▋ | 5888/6779 [3:38:34<34:24,  2.32s/it]                                                     {'loss': 1.6324, 'learning_rate': 1.7423797208179393e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5888/6779 [3:38:34<34:24,  2.32s/it] 87%|████████▋ | 5889/6779 [3:38:37<34:37,  2.33s/it]                                                     {'loss': 1.8022, 'learning_rate': 1.738541408341494e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5889/6779 [3:38:37<34:37,  2.33s/it] 87%|████████▋ | 5890/6779 [3:38:39<34:23,  2.32s/it]                                                     {'loss': 1.8128, 'learning_rate': 1.7347071361529487e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5890/6779 [3:38:39<34:23,  2.32s/it] 87%|████████▋ | 5891/6779 [3:38:41<33:14,  2.25s/it]                                                     {'loss': 1.3406, 'learning_rate': 1.730876905100629e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5891/6779 [3:38:41<33:14,  2.25s/it] 87%|████████▋ | 5892/6779 [3:38:43<32:19,  2.19s/it]                                                     {'loss': 1.5619, 'learning_rate': 1.7270507160319592e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5892/6779 [3:38:43<32:19,  2.19s/it] 87%|████████▋ | 5893/6779 [3:38:46<32:48,  2.22s/it]                                                     {'loss': 1.5683, 'learning_rate': 1.723228569793469e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5893/6779 [3:38:46<32:48,  2.22s/it] 87%|████████▋ | 5894/6779 [3:38:47<31:41,  2.15s/it]                                                     {'loss': 1.5838, 'learning_rate': 1.719410467230804e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5894/6779 [3:38:47<31:41,  2.15s/it] 87%|████████▋ | 5895/6779 [3:38:50<31:31,  2.14s/it]                                                     {'loss': 1.6769, 'learning_rate': 1.7155964091886955e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5895/6779 [3:38:50<31:31,  2.14s/it] 87%|████████▋ | 5896/6779 [3:38:52<32:08,  2.18s/it]                                                     {'loss': 1.6845, 'learning_rate': 1.7117863965110014e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5896/6779 [3:38:52<32:08,  2.18s/it] 87%|████████▋ | 5897/6779 [3:38:54<33:41,  2.29s/it]                                                     {'loss': 1.7519, 'learning_rate': 1.7079804300406675e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5897/6779 [3:38:54<33:41,  2.29s/it] 87%|████████▋ | 5898/6779 [3:38:57<33:38,  2.29s/it]                                                     {'loss': 1.5986, 'learning_rate': 1.704178510619756e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5898/6779 [3:38:57<33:38,  2.29s/it] 87%|████████▋ | 5899/6779 [3:38:59<33:33,  2.29s/it]                                                     {'loss': 1.7004, 'learning_rate': 1.700380639089425e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5899/6779 [3:38:59<33:33,  2.29s/it] 87%|████████▋ | 5900/6779 [3:39:01<32:48,  2.24s/it]                                                     {'loss': 1.7119, 'learning_rate': 1.6965868162899424e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5900/6779 [3:39:01<32:48,  2.24s/it] 87%|████████▋ | 5901/6779 [3:39:03<31:55,  2.18s/it]                                                     {'loss': 1.5193, 'learning_rate': 1.6927970430606833e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5901/6779 [3:39:03<31:55,  2.18s/it] 87%|████████▋ | 5902/6779 [3:39:05<31:10,  2.13s/it]                                                     {'loss': 1.572, 'learning_rate': 1.689011320240117e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5902/6779 [3:39:05<31:10,  2.13s/it] 87%|████████▋ | 5903/6779 [3:39:07<31:21,  2.15s/it]                                                     {'loss': 1.6877, 'learning_rate': 1.685229648665827e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5903/6779 [3:39:07<31:21,  2.15s/it] 87%|████████▋ | 5904/6779 [3:39:10<32:04,  2.20s/it]                                                     {'loss': 1.7453, 'learning_rate': 1.6814520291744884e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5904/6779 [3:39:10<32:04,  2.20s/it] 87%|████████▋ | 5905/6779 [3:39:12<31:41,  2.18s/it]                                                     {'loss': 1.6553, 'learning_rate': 1.677678462601897e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5905/6779 [3:39:12<31:41,  2.18s/it] 87%|████████▋ | 5906/6779 [3:39:14<32:18,  2.22s/it]                                                     {'loss': 1.6058, 'learning_rate': 1.673908949782934e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5906/6779 [3:39:14<32:18,  2.22s/it] 87%|████████▋ | 5907/6779 [3:39:16<31:55,  2.20s/it]                                                     {'loss': 1.5713, 'learning_rate': 1.6701434915515946e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5907/6779 [3:39:16<31:55,  2.20s/it] 87%|████████▋ | 5908/6779 [3:39:19<33:11,  2.29s/it]                                                     {'loss': 1.6562, 'learning_rate': 1.6663820887409764e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5908/6779 [3:39:19<33:11,  2.29s/it] 87%|████████▋ | 5909/6779 [3:39:21<33:02,  2.28s/it]                                                     {'loss': 1.6735, 'learning_rate': 1.662624742183274e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5909/6779 [3:39:21<33:02,  2.28s/it] 87%|████████▋ | 5910/6779 [3:39:23<32:29,  2.24s/it]                                                     {'loss': 1.6286, 'learning_rate': 1.6588714527097914e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5910/6779 [3:39:23<32:29,  2.24s/it] 87%|████████▋ | 5911/6779 [3:39:25<32:10,  2.22s/it]                                                     {'loss': 1.6628, 'learning_rate': 1.6551222211509265e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5911/6779 [3:39:25<32:10,  2.22s/it] 87%|████████▋ | 5912/6779 [3:39:28<31:56,  2.21s/it]                                                     {'loss': 1.6123, 'learning_rate': 1.6513770483361912e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5912/6779 [3:39:28<31:56,  2.21s/it] 87%|████████▋ | 5913/6779 [3:39:30<32:39,  2.26s/it]                                                     {'loss': 1.7424, 'learning_rate': 1.6476359350941872e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5913/6779 [3:39:30<32:39,  2.26s/it] 87%|████████▋ | 5914/6779 [3:39:32<31:22,  2.18s/it]                                                     {'loss': 1.612, 'learning_rate': 1.6438988822526234e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5914/6779 [3:39:32<31:22,  2.18s/it] 87%|████████▋ | 5915/6779 [3:39:34<31:18,  2.17s/it]                                                     {'loss': 1.81, 'learning_rate': 1.6401658906383164e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5915/6779 [3:39:34<31:18,  2.17s/it] 87%|████████▋ | 5916/6779 [3:39:36<32:06,  2.23s/it]                                                     {'loss': 1.5473, 'learning_rate': 1.63643696107717e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5916/6779 [3:39:36<32:06,  2.23s/it] 87%|████████▋ | 5917/6779 [3:39:39<33:17,  2.32s/it]                                                     {'loss': 1.6223, 'learning_rate': 1.6327120943942088e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5917/6779 [3:39:39<33:17,  2.32s/it] 87%|████████▋ | 5918/6779 [3:39:41<32:58,  2.30s/it]                                                     {'loss': 1.5457, 'learning_rate': 1.6289912914135352e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5918/6779 [3:39:41<32:58,  2.30s/it] 87%|████████▋ | 5919/6779 [3:39:43<32:04,  2.24s/it]                                                     {'loss': 1.6644, 'learning_rate': 1.6252745529583736e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5919/6779 [3:39:43<32:04,  2.24s/it] 87%|████████▋ | 5920/6779 [3:39:45<30:53,  2.16s/it]                                                     {'loss': 1.59, 'learning_rate': 1.6215618798510323e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5920/6779 [3:39:45<30:53,  2.16s/it] 87%|████████▋ | 5921/6779 [3:39:47<30:59,  2.17s/it]                                                     {'loss': 1.5367, 'learning_rate': 1.6178532729129348e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5921/6779 [3:39:47<30:59,  2.17s/it] 87%|████████▋ | 5922/6779 [3:39:50<30:53,  2.16s/it]                                                     {'loss': 1.5967, 'learning_rate': 1.6141487329645977e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5922/6779 [3:39:50<30:53,  2.16s/it] 87%|████████▋ | 5923/6779 [3:39:52<30:58,  2.17s/it]                                                     {'loss': 1.7082, 'learning_rate': 1.6104482608256344e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5923/6779 [3:39:52<30:58,  2.17s/it] 87%|████████▋ | 5924/6779 [3:39:54<31:31,  2.21s/it]                                                     {'loss': 1.6834, 'learning_rate': 1.6067518573147677e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5924/6779 [3:39:54<31:31,  2.21s/it] 87%|████████▋ | 5925/6779 [3:39:57<32:25,  2.28s/it]                                                     {'loss': 1.693, 'learning_rate': 1.603059523249808e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5925/6779 [3:39:57<32:25,  2.28s/it] 87%|████████▋ | 5926/6779 [3:39:59<32:08,  2.26s/it]                                                     {'loss': 1.6223, 'learning_rate': 1.5993712594476794e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5926/6779 [3:39:59<32:08,  2.26s/it] 87%|████████▋ | 5927/6779 [3:40:01<32:22,  2.28s/it]                                                     {'loss': 1.5481, 'learning_rate': 1.5956870667243917e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5927/6779 [3:40:01<32:22,  2.28s/it] 87%|████████▋ | 5928/6779 [3:40:03<32:26,  2.29s/it]                                                     {'loss': 1.5254, 'learning_rate': 1.592006945895064e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5928/6779 [3:40:03<32:26,  2.29s/it] 87%|████████▋ | 5929/6779 [3:40:05<31:27,  2.22s/it]                                                     {'loss': 1.7107, 'learning_rate': 1.5883308977739065e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5929/6779 [3:40:05<31:27,  2.22s/it] 87%|████████▋ | 5930/6779 [3:40:08<31:55,  2.26s/it]                                                     {'loss': 1.8254, 'learning_rate': 1.5846589231742426e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5930/6779 [3:40:08<31:55,  2.26s/it] 87%|████████▋ | 5931/6779 [3:40:10<31:13,  2.21s/it]                                                     {'loss': 1.6342, 'learning_rate': 1.580991022908478e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5931/6779 [3:40:10<31:13,  2.21s/it] 88%|████████▊ | 5932/6779 [3:40:12<30:36,  2.17s/it]                                                     {'loss': 1.6636, 'learning_rate': 1.577327197788121e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5932/6779 [3:40:12<30:36,  2.17s/it] 88%|████████▊ | 5933/6779 [3:40:14<31:50,  2.26s/it]                                                     {'loss': 1.6827, 'learning_rate': 1.5736674486237878e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5933/6779 [3:40:14<31:50,  2.26s/it] 88%|████████▊ | 5934/6779 [3:40:17<32:50,  2.33s/it]                                                     {'loss': 1.7139, 'learning_rate': 1.57001177622518e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5934/6779 [3:40:17<32:50,  2.33s/it] 88%|████████▊ | 5935/6779 [3:40:19<32:00,  2.28s/it]                                                     {'loss': 1.5946, 'learning_rate': 1.5663601814011032e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5935/6779 [3:40:19<32:00,  2.28s/it] 88%|████████▊ | 5936/6779 [3:40:21<31:10,  2.22s/it]                                                     {'loss': 1.6071, 'learning_rate': 1.562712664959465e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5936/6779 [3:40:21<31:10,  2.22s/it] 88%|████████▊ | 5937/6779 [3:40:23<30:55,  2.20s/it]                                                     {'loss': 1.621, 'learning_rate': 1.559069227707266e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5937/6779 [3:40:23<30:55,  2.20s/it] 88%|████████▊ | 5938/6779 [3:40:25<30:27,  2.17s/it]                                                     {'loss': 1.7558, 'learning_rate': 1.5554298704506e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5938/6779 [3:40:25<30:27,  2.17s/it] 88%|████████▊ | 5939/6779 [3:40:28<30:17,  2.16s/it]                                                     {'loss': 1.7845, 'learning_rate': 1.5517945939946687e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5939/6779 [3:40:28<30:17,  2.16s/it] 88%|████████▊ | 5940/6779 [3:40:30<31:05,  2.22s/it]                                                     {'loss': 1.6258, 'learning_rate': 1.548163399143765e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5940/6779 [3:40:30<31:05,  2.22s/it] 88%|████████▊ | 5941/6779 [3:40:32<31:54,  2.28s/it]                                                     {'loss': 1.7208, 'learning_rate': 1.5445362867012725e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5941/6779 [3:40:32<31:54,  2.28s/it] 88%|████████▊ | 5942/6779 [3:40:35<31:26,  2.25s/it]                                                     {'loss': 1.7262, 'learning_rate': 1.5409132574696807e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5942/6779 [3:40:35<31:26,  2.25s/it] 88%|████████▊ | 5943/6779 [3:40:37<31:12,  2.24s/it]                                                     {'loss': 1.6929, 'learning_rate': 1.5372943122505746e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5943/6779 [3:40:37<31:12,  2.24s/it] 88%|████████▊ | 5944/6779 [3:40:39<31:15,  2.25s/it]                                                     {'loss': 1.5131, 'learning_rate': 1.5336794518446362e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5944/6779 [3:40:39<31:15,  2.25s/it] 88%|████████▊ | 5945/6779 [3:40:42<32:20,  2.33s/it]                                                     {'loss': 1.614, 'learning_rate': 1.5300686770516347e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5945/6779 [3:40:42<32:20,  2.33s/it] 88%|████████▊ | 5946/6779 [3:40:44<32:12,  2.32s/it]                                                     {'loss': 1.684, 'learning_rate': 1.5264619886704513e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5946/6779 [3:40:44<32:12,  2.32s/it] 88%|████████▊ | 5947/6779 [3:40:46<32:21,  2.33s/it]                                                     {'loss': 1.7481, 'learning_rate': 1.5228593874990494e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5947/6779 [3:40:46<32:21,  2.33s/it] 88%|████████▊ | 5948/6779 [3:40:49<32:47,  2.37s/it]                                                     {'loss': 1.6654, 'learning_rate': 1.5192608743344872e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5948/6779 [3:40:49<32:47,  2.37s/it] 88%|████████▊ | 5949/6779 [3:40:51<33:24,  2.42s/it]                                                     {'loss': 1.7892, 'learning_rate': 1.51566644997293e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5949/6779 [3:40:51<33:24,  2.42s/it] 88%|████████▊ | 5950/6779 [3:40:53<31:43,  2.30s/it]                                                     {'loss': 1.5785, 'learning_rate': 1.5120761152096308e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5950/6779 [3:40:53<31:43,  2.30s/it] 88%|████████▊ | 5951/6779 [3:40:55<31:16,  2.27s/it]                                                     {'loss': 1.6896, 'learning_rate': 1.5084898708389427e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5951/6779 [3:40:55<31:16,  2.27s/it] 88%|████████▊ | 5952/6779 [3:40:58<32:22,  2.35s/it]                                                     {'loss': 1.4786, 'learning_rate': 1.5049077176543069e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5952/6779 [3:40:58<32:22,  2.35s/it] 88%|████████▊ | 5953/6779 [3:41:00<31:26,  2.28s/it]                                                     {'loss': 1.7821, 'learning_rate': 1.501329656448265e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5953/6779 [3:41:00<31:26,  2.28s/it] 88%|████████▊ | 5954/6779 [3:41:02<31:22,  2.28s/it]                                                     {'loss': 1.7399, 'learning_rate': 1.4977556880124476e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5954/6779 [3:41:02<31:22,  2.28s/it] 88%|████████▊ | 5955/6779 [3:41:05<30:58,  2.25s/it]                                                     {'loss': 1.6437, 'learning_rate': 1.4941858131375918e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5955/6779 [3:41:05<30:58,  2.25s/it] 88%|████████▊ | 5956/6779 [3:41:07<30:44,  2.24s/it]                                                     {'loss': 1.7704, 'learning_rate': 1.49062003261351e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5956/6779 [3:41:07<30:44,  2.24s/it] 88%|███████���▊ | 5957/6779 [3:41:09<31:33,  2.30s/it]                                                     {'loss': 1.685, 'learning_rate': 1.4870583472291244e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5957/6779 [3:41:09<31:33,  2.30s/it] 88%|████████▊ | 5958/6779 [3:41:11<31:08,  2.28s/it]                                                     {'loss': 1.522, 'learning_rate': 1.4835007577724492e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5958/6779 [3:41:11<31:08,  2.28s/it] 88%|████████▊ | 5959/6779 [3:41:14<31:50,  2.33s/it]                                                     {'loss': 1.6214, 'learning_rate': 1.4799472650305857e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5959/6779 [3:41:14<31:50,  2.33s/it] 88%|████████▊ | 5960/6779 [3:41:16<31:12,  2.29s/it]                                                     {'loss': 1.5865, 'learning_rate': 1.476397869789734e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5960/6779 [3:41:16<31:12,  2.29s/it] 88%|████████▊ | 5961/6779 [3:41:18<31:38,  2.32s/it]                                                     {'loss': 1.7198, 'learning_rate': 1.4728525728351839e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5961/6779 [3:41:18<31:38,  2.32s/it] 88%|████████▊ | 5962/6779 [3:41:21<30:50,  2.27s/it]                                                     {'loss': 1.5439, 'learning_rate': 1.4693113749513253e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5962/6779 [3:41:21<30:50,  2.27s/it] 88%|████████▊ | 5963/6779 [3:41:23<30:25,  2.24s/it]                                                     {'loss': 1.7845, 'learning_rate': 1.465774276921632e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5963/6779 [3:41:23<30:25,  2.24s/it] 88%|████████▊ | 5964/6779 [3:41:25<30:10,  2.22s/it]                                                     {'loss': 1.6747, 'learning_rate': 1.4622412795286754e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5964/6779 [3:41:25<30:10,  2.22s/it] 88%|████████▊ | 5965/6779 [3:41:27<30:03,  2.22s/it]                                                     {'loss': 1.6498, 'learning_rate': 1.458712383554126e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5965/6779 [3:41:27<30:03,  2.22s/it] 88%|████████▊ | 5966/6779 [3:41:29<29:33,  2.18s/it]                                                     {'loss': 1.6969, 'learning_rate': 1.4551875897787326e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5966/6779 [3:41:29<29:33,  2.18s/it] 88%|████████▊ | 5967/6779 [3:41:31<29:23,  2.17s/it]                                                     {'loss': 1.6756, 'learning_rate': 1.4516668989823512e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5967/6779 [3:41:31<29:23,  2.17s/it] 88%|████████▊ | 5968/6779 [3:41:34<31:09,  2.31s/it]                                                     {'loss': 1.6367, 'learning_rate': 1.4481503119439144e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5968/6779 [3:41:34<31:09,  2.31s/it] 88%|████████▊ | 5969/6779 [3:41:36<31:37,  2.34s/it]                                                     {'loss': 1.6459, 'learning_rate': 1.4446378294414642e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5969/6779 [3:41:36<31:37,  2.34s/it] 88%|████████▊ | 5970/6779 [3:41:39<31:46,  2.36s/it]                                                     {'loss': 1.5535, 'learning_rate': 1.4411294522521212e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5970/6779 [3:41:39<31:46,  2.36s/it] 88%|████████▊ | 5971/6779 [3:41:41<31:05,  2.31s/it]                                                     {'loss': 1.7848, 'learning_rate': 1.4376251811521024e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5971/6779 [3:41:41<31:05,  2.31s/it] 88%|████████▊ | 5972/6779 [3:41:43<30:29,  2.27s/it]                                                     {'loss': 1.6041, 'learning_rate': 1.4341250169167187e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5972/6779 [3:41:43<30:29,  2.27s/it] 88%|████████▊ | 5973/6779 [3:41:45<29:51,  2.22s/it]                                                     {'loss': 1.7646, 'learning_rate': 1.4306289603203682e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5973/6779 [3:41:45<29:51,  2.22s/it] 88%|████████▊ | 5974/6779 [3:41:47<29:25,  2.19s/it]                                                     {'loss': 1.6361, 'learning_rate': 1.4271370121365435e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5974/6779 [3:41:47<29:25,  2.19s/it] 88%|████████▊ | 5975/6779 [3:41:50<29:04,  2.17s/it]                                                     {'loss': 1.653, 'learning_rate': 1.4236491731378242e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5975/6779 [3:41:50<29:04,  2.17s/it] 88%|████████▊ | 5976/6779 [3:41:52<28:27,  2.13s/it]                                                     {'loss': 1.5797, 'learning_rate': 1.4201654440958867e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5976/6779 [3:41:52<28:27,  2.13s/it] 88%|████████▊ | 5977/6779 [3:41:54<28:40,  2.15s/it]                                                     {'loss': 1.6, 'learning_rate': 1.4166858257814896e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5977/6779 [3:41:54<28:40,  2.15s/it] 88%|████████▊ | 5978/6779 [3:41:56<28:42,  2.15s/it]                                                     {'loss': 1.6729, 'learning_rate': 1.4132103189644885e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5978/6779 [3:41:56<28:42,  2.15s/it] 88%|████████▊ | 5979/6779 [3:41:58<28:40,  2.15s/it]                                                     {'loss': 1.6283, 'learning_rate': 1.4097389244138348e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5979/6779 [3:41:58<28:40,  2.15s/it] 88%|████████▊ | 5980/6779 [3:42:00<28:23,  2.13s/it]                                                     {'loss': 1.6897, 'learning_rate': 1.4062716428975542e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5980/6779 [3:42:00<28:23,  2.13s/it] 88%|████████▊ | 5981/6779 [3:42:02<28:23,  2.14s/it]                                                     {'loss': 1.6414, 'learning_rate': 1.4028084751827775e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5981/6779 [3:42:02<28:23,  2.14s/it] 88%|████████▊ | 5982/6779 [3:42:04<28:07,  2.12s/it]                                                     {'loss': 1.682, 'learning_rate': 1.399349422035714e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5982/6779 [3:42:04<28:07,  2.12s/it] 88%|████████▊ | 5983/6779 [3:42:07<28:36,  2.16s/it]                                                     {'loss': 1.4992, 'learning_rate': 1.3958944842216758e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5983/6779 [3:42:07<28:36,  2.16s/it] 88%|████████▊ | 5984/6779 [3:42:09<28:33,  2.15s/it]                                                     {'loss': 1.8063, 'learning_rate': 1.3924436625050452e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5984/6779 [3:42:09<28:33,  2.15s/it] 88%|████████▊ | 5985/6779 [3:42:11<28:27,  2.15s/it]                                                     {'loss': 1.5491, 'learning_rate': 1.3889969576493134e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5985/6779 [3:42:11<28:27,  2.15s/it] 88%|████████▊ | 5986/6779 [3:42:13<28:44,  2.17s/it]                                                     {'loss': 1.7913, 'learning_rate': 1.3855543704170526e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5986/6779 [3:42:13<28:44,  2.17s/it] 88%|████████▊ | 5987/6779 [3:42:15<28:24,  2.15s/it]                                                     {'loss': 1.5953, 'learning_rate': 1.3821159015699182e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5987/6779 [3:42:15<28:24,  2.15s/it] 88%|████████▊ | 5988/6779 [3:42:17<28:33,  2.17s/it]                                                     {'loss': 1.6822, 'learning_rate': 1.3786815518686679e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5988/6779 [3:42:17<28:33,  2.17s/it] 88%|████████▊ | 5989/6779 [3:42:20<29:08,  2.21s/it]                                                     {'loss': 1.7129, 'learning_rate': 1.3752513220731322e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5989/6779 [3:42:20<29:08,  2.21s/it] 88%|████████▊ | 5990/6779 [3:42:22<29:07,  2.22s/it]                                                     {'loss': 1.5187, 'learning_rate': 1.3718252129422481e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5990/6779 [3:42:22<29:07,  2.22s/it] 88%|████████▊ | 5991/6779 [3:42:24<28:40,  2.18s/it]                                                     {'loss': 1.7299, 'learning_rate': 1.3684032252340184e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5991/6779 [3:42:24<28:40,  2.18s/it] 88%|████████▊ | 5992/6779 [3:42:26<28:33,  2.18s/it]                                                     {'loss': 1.5428, 'learning_rate': 1.3649853597055573e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5992/6779 [3:42:26<28:33,  2.18s/it] 88%|████████▊ | 5993/6779 [3:42:29<28:46,  2.20s/it]                                                     {'loss': 1.6522, 'learning_rate': 1.3615716171130533e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5993/6779 [3:42:29<28:46,  2.20s/it] 88%|████████▊ | 5994/6779 [3:42:31<28:49,  2.20s/it]                                                     {'loss': 1.7511, 'learning_rate': 1.3581619982117822e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5994/6779 [3:42:31<28:49,  2.20s/it] 88%|████████▊ | 5995/6779 [3:42:33<30:32,  2.34s/it]                                                     {'loss': 1.7496, 'learning_rate': 1.354756503756116e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5995/6779 [3:42:33<30:32,  2.34s/it] 88%|████████▊ | 5996/6779 [3:42:36<29:34,  2.27s/it]                                                     {'loss': 1.6538, 'learning_rate': 1.3513551344995057e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5996/6779 [3:42:36<29:34,  2.27s/it] 88%|████████▊ | 5997/6779 [3:42:38<30:58,  2.38s/it]                                                     {'loss': 1.5835, 'learning_rate': 1.3479578911944979e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5997/6779 [3:42:38<30:58,  2.38s/it] 88%|████████▊ | 5998/6779 [3:42:40<30:24,  2.34s/it]                                                     {'loss': 1.6213, 'learning_rate': 1.3445647745927136e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5998/6779 [3:42:40<30:24,  2.34s/it] 88%|████████▊ | 5999/6779 [3:42:43<29:56,  2.30s/it]                                                     {'loss': 1.6461, 'learning_rate': 1.3411757854448726e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5999/6779 [3:42:43<29:56,  2.30s/it] 89%|████████▊ | 6000/6779 [3:42:45<29:18,  2.26s/it]                                                     {'loss': 1.4926, 'learning_rate': 1.337790924500779e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6000/6779 [3:42:45<29:18,  2.26s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+ 89%|████████▊ | 6001/6779 [3:42:48<31:51,  2.46s/it]                                                     {'loss': 1.6328, 'learning_rate': 1.3344101925093255e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6001/6779 [3:42:48<31:51,  2.46s/it] 89%|████████▊ | 6002/6779 [3:42:50<29:59,  2.32s/it]                                                     {'loss': 1.4972, 'learning_rate': 1.3310335902184822e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6002/6779 [3:42:50<29:59,  2.32s/it] 89%|████████▊ | 6003/6779 [3:42:52<30:27,  2.36s/it]                                                     {'loss': 1.6236, 'learning_rate': 1.3276611183753118e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6003/6779 [3:42:52<30:27,  2.36s/it] 89%|████████▊ | 6004/6779 [3:42:54<29:30,  2.28s/it]                                                     {'loss': 1.5541, 'learning_rate': 1.3242927777259662e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6004/6779 [3:42:54<29:30,  2.28s/it] 89%|████████▊ | 6005/6779 [3:42:56<29:07,  2.26s/it]                                                     {'loss': 1.5283, 'learning_rate': 1.3209285690156736e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6005/6779 [3:42:56<29:07,  2.26s/it] 89%|████████▊ | 6006/6779 [3:42:59<28:33,  2.22s/it]                                                     {'loss': 1.7916, 'learning_rate': 1.3175684929887589e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6006/6779 [3:42:59<28:33,  2.22s/it] 89%|████████▊ | 6007/6779 [3:43:01<28:56,  2.25s/it]                                                     {'loss': 1.5063, 'learning_rate': 1.314212550388627e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6007/6779 [3:43:01<28:56,  2.25s/it] 89%|████████▊ | 6008/6779 [3:43:03<28:32,  2.22s/it]                                                     {'loss': 1.5822, 'learning_rate': 1.3108607419577734e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6008/6779 [3:43:03<28:32,  2.22s/it] 89%|████████▊ | 6009/6779 [3:43:05<27:56,  2.18s/it]                                                     {'loss': 1.588, 'learning_rate': 1.3075130684377646e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6009/6779 [3:43:05<27:56,  2.18s/it] 89%|████████▊ | 6010/6779 [3:43:07<28:18,  2.21s/it]                                                     {'loss': 1.5325, 'learning_rate': 1.3041695305692748e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6010/6779 [3:43:07<28:18,  2.21s/it] 89%|████████▊ | 6011/6779 [3:43:10<28:11,  2.20s/it]                                                     {'loss': 1.773, 'learning_rate': 1.3008301290920411e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6011/6779 [3:43:10<28:11,  2.20s/it] 89%|████████▊ | 6012/6779 [3:43:12<28:15,  2.21s/it]                                                     {'loss': 1.643, 'learning_rate': 1.297494864744897e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6012/6779 [3:43:12<28:15,  2.21s/it] 89%|████████▊ | 6013/6779 [3:43:14<28:58,  2.27s/it]                                                     {'loss': 1.6097, 'learning_rate': 1.2941637382657613e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6013/6779 [3:43:14<28:58,  2.27s/it] 89%|████████▊ | 6014/6779 [3:43:17<30:03,  2.36s/it]                                                     {'loss': 1.8713, 'learning_rate': 1.2908367503916329e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6014/6779 [3:43:17<30:03,  2.36s/it] 89%|████████▊ | 6015/6779 [3:43:19<29:15,  2.30s/it]                                                     {'loss': 1.5358, 'learning_rate': 1.2875139018585991e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6015/6779 [3:43:19<29:15,  2.30s/it] 89%|████████▊ | 6016/6779 [3:43:21<28:56,  2.28s/it]                                                     {'loss': 1.5877, 'learning_rate': 1.284195193401827e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6016/6779 [3:43:21<28:56,  2.28s/it] 89%|████████▉ | 6017/6779 [3:43:24<29:19,  2.31s/it]                                                     {'loss': 1.6115, 'learning_rate': 1.280880625755574e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6017/6779 [3:43:24<29:19,  2.31s/it] 89%|████████▉ | 6018/6779 [3:43:26<28:07,  2.22s/it]                                                     {'loss': 1.4446, 'learning_rate': 1.277570199653173e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6018/6779 [3:43:26<28:07,  2.22s/it] 89%|████████▉ | 6019/6779 [3:43:28<28:05,  2.22s/it]                                                     {'loss': 1.5922, 'learning_rate': 1.2742639158270431e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6019/6779 [3:43:28<28:05,  2.22s/it] 89%|████████▉ | 6020/6779 [3:43:30<27:30,  2.17s/it]                                                     {'loss': 1.6521, 'learning_rate': 1.2709617750086922e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6020/6779 [3:43:30<27:30,  2.17s/it] 89%|████████▉ | 6021/6779 [3:43:32<27:17,  2.16s/it]                                                     {'loss': 1.7812, 'learning_rate': 1.2676637779287092e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6021/6779 [3:43:32<27:17,  2.16s/it] 89%|████████▉ | 6022/6779 [3:43:34<27:15,  2.16s/it]                                                     {'loss': 1.3578, 'learning_rate': 1.2643699253167663e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6022/6779 [3:43:34<27:15,  2.16s/it] 89%|████████▉ | 6023/6779 [3:43:36<27:29,  2.18s/it]                                                     {'loss': 1.6594, 'learning_rate': 1.2610802179016112e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6023/6779 [3:43:36<27:29,  2.18s/it] 89%|████████▉ | 6024/6779 [3:43:39<27:58,  2.22s/it]                                                     {'loss': 1.4478, 'learning_rate': 1.2577946564110888e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6024/6779 [3:43:39<27:58,  2.22s/it] 89%|████████▉ | 6025/6779 [3:43:41<27:11,  2.16s/it]                                                     {'loss': 1.5944, 'learning_rate': 1.2545132415721106e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6025/6779 [3:43:41<27:11,  2.16s/it] 89%|████████▉ | 6026/6779 [3:43:43<27:37,  2.20s/it]                                                     {'loss': 1.6182, 'learning_rate': 1.2512359741106871e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6026/6779 [3:43:43<27:37,  2.20s/it] 89%|████████▉ | 6027/6779 [3:43:45<27:46,  2.22s/it]                                                     {'loss': 1.5774, 'learning_rate': 1.2479628547518941e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6027/6779 [3:43:45<27:46,  2.22s/it] 89%|████████▉ | 6028/6779 [3:43:48<27:59,  2.24s/it]                                                     {'loss': 1.7274, 'learning_rate': 1.2446938842199052e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6028/6779 [3:43:48<27:59,  2.24s/it] 89%|████████▉ | 6029/6779 [3:43:50<27:54,  2.23s/it]                                                     {'loss': 1.6514, 'learning_rate': 1.2414290632379711e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6029/6779 [3:43:50<27:54,  2.23s/it] 89%|████████▉ | 6030/6779 [3:43:52<27:10,  2.18s/it]                                                     {'loss': 1.7288, 'learning_rate': 1.2381683925284138e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6030/6779 [3:43:52<27:10,  2.18s/it] 89%|████████▉ | 6031/6779 [3:43:54<26:44,  2.14s/it]                                                     {'loss': 1.735, 'learning_rate': 1.2349118728126563e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6031/6779 [3:43:54<26:44,  2.14s/it] 89%|████████▉ | 6032/6779 [3:43:56<26:26,  2.12s/it]                                                     {'loss': 1.4912, 'learning_rate': 1.2316595048111845e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6032/6779 [3:43:56<26:26,  2.12s/it] 89%|████████▉ | 6033/6779 [3:43:58<26:56,  2.17s/it]                                                     {'loss': 1.6001, 'learning_rate': 1.2284112892435829e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6033/6779 [3:43:58<26:56,  2.17s/it] 89%|████████▉ | 6034/6779 [3:44:01<27:24,  2.21s/it]                                                     {'loss': 1.7378, 'learning_rate': 1.2251672268284986e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6034/6779 [3:44:01<27:24,  2.21s/it] 89%|████████▉ | 6035/6779 [3:44:02<26:15,  2.12s/it]                                                     {'loss': 1.5318, 'learning_rate': 1.2219273182836732e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6035/6779 [3:44:02<26:15,  2.12s/it] 89%|████████▉ | 6036/6779 [3:44:05<26:20,  2.13s/it]                                                     {'loss': 1.5473, 'learning_rate': 1.2186915643259312e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6036/6779 [3:44:05<26:20,  2.13s/it] 89%|████████▉ | 6037/6779 [3:44:07<26:00,  2.10s/it]                                                     {'loss': 1.6451, 'learning_rate': 1.2154599656711662e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6037/6779 [3:44:07<26:00,  2.10s/it] 89%|████████▉ | 6038/6779 [3:44:09<26:34,  2.15s/it]                                                     {'loss': 1.7469, 'learning_rate': 1.2122325230343645e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6038/6779 [3:44:09<26:34,  2.15s/it] 89%|████████▉ | 6039/6779 [3:44:11<25:53,  2.10s/it]                                                     {'loss': 1.659, 'learning_rate': 1.2090092371295814e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6039/6779 [3:44:11<25:53,  2.10s/it] 89%|████████▉ | 6040/6779 [3:44:13<26:35,  2.16s/it]                                                     {'loss': 1.6443, 'learning_rate': 1.2057901086699641e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6040/6779 [3:44:13<26:35,  2.16s/it] 89%|████████▉ | 6041/6779 [3:44:15<26:41,  2.17s/it]                                                     {'loss': 1.5569, 'learning_rate': 1.2025751383677275e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6041/6779 [3:44:15<26:41,  2.17s/it] 89%|████████▉ | 6042/6779 [3:44:17<26:21,  2.15s/it]                                                     {'loss': 1.4984, 'learning_rate': 1.1993643269341758e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6042/6779 [3:44:17<26:21,  2.15s/it] 89%|████████▉ | 6043/6779 [3:44:20<26:10,  2.13s/it]                                                     {'loss': 1.628, 'learning_rate': 1.1961576750796943e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6043/6779 [3:44:20<26:10,  2.13s/it] 89%|████████▉ | 6044/6779 [3:44:22<25:42,  2.10s/it]                                                     {'loss': 1.613, 'learning_rate': 1.1929551835137399e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6044/6779 [3:44:22<25:42,  2.10s/it] 89%|████████▉ | 6045/6779 [3:44:24<27:14,  2.23s/it]                                                     {'loss': 1.4953, 'learning_rate': 1.1897568529448566e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6045/6779 [3:44:24<27:14,  2.23s/it] 89%|████████▉ | 6046/6779 [3:44:26<26:41,  2.18s/it]                                                     {'loss': 1.7427, 'learning_rate': 1.186562684080661e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6046/6779 [3:44:26<26:41,  2.18s/it] 89%|████████▉ | 6047/6779 [3:44:28<26:17,  2.16s/it]                                                     {'loss': 1.8287, 'learning_rate': 1.1833726776278587e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6047/6779 [3:44:28<26:17,  2.16s/it] 89%|████████▉ | 6048/6779 [3:44:30<26:08,  2.15s/it]                                                     {'loss': 1.7715, 'learning_rate': 1.1801868342922184e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6048/6779 [3:44:30<26:08,  2.15s/it] 89%|████████▉ | 6049/6779 [3:44:33<26:14,  2.16s/it]                                                     {'loss': 1.6797, 'learning_rate': 1.1770051547786031e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6049/6779 [3:44:33<26:14,  2.16s/it] 89%|████████▉ | 6050/6779 [3:44:35<26:12,  2.16s/it]                                                     {'loss': 1.7004, 'learning_rate': 1.173827639790952e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6050/6779 [3:44:35<26:12,  2.16s/it] 89%|████████▉ | 6051/6779 [3:44:37<25:59,  2.14s/it]                                                     {'loss': 1.64, 'learning_rate': 1.1706542900322758e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6051/6779 [3:44:37<25:59,  2.14s/it] 89%|████████▉ | 6052/6779 [3:44:39<25:46,  2.13s/it]                                                     {'loss': 1.6675, 'learning_rate': 1.1674851062046688e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6052/6779 [3:44:39<25:46,  2.13s/it] 89%|████████▉ | 6053/6779 [3:44:41<25:42,  2.13s/it]                                                     {'loss': 1.677, 'learning_rate': 1.164320089009301e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6053/6779 [3:44:41<25:42,  2.13s/it] 89%|████████▉ | 6054/6779 [3:44:43<25:26,  2.11s/it]                                                     {'loss': 1.6498, 'learning_rate': 1.1611592391464254e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6054/6779 [3:44:43<25:26,  2.11s/it] 89%|████████▉ | 6055/6779 [3:44:45<25:22,  2.10s/it]                                                     {'loss': 1.6874, 'learning_rate': 1.1580025573153652e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6055/6779 [3:44:45<25:22,  2.10s/it] 89%|████████▉ | 6056/6779 [3:44:47<25:02,  2.08s/it]                                                     {'loss': 1.4715, 'learning_rate': 1.1548500442145304e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6056/6779 [3:44:47<25:02,  2.08s/it] 89%|████████▉ | 6057/6779 [3:44:49<25:31,  2.12s/it]                                                     {'loss': 1.7543, 'learning_rate': 1.1517017005414033e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6057/6779 [3:44:49<25:31,  2.12s/it] 89%|████████▉ | 6058/6779 [3:44:51<25:14,  2.10s/it]                                                     {'loss': 1.613, 'learning_rate': 1.1485575269925398e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6058/6779 [3:44:52<25:14,  2.10s/it] 89%|████████▉ | 6059/6779 [3:44:54<26:15,  2.19s/it]                                                     {'loss': 1.6939, 'learning_rate': 1.1454175242635857e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6059/6779 [3:44:54<26:15,  2.19s/it] 89%|████████▉ | 6060/6779 [3:44:56<25:52,  2.16s/it]                                                     {'loss': 1.5991, 'learning_rate': 1.1422816930492497e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6060/6779 [3:44:56<25:52,  2.16s/it] 89%|████████▉ | 6061/6779 [3:44:58<26:03,  2.18s/it]                                                     {'loss': 1.5231, 'learning_rate': 1.1391500340433303e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6061/6779 [3:44:58<26:03,  2.18s/it] 89%|████████▉ | 6062/6779 [3:45:00<25:44,  2.15s/it]                                                     {'loss': 1.6613, 'learning_rate': 1.136022547938691e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6062/6779 [3:45:00<25:44,  2.15s/it] 89%|████████▉ | 6063/6779 [3:45:03<25:59,  2.18s/it]                                                     {'loss': 1.6459, 'learning_rate': 1.1328992354272783e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6063/6779 [3:45:03<25:59,  2.18s/it] 89%|████████▉ | 6064/6779 [3:45:05<25:56,  2.18s/it]                                                     {'loss': 1.6214, 'learning_rate': 1.1297800972001216e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6064/6779 [3:45:05<25:56,  2.18s/it] 89%|████████▉ | 6065/6779 [3:45:07<27:23,  2.30s/it]                                                     {'loss': 1.7315, 'learning_rate': 1.1266651339473112e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6065/6779 [3:45:07<27:23,  2.30s/it] 89%|████████▉ | 6066/6779 [3:45:10<27:32,  2.32s/it]                                                     {'loss': 1.7589, 'learning_rate': 1.1235543463580289e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6066/6779 [3:45:10<27:32,  2.32s/it] 89%|████████▉ | 6067/6779 [3:45:12<26:51,  2.26s/it]                                                     {'loss': 1.6317, 'learning_rate': 1.1204477351205223e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6067/6779 [3:45:12<26:51,  2.26s/it] 90%|████████▉ | 6068/6779 [3:45:14<26:55,  2.27s/it]                                                     {'loss': 1.6359, 'learning_rate': 1.1173453009221235e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6068/6779 [3:45:14<26:55,  2.27s/it] 90%|████████▉ | 6069/6779 [3:45:17<27:59,  2.37s/it]                                                     {'loss': 1.7484, 'learning_rate': 1.114247044449228e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6069/6779 [3:45:17<27:59,  2.37s/it] 90%|████████▉ | 6070/6779 [3:45:19<27:05,  2.29s/it]                                                     {'loss': 1.6309, 'learning_rate': 1.111152966387321e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6070/6779 [3:45:19<27:05,  2.29s/it] 90%|████████▉ | 6071/6779 [3:45:21<26:23,  2.24s/it]                                                     {'loss': 1.6767, 'learning_rate': 1.1080630674209568e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6071/6779 [3:45:21<26:23,  2.24s/it] 90%|████████▉ | 6072/6779 [3:45:23<27:15,  2.31s/it]                                                     {'loss': 1.6658, 'learning_rate': 1.1049773482337689e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6072/6779 [3:45:23<27:15,  2.31s/it] 90%|████████▉ | 6073/6779 [3:45:26<26:32,  2.26s/it]                                                     {'loss': 1.5995, 'learning_rate': 1.1018958095084553e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6073/6779 [3:45:26<26:32,  2.26s/it] 90%|████████▉ | 6074/6779 [3:45:28<26:05,  2.22s/it]                                                     {'loss': 1.5803, 'learning_rate': 1.0988184519267974e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6074/6779 [3:45:28<26:05,  2.22s/it] 90%|████████▉ | 6075/6779 [3:45:30<25:35,  2.18s/it]                                                     {'loss': 1.7793, 'learning_rate': 1.0957452761696573e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6075/6779 [3:45:30<25:35,  2.18s/it] 90%|████████▉ | 6076/6779 [3:45:32<25:04,  2.14s/it]                                                     {'loss': 1.5158, 'learning_rate': 1.0926762829169557e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6076/6779 [3:45:32<25:04,  2.14s/it] 90%|████████▉ | 6077/6779 [3:45:34<24:36,  2.10s/it]                                                     {'loss': 1.5837, 'learning_rate': 1.0896114728477002e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6077/6779 [3:45:34<24:36,  2.10s/it] 90%|████████▉ | 6078/6779 [3:45:36<25:37,  2.19s/it]                                                     {'loss': 1.62, 'learning_rate': 1.0865508466399754e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6078/6779 [3:45:36<25:37,  2.19s/it] 90%|████████▉ | 6079/6779 [3:45:38<25:14,  2.16s/it]                                                     {'loss': 1.7219, 'learning_rate': 1.0834944049709306e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6079/6779 [3:45:38<25:14,  2.16s/it] 90%|████████▉ | 6080/6779 [3:45:40<25:01,  2.15s/it]                                                     {'loss': 1.5894, 'learning_rate': 1.0804421485167936e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6080/6779 [3:45:40<25:01,  2.15s/it] 90%|████████▉ | 6081/6779 [3:45:43<25:32,  2.20s/it]                                                     {'loss': 1.697, 'learning_rate': 1.0773940779528668e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6081/6779 [3:45:43<25:32,  2.20s/it] 90%|████████▉ | 6082/6779 [3:45:49<38:41,  3.33s/it]                                                     {'loss': 1.6465, 'learning_rate': 1.0743501939535283e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6082/6779 [3:45:49<38:41,  3.33s/it] 90%|████████▉ | 6083/6779 [3:45:51<34:53,  3.01s/it]                                                     {'loss': 1.8134, 'learning_rate': 1.0713104971922194e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6083/6779 [3:45:51<34:53,  3.01s/it] 90%|████████▉ | 6084/6779 [3:45:53<31:20,  2.71s/it]                                                     {'loss': 1.6504, 'learning_rate': 1.0682749883414689e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6084/6779 [3:45:53<31:20,  2.71s/it] 90%|████████▉ | 6085/6779 [3:45:55<29:07,  2.52s/it]                                                     {'loss': 1.59, 'learning_rate': 1.0652436680728728e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6085/6779 [3:45:55<29:07,  2.52s/it] 90%|████████▉ | 6086/6779 [3:45:57<28:17,  2.45s/it]                                                     {'loss': 1.548, 'learning_rate': 1.0622165370571035e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6086/6779 [3:45:57<28:17,  2.45s/it] 90%|████████▉ | 6087/6779 [3:46:00<28:15,  2.45s/it]                                                     {'loss': 1.6545, 'learning_rate': 1.0591935959638988e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6087/6779 [3:46:00<28:15,  2.45s/it] 90%|████████▉ | 6088/6779 [3:46:02<27:04,  2.35s/it]                                                     {'loss': 1.7472, 'learning_rate': 1.056174845462079e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6088/6779 [3:46:02<27:04,  2.35s/it] 90%|████████▉ | 6089/6779 [3:46:04<26:31,  2.31s/it]                                                     {'loss': 1.7268, 'learning_rate': 1.0531602862195323e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6089/6779 [3:46:04<26:31,  2.31s/it] 90%|████████▉ | 6090/6779 [3:46:06<25:46,  2.24s/it]                                                     {'loss': 1.7126, 'learning_rate': 1.0501499189032116e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6090/6779 [3:46:06<25:46,  2.24s/it] 90%|████████▉ | 6091/6779 [3:46:08<25:11,  2.20s/it]                                                     {'loss': 1.5081, 'learning_rate': 1.0471437441791598e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6091/6779 [3:46:08<25:11,  2.20s/it] 90%|████████▉ | 6092/6779 [3:46:10<24:40,  2.15s/it]                                                     {'loss': 1.7836, 'learning_rate': 1.0441417627124806e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6092/6779 [3:46:10<24:40,  2.15s/it] 90%|████████▉ | 6093/6779 [3:46:12<24:24,  2.14s/it]                                                     {'loss': 1.6609, 'learning_rate': 1.0411439751673558e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6093/6779 [3:46:12<24:24,  2.14s/it] 90%|████████▉ | 6094/6779 [3:46:15<25:08,  2.20s/it]                                                     {'loss': 1.5575, 'learning_rate': 1.0381503822070304e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6094/6779 [3:46:15<25:08,  2.20s/it] 90%|████████▉ | 6095/6779 [3:46:17<25:49,  2.26s/it]                                                     {'loss': 1.6497, 'learning_rate': 1.0351609844938303e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6095/6779 [3:46:17<25:49,  2.26s/it] 90%|████████▉ | 6096/6779 [3:46:19<25:12,  2.21s/it]                                                     {'loss': 1.5523, 'learning_rate': 1.0321757826891487e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6096/6779 [3:46:19<25:12,  2.21s/it] 90%|████████▉ | 6097/6779 [3:46:21<24:40,  2.17s/it]                                                     {'loss': 1.7314, 'learning_rate': 1.029194777453455e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6097/6779 [3:46:21<24:40,  2.17s/it] 90%|████████▉ | 6098/6779 [3:46:24<25:29,  2.25s/it]                                                     {'loss': 1.7233, 'learning_rate': 1.0262179694462814e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6098/6779 [3:46:24<25:29,  2.25s/it] 90%|████████▉ | 6099/6779 [3:46:26<24:53,  2.20s/it]                                                     {'loss': 1.4696, 'learning_rate': 1.0232453593262392e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6099/6779 [3:46:26<24:53,  2.20s/it] 90%|████████▉ | 6100/6779 [3:46:28<24:40,  2.18s/it]                                                     {'loss': 1.5736, 'learning_rate': 1.020276947751011e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6100/6779 [3:46:28<24:40,  2.18s/it] 90%|████████▉ | 6101/6779 [3:46:30<24:49,  2.20s/it]                                                     {'loss': 1.6861, 'learning_rate': 1.0173127353773449e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6101/6779 [3:46:30<24:49,  2.20s/it] 90%|█████████ | 6102/6779 [3:46:32<24:55,  2.21s/it]                                                     {'loss': 1.6413, 'learning_rate': 1.0143527228610671e-05, 'epoch': 0.9}
+ 90%|█████████ | 6102/6779 [3:46:32<24:55,  2.21s/it] 90%|█████████ | 6103/6779 [3:46:35<24:36,  2.18s/it]                                                     {'loss': 1.6637, 'learning_rate': 1.0113969108570654e-05, 'epoch': 0.9}
+ 90%|█████████ | 6103/6779 [3:46:35<24:36,  2.18s/it] 90%|█████████ | 6104/6779 [3:46:37<25:01,  2.22s/it]                                                     {'loss': 1.5925, 'learning_rate': 1.0084453000193094e-05, 'epoch': 0.9}
+ 90%|█████████ | 6104/6779 [3:46:37<25:01,  2.22s/it] 90%|█████████ | 6105/6779 [3:46:39<24:31,  2.18s/it]                                                     {'loss': 1.6765, 'learning_rate': 1.0054978910008262e-05, 'epoch': 0.9}
+ 90%|█████████ | 6105/6779 [3:46:39<24:31,  2.18s/it] 90%|█████████ | 6106/6779 [3:46:41<24:22,  2.17s/it]                                                     {'loss': 1.6034, 'learning_rate': 1.0025546844537248e-05, 'epoch': 0.9}
+ 90%|█████████ | 6106/6779 [3:46:41<24:22,  2.17s/it] 90%|█████████ | 6107/6779 [3:46:43<24:15,  2.17s/it]                                                     {'loss': 1.7373, 'learning_rate': 9.996156810291823e-06, 'epoch': 0.9}
+ 90%|█████████ | 6107/6779 [3:46:43<24:15,  2.17s/it] 90%|█████████ | 6108/6779 [3:46:45<23:47,  2.13s/it]                                                     {'loss': 1.5441, 'learning_rate': 9.966808813774408e-06, 'epoch': 0.9}
+ 90%|█████████ | 6108/6779 [3:46:45<23:47,  2.13s/it] 90%|█████████ | 6109/6779 [3:46:48<24:08,  2.16s/it]                                                     {'loss': 1.6255, 'learning_rate': 9.937502861478144e-06, 'epoch': 0.9}
+ 90%|█████████ | 6109/6779 [3:46:48<24:08,  2.16s/it] 90%|█████████ | 6110/6779 [3:46:50<23:47,  2.13s/it]                                                     {'loss': 1.6292, 'learning_rate': 9.908238959886884e-06, 'epoch': 0.9}
+ 90%|█████████ | 6110/6779 [3:46:50<23:47,  2.13s/it] 90%|█████████ | 6111/6779 [3:46:52<24:10,  2.17s/it]                                                     {'loss': 1.6314, 'learning_rate': 9.879017115475186e-06, 'epoch': 0.9}
+ 90%|█████████ | 6111/6779 [3:46:52<24:10,  2.17s/it] 90%|█████████ | 6112/6779 [3:46:54<24:27,  2.20s/it]                                                     {'loss': 1.5194, 'learning_rate': 9.849837334708233e-06, 'epoch': 0.9}
+ 90%|█████████ | 6112/6779 [3:46:54<24:27,  2.20s/it] 90%|█████████ | 6113/6779 [3:46:56<24:21,  2.19s/it]                                                     {'loss': 1.6661, 'learning_rate': 9.820699624042018e-06, 'epoch': 0.9}
+ 90%|█████████ | 6113/6779 [3:46:56<24:21,  2.19s/it] 90%|█████████ | 6114/6779 [3:46:58<24:05,  2.17s/it]                                                     {'loss': 1.6114, 'learning_rate': 9.79160398992316e-06, 'epoch': 0.9}
+ 90%|█████████ | 6114/6779 [3:46:58<24:05,  2.17s/it] 90%|█████████ | 6115/6779 [3:47:01<24:04,  2.18s/it]                                                     {'loss': 1.7542, 'learning_rate': 9.76255043878893e-06, 'epoch': 0.9}
+ 90%|█████████ | 6115/6779 [3:47:01<24:04,  2.18s/it] 90%|█████████ | 6116/6779 [3:47:03<24:14,  2.19s/it]                                                     {'loss': 1.6008, 'learning_rate': 9.733538977067392e-06, 'epoch': 0.9}
+ 90%|█████████ | 6116/6779 [3:47:03<24:14,  2.19s/it] 90%|█████████ | 6117/6779 [3:47:05<23:25,  2.12s/it]                                                     {'loss': 1.7383, 'learning_rate': 9.70456961117716e-06, 'epoch': 0.9}
+ 90%|█████████ | 6117/6779 [3:47:05<23:25,  2.12s/it] 90%|█████████ | 6118/6779 [3:47:07<23:16,  2.11s/it]                                                     {'loss': 1.6614, 'learning_rate': 9.67564234752767e-06, 'epoch': 0.9}
+ 90%|█████████ | 6118/6779 [3:47:07<23:16,  2.11s/it] 90%|█████████ | 6119/6779 [3:47:09<24:22,  2.22s/it]                                                     {'loss': 1.5994, 'learning_rate': 9.646757192518952e-06, 'epoch': 0.9}
+ 90%|█████████ | 6119/6779 [3:47:09<24:22,  2.22s/it] 90%|█████████ | 6120/6779 [3:47:12<24:02,  2.19s/it]                                                     {'loss': 1.5165, 'learning_rate': 9.617914152541763e-06, 'epoch': 0.9}
+ 90%|█████████ | 6120/6779 [3:47:12<24:02,  2.19s/it] 90%|█████████ | 6121/6779 [3:47:14<23:17,  2.12s/it]                                                     {'loss': 1.6682, 'learning_rate': 9.589113233977576e-06, 'epoch': 0.9}
+ 90%|█████████ | 6121/6779 [3:47:14<23:17,  2.12s/it] 90%|█████████ | 6122/6779 [3:47:16<23:00,  2.10s/it]                                                     {'loss': 1.5448, 'learning_rate': 9.560354443198406e-06, 'epoch': 0.9}
+ 90%|█████████ | 6122/6779 [3:47:16<23:00,  2.10s/it] 90%|█████████ | 6123/6779 [3:47:18<23:09,  2.12s/it]                                                     {'loss': 1.6398, 'learning_rate': 9.531637786567138e-06, 'epoch': 0.9}
+ 90%|█████████ | 6123/6779 [3:47:18<23:09,  2.12s/it] 90%|█████████ | 6124/6779 [3:47:20<23:27,  2.15s/it]                                                     {'loss': 1.5805, 'learning_rate': 9.50296327043716e-06, 'epoch': 0.9}
+ 90%|█████████ | 6124/6779 [3:47:20<23:27,  2.15s/it] 90%|█████████ | 6125/6779 [3:47:22<23:38,  2.17s/it]                                                     {'loss': 1.6465, 'learning_rate': 9.474330901152683e-06, 'epoch': 0.9}
+ 90%|█████████ | 6125/6779 [3:47:22<23:38,  2.17s/it] 90%|█████████ | 6126/6779 [3:47:24<23:17,  2.14s/it]                                                     {'loss': 1.6321, 'learning_rate': 9.445740685048465e-06, 'epoch': 0.9}
+ 90%|█████████ | 6126/6779 [3:47:24<23:17,  2.14s/it] 90%|█████████ | 6127/6779 [3:47:26<23:30,  2.16s/it]                                                     {'loss': 1.5619, 'learning_rate': 9.417192628450022e-06, 'epoch': 0.9}
+ 90%|█████████ | 6127/6779 [3:47:26<23:30,  2.16s/it] 90%|█████████ | 6128/6779 [3:47:29<23:49,  2.20s/it]                                                     {'loss': 1.6117, 'learning_rate': 9.388686737673525e-06, 'epoch': 0.9}
+ 90%|█████████ | 6128/6779 [3:47:29<23:49,  2.20s/it] 90%|█████████ | 6129/6779 [3:47:31<23:56,  2.21s/it]                                                     {'loss': 1.5463, 'learning_rate': 9.360223019025793e-06, 'epoch': 0.9}
+ 90%|█████████ | 6129/6779 [3:47:31<23:56,  2.21s/it] 90%|█████████ | 6130/6779 [3:47:33<24:15,  2.24s/it]                                                     {'loss': 1.7164, 'learning_rate': 9.33180147880437e-06, 'epoch': 0.9}
+ 90%|█████████ | 6130/6779 [3:47:33<24:15,  2.24s/it] 90%|█████████ | 6131/6779 [3:47:35<23:25,  2.17s/it]                                                     {'loss': 1.8463, 'learning_rate': 9.303422123297378e-06, 'epoch': 0.9}
+ 90%|█████████ | 6131/6779 [3:47:35<23:25,  2.17s/it] 90%|█████████ | 6132/6779 [3:47:38<23:50,  2.21s/it]                                                     {'loss': 1.698, 'learning_rate': 9.275084958783686e-06, 'epoch': 0.9}
+ 90%|█████████ | 6132/6779 [3:47:38<23:50,  2.21s/it] 90%|█████████ | 6133/6779 [3:47:40<23:52,  2.22s/it]                                                     {'loss': 1.6718, 'learning_rate': 9.246789991532768e-06, 'epoch': 0.9}
+ 90%|█████████ | 6133/6779 [3:47:40<23:52,  2.22s/it] 90%|█████████ | 6134/6779 [3:47:42<23:20,  2.17s/it]                                                     {'loss': 1.5865, 'learning_rate': 9.218537227804835e-06, 'epoch': 0.9}
+ 90%|█████████ | 6134/6779 [3:47:42<23:20,  2.17s/it] 91%|█████████ | 6135/6779 [3:47:44<23:55,  2.23s/it]                                                     {'loss': 1.6446, 'learning_rate': 9.190326673850692e-06, 'epoch': 0.91}
+ 91%|█████████ | 6135/6779 [3:47:44<23:55,  2.23s/it] 91%|█████████ | 6136/6779 [3:47:46<23:15,  2.17s/it]                                                     {'loss': 1.4952, 'learning_rate': 9.16215833591183e-06, 'epoch': 0.91}
+ 91%|█████████ | 6136/6779 [3:47:46<23:15,  2.17s/it] 91%|█████████ | 6137/6779 [3:47:48<22:54,  2.14s/it]                                                     {'loss': 1.8082, 'learning_rate': 9.134032220220445e-06, 'epoch': 0.91}
+ 91%|█████████ | 6137/6779 [3:47:48<22:54,  2.14s/it] 91%|█████████ | 6138/6779 [3:47:51<22:57,  2.15s/it]                                                     {'loss': 1.6885, 'learning_rate': 9.105948332999292e-06, 'epoch': 0.91}
+ 91%|█████████ | 6138/6779 [3:47:51<22:57,  2.15s/it] 91%|█████████ | 6139/6779 [3:47:53<24:08,  2.26s/it]                                                     {'loss': 1.4558, 'learning_rate': 9.077906680461868e-06, 'epoch': 0.91}
+ 91%|█████████ | 6139/6779 [3:47:53<24:08,  2.26s/it] 91%|█████████ | 6140/6779 [3:47:55<23:54,  2.25s/it]                                                     {'loss': 1.6647, 'learning_rate': 9.049907268812274e-06, 'epoch': 0.91}
+ 91%|█████████ | 6140/6779 [3:47:55<23:54,  2.25s/it] 91%|█████████ | 6141/6779 [3:47:58<24:41,  2.32s/it]                                                     {'loss': 1.7159, 'learning_rate': 9.021950104245291e-06, 'epoch': 0.91}
+ 91%|█████████ | 6141/6779 [3:47:58<24:41,  2.32s/it] 91%|█████████ | 6142/6779 [3:48:00<24:10,  2.28s/it]                                                     {'loss': 1.6421, 'learning_rate': 8.99403519294637e-06, 'epoch': 0.91}
+ 91%|█████████ | 6142/6779 [3:48:00<24:10,  2.28s/it] 91%|█████████ | 6143/6779 [3:48:02<24:19,  2.29s/it]                                                     {'loss': 1.473, 'learning_rate': 8.966162541091616e-06, 'epoch': 0.91}
+ 91%|█████████ | 6143/6779 [3:48:02<24:19,  2.29s/it] 91%|█████████ | 6144/6779 [3:48:04<23:21,  2.21s/it]                                                     {'loss': 1.6371, 'learning_rate': 8.938332154847717e-06, 'epoch': 0.91}
+ 91%|█████████ | 6144/6779 [3:48:04<23:21,  2.21s/it] 91%|█████████ | 6145/6779 [3:48:06<23:22,  2.21s/it]                                                     {'loss': 1.6191, 'learning_rate': 8.91054404037206e-06, 'epoch': 0.91}
+ 91%|█████████ | 6145/6779 [3:48:06<23:22,  2.21s/it] 91%|█████████ | 6146/6779 [3:48:09<24:10,  2.29s/it]                                                     {'loss': 1.6442, 'learning_rate': 8.882798203812704e-06, 'epoch': 0.91}
+ 91%|█████████ | 6146/6779 [3:48:09<24:10,  2.29s/it] 91%|█████████ | 6147/6779 [3:48:11<23:25,  2.22s/it]                                                     {'loss': 1.6646, 'learning_rate': 8.855094651308271e-06, 'epoch': 0.91}
+ 91%|█████████ | 6147/6779 [3:48:11<23:25,  2.22s/it] 91%|█████████ | 6148/6779 [3:48:13<22:46,  2.17s/it]                                                     {'loss': 1.7024, 'learning_rate': 8.827433388988127e-06, 'epoch': 0.91}
+ 91%|█████████ | 6148/6779 [3:48:13<22:46,  2.17s/it] 91%|█████████ | 6149/6779 [3:48:15<22:38,  2.16s/it]                                                     {'loss': 1.5324, 'learning_rate': 8.799814422972197e-06, 'epoch': 0.91}
+ 91%|█████████ | 6149/6779 [3:48:15<22:38,  2.16s/it] 91%|█████████ | 6150/6779 [3:48:17<22:34,  2.15s/it]                                                     {'loss': 1.6047, 'learning_rate': 8.772237759371171e-06, 'epoch': 0.91}
+ 91%|█████████ | 6150/6779 [3:48:17<22:34,  2.15s/it] 91%|█████████ | 6151/6779 [3:48:20<22:39,  2.16s/it]                                                     {'loss': 1.6813, 'learning_rate': 8.744703404286192e-06, 'epoch': 0.91}
+ 91%|█████████ | 6151/6779 [3:48:20<22:39,  2.16s/it] 91%|█████████ | 6152/6779 [3:48:22<22:45,  2.18s/it]                                                     {'loss': 1.666, 'learning_rate': 8.71721136380923e-06, 'epoch': 0.91}
+ 91%|█████████ | 6152/6779 [3:48:22<22:45,  2.18s/it] 91%|█████████ | 6153/6779 [3:48:24<23:34,  2.26s/it]                                                     {'loss': 1.4688, 'learning_rate': 8.689761644022776e-06, 'epoch': 0.91}
+ 91%|█████████ | 6153/6779 [3:48:24<23:34,  2.26s/it] 91%|█████████ | 6154/6779 [3:48:27<23:53,  2.29s/it]                                                     {'loss': 1.5878, 'learning_rate': 8.66235425099995e-06, 'epoch': 0.91}
+ 91%|█████████ | 6154/6779 [3:48:27<23:53,  2.29s/it] 91%|█████████ | 6155/6779 [3:48:29<23:59,  2.31s/it]                                                     {'loss': 1.537, 'learning_rate': 8.634989190804566e-06, 'epoch': 0.91}
+ 91%|█████████ | 6155/6779 [3:48:29<23:59,  2.31s/it] 91%|█████████ | 6156/6779 [3:48:31<23:21,  2.25s/it]                                                     {'loss': 1.5442, 'learning_rate': 8.607666469491094e-06, 'epoch': 0.91}
+ 91%|█████████ | 6156/6779 [3:48:31<23:21,  2.25s/it] 91%|█████████ | 6157/6779 [3:48:33<23:06,  2.23s/it]                                                     {'loss': 1.5487, 'learning_rate': 8.580386093104586e-06, 'epoch': 0.91}
+ 91%|█████████ | 6157/6779 [3:48:33<23:06,  2.23s/it] 91%|█████████ | 6158/6779 [3:48:35<22:50,  2.21s/it]                                                     {'loss': 1.5314, 'learning_rate': 8.553148067680705e-06, 'epoch': 0.91}
+ 91%|█████████ | 6158/6779 [3:48:35<22:50,  2.21s/it] 91%|█████████ | 6159/6779 [3:48:40<29:12,  2.83s/it]                                                     {'loss': 1.4662, 'learning_rate': 8.525952399245806e-06, 'epoch': 0.91}
+ 91%|█████████ | 6159/6779 [3:48:40<29:12,  2.83s/it] 91%|█████████ | 6160/6779 [3:48:42<27:21,  2.65s/it]                                                     {'loss': 1.6371, 'learning_rate': 8.498799093816856e-06, 'epoch': 0.91}
+ 91%|█████████ | 6160/6779 [3:48:42<27:21,  2.65s/it] 91%|█████████ | 6161/6779 [3:48:44<26:13,  2.55s/it]                                                     {'loss': 1.6772, 'learning_rate': 8.471688157401359e-06, 'epoch': 0.91}
+ 91%|█████████ | 6161/6779 [3:48:44<26:13,  2.55s/it] 91%|█████████ | 6162/6779 [3:48:46<25:07,  2.44s/it]                                                     {'loss': 1.6265, 'learning_rate': 8.444619595997583e-06, 'epoch': 0.91}
+ 91%|█████████ | 6162/6779 [3:48:46<25:07,  2.44s/it] 91%|█████████ | 6163/6779 [3:48:49<24:12,  2.36s/it]                                                     {'loss': 1.7783, 'learning_rate': 8.417593415594338e-06, 'epoch': 0.91}
+ 91%|█████████ | 6163/6779 [3:48:49<24:12,  2.36s/it] 91%|█████████ | 6164/6779 [3:48:51<23:07,  2.26s/it]                                                     {'loss': 1.7594, 'learning_rate': 8.390609622171108e-06, 'epoch': 0.91}
+ 91%|█████████ | 6164/6779 [3:48:51<23:07,  2.26s/it] 91%|█████████ | 6165/6779 [3:48:53<22:50,  2.23s/it]                                                     {'loss': 1.4713, 'learning_rate': 8.363668221697918e-06, 'epoch': 0.91}
+ 91%|█████████ | 6165/6779 [3:48:53<22:50,  2.23s/it] 91%|█████████ | 6166/6779 [3:48:55<23:19,  2.28s/it]                                                     {'loss': 1.58, 'learning_rate': 8.336769220135531e-06, 'epoch': 0.91}
+ 91%|█████████ | 6166/6779 [3:48:55<23:19,  2.28s/it] 91%|█████████ | 6167/6779 [3:48:57<22:22,  2.19s/it]                                                     {'loss': 1.7393, 'learning_rate': 8.30991262343519e-06, 'epoch': 0.91}
+ 91%|█████████ | 6167/6779 [3:48:57<22:22,  2.19s/it] 91%|█████████ | 6168/6779 [3:48:59<22:20,  2.19s/it]                                                     {'loss': 1.6688, 'learning_rate': 8.283098437538894e-06, 'epoch': 0.91}
+ 91%|█████████ | 6168/6779 [3:48:59<22:20,  2.19s/it] 91%|█████████ | 6169/6779 [3:49:02<23:13,  2.29s/it]                                                     {'loss': 1.6801, 'learning_rate': 8.256326668379144e-06, 'epoch': 0.91}
+ 91%|█████████ | 6169/6779 [3:49:02<23:13,  2.29s/it] 91%|█████████ | 6170/6779 [3:49:04<23:41,  2.33s/it]                                                     {'loss': 1.7246, 'learning_rate': 8.229597321879112e-06, 'epoch': 0.91}
+ 91%|█████████ | 6170/6779 [3:49:04<23:41,  2.33s/it] 91%|█████████ | 6171/6779 [3:49:07<24:22,  2.41s/it]                                                     {'loss': 1.6478, 'learning_rate': 8.202910403952624e-06, 'epoch': 0.91}
+ 91%|█████████ | 6171/6779 [3:49:07<24:22,  2.41s/it] 91%|█████████ | 6172/6779 [3:49:09<23:38,  2.34s/it]                                                     {'loss': 1.6288, 'learning_rate': 8.176265920504022e-06, 'epoch': 0.91}
+ 91%|█████████ | 6172/6779 [3:49:09<23:38,  2.34s/it] 91%|█████████ | 6173/6779 [3:49:11<22:46,  2.25s/it]                                                     {'loss': 1.9152, 'learning_rate': 8.149663877428348e-06, 'epoch': 0.91}
+ 91%|█████████ | 6173/6779 [3:49:11<22:46,  2.25s/it] 91%|█████████ | 6174/6779 [3:49:13<22:42,  2.25s/it]                                                     {'loss': 1.7877, 'learning_rate': 8.12310428061116e-06, 'epoch': 0.91}
+ 91%|█████████ | 6174/6779 [3:49:13<22:42,  2.25s/it] 91%|█████████ | 6175/6779 [3:49:15<22:20,  2.22s/it]                                                     {'loss': 1.7048, 'learning_rate': 8.096587135928757e-06, 'epoch': 0.91}
+ 91%|█████████ | 6175/6779 [3:49:15<22:20,  2.22s/it] 91%|█████████ | 6176/6779 [3:49:18<22:04,  2.20s/it]                                                     {'loss': 1.5082, 'learning_rate': 8.070112449247914e-06, 'epoch': 0.91}
+ 91%|█████████ | 6176/6779 [3:49:18<22:04,  2.20s/it] 91%|█████████ | 6177/6779 [3:49:20<21:43,  2.17s/it]                                                     {'loss': 1.6775, 'learning_rate': 8.043680226426097e-06, 'epoch': 0.91}
+ 91%|█████████ | 6177/6779 [3:49:20<21:43,  2.17s/it] 91%|█████████ | 6178/6779 [3:49:22<21:55,  2.19s/it]                                                     {'loss': 1.8097, 'learning_rate': 8.017290473311345e-06, 'epoch': 0.91}
+ 91%|█████████ | 6178/6779 [3:49:22<21:55,  2.19s/it] 91%|█████████ | 6179/6779 [3:49:24<21:57,  2.20s/it]                                                     {'loss': 1.5957, 'learning_rate': 7.990943195742295e-06, 'epoch': 0.91}
+ 91%|█████████ | 6179/6779 [3:49:24<21:57,  2.20s/it] 91%|█████████ | 6180/6779 [3:49:27<22:36,  2.26s/it]                                                     {'loss': 1.4729, 'learning_rate': 7.964638399548218e-06, 'epoch': 0.91}
+ 91%|█████████ | 6180/6779 [3:49:27<22:36,  2.26s/it] 91%|█████████ | 6181/6779 [3:49:29<22:11,  2.23s/it]                                                     {'loss': 1.7777, 'learning_rate': 7.938376090548926e-06, 'epoch': 0.91}
+ 91%|█████████ | 6181/6779 [3:49:29<22:11,  2.23s/it] 91%|█████████ | 6182/6779 [3:49:31<22:49,  2.29s/it]                                                     {'loss': 1.65, 'learning_rate': 7.912156274554905e-06, 'epoch': 0.91}
+ 91%|█████████ | 6182/6779 [3:49:31<22:49,  2.29s/it] 91%|█████████ | 6183/6779 [3:49:33<22:17,  2.24s/it]                                                     {'loss': 1.6346, 'learning_rate': 7.885978957367158e-06, 'epoch': 0.91}
+ 91%|█████████ | 6183/6779 [3:49:33<22:17,  2.24s/it] 91%|█████████ | 6184/6779 [3:49:35<21:58,  2.22s/it]                                                     {'loss': 1.6923, 'learning_rate': 7.859844144777385e-06, 'epoch': 0.91}
+ 91%|█████████ | 6184/6779 [3:49:35<21:58,  2.22s/it] 91%|█████████ | 6185/6779 [3:49:37<21:27,  2.17s/it]                                                     {'loss': 1.3876, 'learning_rate': 7.833751842567805e-06, 'epoch': 0.91}
+ 91%|█████████ | 6185/6779 [3:49:37<21:27,  2.17s/it] 91%|█████████▏| 6186/6779 [3:49:40<21:27,  2.17s/it]                                                     {'loss': 1.6261, 'learning_rate': 7.807702056511245e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6186/6779 [3:49:40<21:27,  2.17s/it] 91%|█████████▏| 6187/6779 [3:49:42<21:49,  2.21s/it]                                                     {'loss': 1.663, 'learning_rate': 7.781694792371142e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6187/6779 [3:49:42<21:49,  2.21s/it] 91%|█████████▏| 6188/6779 [3:49:45<23:04,  2.34s/it]                                                     {'loss': 1.6198, 'learning_rate': 7.755730055901511e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6188/6779 [3:49:45<23:04,  2.34s/it] 91%|█████████▏| 6189/6779 [3:49:47<21:55,  2.23s/it]                                                     {'loss': 1.5433, 'learning_rate': 7.729807852847004e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6189/6779 [3:49:47<21:55,  2.23s/it] 91%|█████████▏| 6190/6779 [3:49:49<22:03,  2.25s/it]                                                     {'loss': 1.6601, 'learning_rate': 7.703928188942767e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6190/6779 [3:49:49<22:03,  2.25s/it] 91%|█████████▏| 6191/6779 [3:49:51<22:03,  2.25s/it]                                                     {'loss': 1.5375, 'learning_rate': 7.678091069914617e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6191/6779 [3:49:51<22:03,  2.25s/it] 91%|█████████▏| 6192/6779 [3:49:53<21:26,  2.19s/it]                                                     {'loss': 1.666, 'learning_rate': 7.65229650147894e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6192/6779 [3:49:53<21:26,  2.19s/it] 91%|█████████▏| 6193/6779 [3:49:55<21:11,  2.17s/it]                                                     {'loss': 1.6912, 'learning_rate': 7.6265444893426795e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6193/6779 [3:49:55<21:11,  2.17s/it] 91%|█████████▏| 6194/6779 [3:49:57<21:03,  2.16s/it]                                                     {'loss': 1.7057, 'learning_rate': 7.600835039203413e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6194/6779 [3:49:57<21:03,  2.16s/it] 91%|█████████▏| 6195/6779 [3:50:00<22:09,  2.28s/it]                                                     {'loss': 1.503, 'learning_rate': 7.575168156749235e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6195/6779 [3:50:00<22:09,  2.28s/it] 91%|█████████▏| 6196/6779 [3:50:02<22:29,  2.31s/it]                                                     {'loss': 1.6057, 'learning_rate': 7.5495438476589135e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6196/6779 [3:50:02<22:29,  2.31s/it] 91%|█████████▏| 6197/6779 [3:50:04<21:32,  2.22s/it]                                                     {'loss': 1.5633, 'learning_rate': 7.523962117601669e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6197/6779 [3:50:04<21:32,  2.22s/it] 91%|█████████▏| 6198/6779 [3:50:07<21:38,  2.23s/it]                                                     {'loss': 1.4597, 'learning_rate': 7.498422972237417e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6198/6779 [3:50:07<21:38,  2.23s/it] 91%|█████████▏| 6199/6779 [3:50:09<21:08,  2.19s/it]                                                     {'loss': 1.6644, 'learning_rate': 7.472926417216619e-06, 'epoch': 0.91}
+ 91%|��████████▏| 6199/6779 [3:50:09<21:08,  2.19s/it] 91%|█████████▏| 6200/6779 [3:50:11<21:09,  2.19s/it]                                                     {'loss': 1.7002, 'learning_rate': 7.447472458180294e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6200/6779 [3:50:11<21:09,  2.19s/it] 91%|█████████▏| 6201/6779 [3:50:13<21:00,  2.18s/it]                                                     {'loss': 1.6738, 'learning_rate': 7.422061100760047e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6201/6779 [3:50:13<21:00,  2.18s/it] 91%|█████████▏| 6202/6779 [3:50:15<21:04,  2.19s/it]                                                     {'loss': 1.8134, 'learning_rate': 7.396692350578049e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6202/6779 [3:50:15<21:04,  2.19s/it] 92%|█████████▏| 6203/6779 [3:50:18<21:00,  2.19s/it]                                                     {'loss': 1.487, 'learning_rate': 7.371366213247077e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6203/6779 [3:50:18<21:00,  2.19s/it] 92%|█████████▏| 6204/6779 [3:50:20<20:44,  2.16s/it]                                                     {'loss': 1.6172, 'learning_rate': 7.346082694370404e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6204/6779 [3:50:20<20:44,  2.16s/it] 92%|█████████▏| 6205/6779 [3:50:22<20:32,  2.15s/it]                                                     {'loss': 1.5612, 'learning_rate': 7.320841799541977e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6205/6779 [3:50:22<20:32,  2.15s/it] 92%|█████████▏| 6206/6779 [3:50:24<20:34,  2.15s/it]                                                     {'loss': 1.6921, 'learning_rate': 7.2956435343462635e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6206/6779 [3:50:24<20:34,  2.15s/it] 92%|█████████▏| 6207/6779 [3:50:26<19:59,  2.10s/it]                                                     {'loss': 1.5261, 'learning_rate': 7.270487904358248e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6207/6779 [3:50:26<19:59,  2.10s/it] 92%|█████████▏| 6208/6779 [3:50:28<20:00,  2.10s/it]                                                     {'loss': 1.6208, 'learning_rate': 7.245374915143588e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6208/6779 [3:50:28<20:00,  2.10s/it] 92%|█████████▏| 6209/6779 [3:50:30<20:05,  2.11s/it]                                                     {'loss': 1.5517, 'learning_rate': 7.220304572258418e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6209/6779 [3:50:30<20:05,  2.11s/it] 92%|█████████▏| 6210/6779 [3:50:32<20:21,  2.15s/it]                                                     {'loss': 1.7068, 'learning_rate': 7.19527688124948e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6210/6779 [3:50:32<20:21,  2.15s/it] 92%|█████████▏| 6211/6779 [3:50:35<20:29,  2.16s/it]                                                     {'loss': 1.7505, 'learning_rate': 7.170291847654054e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6211/6779 [3:50:35<20:29,  2.16s/it] 92%|█████████▏| 6212/6779 [3:50:37<21:08,  2.24s/it]                                                     {'loss': 1.6801, 'learning_rate': 7.145349476999985e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6212/6779 [3:50:37<21:08,  2.24s/it] 92%|█████████▏| 6213/6779 [3:50:39<20:28,  2.17s/it]                                                     {'loss': 1.6408, 'learning_rate': 7.1204497748057485e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6213/6779 [3:50:39<20:28,  2.17s/it] 92%|█████████▏| 6214/6779 [3:50:41<20:51,  2.21s/it]                                                     {'loss': 1.7163, 'learning_rate': 7.095592746580271e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6214/6779 [3:50:41<20:51,  2.21s/it] 92%|█████████▏| 6215/6779 [3:50:44<21:07,  2.25s/it]                                                     {'loss': 1.74, 'learning_rate': 7.07077839782313e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6215/6779 [3:50:44<21:07,  2.25s/it] 92%|█████████▏| 6216/6779 [3:50:46<20:50,  2.22s/it]                                                     {'loss': 1.6674, 'learning_rate': 7.046006734024357e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6216/6779 [3:50:46<20:50,  2.22s/it] 92%|█████████▏| 6217/6779 [3:50:48<20:50,  2.23s/it]                                                     {'loss': 1.6353, 'learning_rate': 7.021277760664657e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6217/6779 [3:50:48<20:50,  2.23s/it] 92%|█████████▏| 6218/6779 [3:50:50<20:42,  2.21s/it]                                                     {'loss': 1.5774, 'learning_rate': 6.996591483215209e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6218/6779 [3:50:50<20:42,  2.21s/it] 92%|█████████▏| 6219/6779 [3:50:53<21:24,  2.29s/it]                                                     {'loss': 1.7761, 'learning_rate': 6.971947907137777e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6219/6779 [3:50:53<21:24,  2.29s/it] 92%|█████████▏| 6220/6779 [3:50:55<21:01,  2.26s/it]                                                     {'loss': 1.6151, 'learning_rate': 6.9473470378846436e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6220/6779 [3:50:55<21:01,  2.26s/it] 92%|█████████▏| 6221/6779 [3:50:57<21:02,  2.26s/it]                                                     {'loss': 1.77, 'learning_rate': 6.9227888808987455e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6221/6779 [3:50:57<21:02,  2.26s/it] 92%|█████████▏| 6222/6779 [3:50:59<20:31,  2.21s/it]                                                     {'loss': 1.7315, 'learning_rate': 6.898273441613423e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6222/6779 [3:50:59<20:31,  2.21s/it] 92%|█████████▏| 6223/6779 [3:51:01<20:17,  2.19s/it]                                                     {'loss': 1.7948, 'learning_rate': 6.873800725452672e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6223/6779 [3:51:01<20:17,  2.19s/it] 92%|█████████▏| 6224/6779 [3:51:04<20:55,  2.26s/it]                                                     {'loss': 1.584, 'learning_rate': 6.849370737830984e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6224/6779 [3:51:04<20:55,  2.26s/it] 92%|█████████▏| 6225/6779 [3:51:06<21:34,  2.34s/it]                                                     {'loss': 1.6788, 'learning_rate': 6.8249834841534134e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6225/6779 [3:51:06<21:34,  2.34s/it] 92%|█████████▏| 6226/6779 [3:51:08<20:45,  2.25s/it]                                                     {'loss': 1.7192, 'learning_rate': 6.800638969815576e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6226/6779 [3:51:08<20:45,  2.25s/it] 92%|█████████▏| 6227/6779 [3:51:11<20:53,  2.27s/it]                                                     {'loss': 1.6027, 'learning_rate': 6.776337200203586e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6227/6779 [3:51:11<20:53,  2.27s/it] 92%|█████████▏| 6228/6779 [3:51:13<19:58,  2.17s/it]                                                     {'loss': 1.5767, 'learning_rate': 6.752078180694166e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6228/6779 [3:51:13<19:58,  2.17s/it] 92%|█████████▏| 6229/6779 [3:51:15<19:58,  2.18s/it]                                                     {'loss': 1.6616, 'learning_rate': 6.727861916654532e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6229/6779 [3:51:15<19:58,  2.18s/it] 92%|█████████▏| 6230/6779 [3:51:17<20:17,  2.22s/it]                                                     {'loss': 1.7084, 'learning_rate': 6.7036884134424435e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6230/6779 [3:51:17<20:17,  2.22s/it] 92%|█████████▏| 6231/6779 [3:51:19<20:33,  2.25s/it]                                                     {'loss': 1.6484, 'learning_rate': 6.679557676406245e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6231/6779 [3:51:19<20:33,  2.25s/it] 92%|█████████▏| 6232/6779 [3:51:22<20:06,  2.21s/it]                                                     {'loss': 1.5467, 'learning_rate': 6.6554697108847095e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6232/6779 [3:51:22<20:06,  2.21s/it] 92%|█████████▏| 6233/6779 [3:51:24<19:46,  2.17s/it]                                                     {'loss': 1.6267, 'learning_rate': 6.631424522207263e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6233/6779 [3:51:24<19:46,  2.17s/it] 92%|█████████▏| 6234/6779 [3:51:26<19:42,  2.17s/it]                                                     {'loss': 1.7037, 'learning_rate': 6.607422115693851e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6234/6779 [3:51:26<19:42,  2.17s/it] 92%|█████████▏| 6235/6779 [3:51:28<20:02,  2.21s/it]                                                     {'loss': 1.6722, 'learning_rate': 6.583462496654913e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6235/6779 [3:51:28<20:02,  2.21s/it] 92%|█████████▏| 6236/6779 [3:51:30<20:19,  2.24s/it]                                                     {'loss': 1.7182, 'learning_rate': 6.559545670391387e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6236/6779 [3:51:30<20:19,  2.24s/it] 92%|█████████▏| 6237/6779 [3:51:32<19:49,  2.19s/it]                                                     {'loss': 1.6888, 'learning_rate': 6.535671642194863e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6237/6779 [3:51:33<19:49,  2.19s/it] 92%|█████████▏| 6238/6779 [3:51:35<19:42,  2.19s/it]                                                     {'loss': 1.7902, 'learning_rate': 6.5118404173473365e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6238/6779 [3:51:35<19:42,  2.19s/it] 92%|█████████▏| 6239/6779 [3:51:37<19:38,  2.18s/it]                                                     {'loss': 1.5745, 'learning_rate': 6.488052001121458e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6239/6779 [3:51:37<19:38,  2.18s/it] 92%|█████████▏| 6240/6779 [3:51:39<19:54,  2.22s/it]                                                     {'loss': 1.5982, 'learning_rate': 6.46430639878024e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6240/6779 [3:51:39<19:54,  2.22s/it] 92%|█████████▏| 6241/6779 [3:51:41<19:15,  2.15s/it]                                                     {'loss': 1.6543, 'learning_rate': 6.440603615577367e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6241/6779 [3:51:41<19:15,  2.15s/it] 92%|█████████▏| 6242/6779 [3:51:43<19:25,  2.17s/it]                                                     {'loss': 1.713, 'learning_rate': 6.416943656757046e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6242/6779 [3:51:43<19:25,  2.17s/it] 92%|█████████▏| 6243/6779 [3:51:45<19:13,  2.15s/it]                                                     {'loss': 1.6708, 'learning_rate': 6.393326527553889e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6243/6779 [3:51:45<19:13,  2.15s/it] 92%|█████████▏| 6244/6779 [3:51:48<18:55,  2.12s/it]                                                     {'loss': 1.7385, 'learning_rate': 6.36975223319316e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6244/6779 [3:51:48<18:55,  2.12s/it] 92%|█████████▏| 6245/6779 [3:51:50<18:57,  2.13s/it]                                                     {'loss': 1.5419, 'learning_rate': 6.346220778890577e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6245/6779 [3:51:50<18:57,  2.13s/it] 92%|█████████▏| 6246/6779 [3:51:52<18:49,  2.12s/it]                                                     {'loss': 1.6251, 'learning_rate': 6.322732169852397e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6246/6779 [3:51:52<18:49,  2.12s/it] 92%|█████████▏| 6247/6779 [3:51:54<18:51,  2.13s/it]                                                     {'loss': 1.4721, 'learning_rate': 6.299286411275396e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6247/6779 [3:51:54<18:51,  2.13s/it] 92%|█████████▏| 6248/6779 [3:51:56<19:24,  2.19s/it]                                                     {'loss': 1.8238, 'learning_rate': 6.2758835083468695e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6248/6779 [3:51:56<19:24,  2.19s/it] 92%|█████████▏| 6249/6779 [3:51:58<19:23,  2.19s/it]                                                     {'loss': 1.6133, 'learning_rate': 6.252523466244653e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6249/6779 [3:51:58<19:23,  2.19s/it] 92%|█████████▏| 6250/6779 [3:52:01<20:05,  2.28s/it]                                                     {'loss': 1.7009, 'learning_rate': 6.229206290137035e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6250/6779 [3:52:01<20:05,  2.28s/it] 92%|█████████▏| 6251/6779 [3:52:03<19:46,  2.25s/it]                                                     {'loss': 1.578, 'learning_rate': 6.205931985182933e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6251/6779 [3:52:03<19:46,  2.25s/it] 92%|█████████▏| 6252/6779 [3:52:05<19:58,  2.27s/it]                                                     {'loss': 1.6024, 'learning_rate': 6.182700556531628e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6252/6779 [3:52:05<19:58,  2.27s/it] 92%|█████████▏| 6253/6779 [3:52:07<19:19,  2.20s/it]                                                     {'loss': 1.611, 'learning_rate': 6.159512009323076e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6253/6779 [3:52:07<19:19,  2.20s/it] 92%|█████████▏| 6254/6779 [3:52:10<19:28,  2.23s/it]                                                     {'loss': 1.5783, 'learning_rate': 6.136366348687617e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6254/6779 [3:52:10<19:28,  2.23s/it] 92%|█████████▏| 6255/6779 [3:52:12<19:29,  2.23s/it]                                                     {'loss': 1.593, 'learning_rate': 6.1132635797461535e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6255/6779 [3:52:12<19:29,  2.23s/it] 92%|█████████▏| 6256/6779 [3:52:14<19:04,  2.19s/it]                                                     {'loss': 1.613, 'learning_rate': 6.090203707610154e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6256/6779 [3:52:14<19:04,  2.19s/it] 92%|█████████▏| 6257/6779 [3:52:16<19:05,  2.19s/it]                                                     {'loss': 1.5123, 'learning_rate': 6.0671867373814475e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6257/6779 [3:52:16<19:05,  2.19s/it] 92%|█████████▏| 6258/6779 [3:52:18<18:59,  2.19s/it]                                                     {'loss': 1.6974, 'learning_rate': 6.0442126741525385e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6258/6779 [3:52:18<18:59,  2.19s/it] 92%|█████████▏| 6259/6779 [3:52:21<18:58,  2.19s/it]                                                     {'loss': 1.7857, 'learning_rate': 6.0212815230063395e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6259/6779 [3:52:21<18:58,  2.19s/it] 92%|█████████▏| 6260/6779 [3:52:23<18:45,  2.17s/it]                                                     {'loss': 1.6568, 'learning_rate': 5.998393289016302e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6260/6779 [3:52:23<18:45,  2.17s/it] 92%|█████████▏| 6261/6779 [3:52:25<19:26,  2.25s/it]                                                     {'loss': 1.8291, 'learning_rate': 5.975547977246332e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6261/6779 [3:52:25<19:26,  2.25s/it] 92%|█████████▏| 6262/6779 [3:52:27<19:04,  2.21s/it]                                                     {'loss': 1.6883, 'learning_rate': 5.952745592750897e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6262/6779 [3:52:27<19:04,  2.21s/it] 92%|█████████▏| 6263/6779 [3:52:30<19:07,  2.22s/it]                                                     {'loss': 1.5733, 'learning_rate': 5.929986140575006e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6263/6779 [3:52:30<19:07,  2.22s/it] 92%|█████████▏| 6264/6779 [3:52:32<19:07,  2.23s/it]                                                     {'loss': 1.5583, 'learning_rate': 5.907269625754031e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6264/6779 [3:52:32<19:07,  2.23s/it] 92%|█████████▏| 6265/6779 [3:52:34<18:21,  2.14s/it]                                                     {'loss': 1.8408, 'learning_rate': 5.8845960533139955e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6265/6779 [3:52:34<18:21,  2.14s/it] 92%|█████████▏| 6266/6779 [3:52:36<18:26,  2.16s/it]                                                     {'loss': 1.709, 'learning_rate': 5.86196542827131e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6266/6779 [3:52:36<18:26,  2.16s/it] 92%|█████████▏| 6267/6779 [3:52:38<18:37,  2.18s/it]                                                     {'loss': 1.7414, 'learning_rate': 5.8393777556329465e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6267/6779 [3:52:38<18:37,  2.18s/it] 92%|█████████▏| 6268/6779 [3:52:40<18:32,  2.18s/it]                                                     {'loss': 1.7219, 'learning_rate': 5.81683304039633e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6268/6779 [3:52:40<18:32,  2.18s/it] 92%|█████████▏| 6269/6779 [3:52:43<20:27,  2.41s/it]                                                     {'loss': 1.6727, 'learning_rate': 5.794331287549426e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6269/6779 [3:52:43<20:27,  2.41s/it] 92%|█████████▏| 6270/6779 [3:52:46<21:22,  2.52s/it]                                                     {'loss': 1.8706, 'learning_rate': 5.771872502070674e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6270/6779 [3:52:46<21:22,  2.52s/it] 93%|█████████▎| 6271/6779 [3:52:48<20:09,  2.38s/it]                                                     {'loss': 1.5615, 'learning_rate': 5.7494566889289895e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6271/6779 [3:52:48<20:09,  2.38s/it] 93%|█████████▎| 6272/6779 [3:52:51<20:33,  2.43s/it]                                                     {'loss': 1.7736, 'learning_rate': 5.727083853083825e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6272/6779 [3:52:51<20:33,  2.43s/it] 93%|█████████▎| 6273/6779 [3:52:53<19:48,  2.35s/it]                                                     {'loss': 1.578, 'learning_rate': 5.704753999485068e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6273/6779 [3:52:53<19:48,  2.35s/it] 93%|█████████▎| 6274/6779 [3:52:55<19:19,  2.30s/it]                                                     {'loss': 1.7139, 'learning_rate': 5.682467133073166e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6274/6779 [3:52:55<19:19,  2.30s/it] 93%|█████████▎| 6275/6779 [3:52:57<19:18,  2.30s/it]                                                     {'loss': 1.6235, 'learning_rate': 5.660223258778952e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6275/6779 [3:52:57<19:18,  2.30s/it] 93%|█████████▎| 6276/6779 [3:53:00<21:05,  2.52s/it]                                                     {'loss': 1.5136, 'learning_rate': 5.638022381523867e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6276/6779 [3:53:00<21:05,  2.52s/it] 93%|█████████▎| 6277/6779 [3:53:03<20:48,  2.49s/it]                                                     {'loss': 1.5452, 'learning_rate': 5.615864506219759e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6277/6779 [3:53:03<20:48,  2.49s/it] 93%|█████████▎| 6278/6779 [3:53:05<20:06,  2.41s/it]                                                     {'loss': 1.6941, 'learning_rate': 5.5937496377689745e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6278/6779 [3:53:05<20:06,  2.41s/it] 93%|█████████▎| 6279/6779 [3:53:07<19:23,  2.33s/it]                                                     {'loss': 1.8445, 'learning_rate': 5.571677781064399e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6279/6779 [3:53:07<19:23,  2.33s/it] 93%|█████████▎| 6280/6779 [3:53:09<19:13,  2.31s/it]                                                     {'loss': 1.7752, 'learning_rate': 5.549648940989305e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6280/6779 [3:53:09<19:13,  2.31s/it] 93%|█████████▎| 6281/6779 [3:53:12<19:05,  2.30s/it]                                                     {'loss': 1.6802, 'learning_rate': 5.527663122417548e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6281/6779 [3:53:12<19:05,  2.30s/it] 93%|█████████▎| 6282/6779 [3:53:14<18:38,  2.25s/it]                                                     {'loss': 1.7755, 'learning_rate': 5.5057203302133485e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6282/6779 [3:53:14<18:38,  2.25s/it] 93%|█████████▎| 6283/6779 [3:53:16<18:20,  2.22s/it]                                                     {'loss': 1.5997, 'learning_rate': 5.483820569231557e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6283/6779 [3:53:16<18:20,  2.22s/it] 93%|█████████▎| 6284/6779 [3:53:18<18:16,  2.21s/it]                                                     {'loss': 1.7066, 'learning_rate': 5.461963844317386e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6284/6779 [3:53:18<18:16,  2.21s/it] 93%|█████████▎| 6285/6779 [3:53:20<17:49,  2.16s/it]                                                     {'loss': 1.4354, 'learning_rate': 5.440150160306567e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6285/6779 [3:53:20<17:49,  2.16s/it] 93%|█████████▎| 6286/6779 [3:53:22<17:42,  2.15s/it]                                                     {'loss': 1.5585, 'learning_rate': 5.418379522025329e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6286/6779 [3:53:22<17:42,  2.15s/it] 93%|█████████▎| 6287/6779 [3:53:25<18:26,  2.25s/it]                                                     {'loss': 1.7124, 'learning_rate': 5.3966519342903085e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6287/6779 [3:53:25<18:26,  2.25s/it] 93%|█████████▎| 6288/6779 [3:53:27<18:12,  2.23s/it]                                                     {'loss': 1.6019, 'learning_rate': 5.374967401908726e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6288/6779 [3:53:27<18:12,  2.23s/it] 93%|█████████▎| 6289/6779 [3:53:29<17:56,  2.20s/it]                                                     {'loss': 1.6806, 'learning_rate': 5.3533259296781435e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6289/6779 [3:53:29<17:56,  2.20s/it] 93%|█████████▎| 6290/6779 [3:53:31<17:06,  2.10s/it]                                                     {'loss': 1.6494, 'learning_rate': 5.331727522386687e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6290/6779 [3:53:31<17:06,  2.10s/it] 93%|█████████▎| 6291/6779 [3:53:33<17:31,  2.15s/it]                                                     {'loss': 1.6238, 'learning_rate': 5.310172184812956e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6291/6779 [3:53:33<17:31,  2.15s/it] 93%|█████████▎| 6292/6779 [3:53:36<18:07,  2.23s/it]                                                     {'loss': 1.5332, 'learning_rate': 5.288659921726003e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6292/6779 [3:53:36<18:07,  2.23s/it] 93%|█████████▎| 6293/6779 [3:53:38<18:23,  2.27s/it]                                                     {'loss': 1.6039, 'learning_rate': 5.267190737885308e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6293/6779 [3:53:38<18:23,  2.27s/it] 93%|█████████▎| 6294/6779 [3:53:40<18:05,  2.24s/it]                                                     {'loss': 1.6757, 'learning_rate': 5.245764638040895e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6294/6779 [3:53:40<18:05,  2.24s/it] 93%|█████████▎| 6295/6779 [3:53:42<18:01,  2.23s/it]                                                     {'loss': 1.6381, 'learning_rate': 5.224381626933217e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6295/6779 [3:53:42<18:01,  2.23s/it] 93%|█████████▎| 6296/6779 [3:53:44<17:32,  2.18s/it]                                                     {'loss': 1.6853, 'learning_rate': 5.203041709293155e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6296/6779 [3:53:44<17:32,  2.18s/it] 93%|█████████▎| 6297/6779 [3:53:47<17:42,  2.20s/it]                                                     {'loss': 1.5671, 'learning_rate': 5.181744889842132e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6297/6779 [3:53:47<17:42,  2.20s/it] 93%|█████████▎| 6298/6779 [3:53:49<17:15,  2.15s/it]                                                     {'loss': 1.5754, 'learning_rate': 5.160491173291982e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6298/6779 [3:53:49<17:15,  2.15s/it] 93%|█████████▎| 6299/6779 [3:53:51<17:41,  2.21s/it]                                                     {'loss': 1.5267, 'learning_rate': 5.139280564345028e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6299/6779 [3:53:51<17:41,  2.21s/it] 93%|█████████▎| 6300/6779 [3:53:53<16:59,  2.13s/it]                                                     {'loss': 1.6522, 'learning_rate': 5.118113067694052e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6300/6779 [3:53:53<16:59,  2.13s/it] 93%|█████████▎| 6301/6779 [3:53:55<17:09,  2.15s/it]                                                     {'loss': 1.7085, 'learning_rate': 5.0969886880223084e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6301/6779 [3:53:55<17:09,  2.15s/it] 93%|█████████▎| 6302/6779 [3:53:57<16:53,  2.12s/it]                                                     {'loss': 1.4807, 'learning_rate': 5.075907430003435e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6302/6779 [3:53:57<16:53,  2.12s/it] 93%|█████████▎| 6303/6779 [3:54:00<16:57,  2.14s/it]                                                     {'loss': 1.7655, 'learning_rate': 5.054869298301679e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6303/6779 [3:54:00<16:57,  2.14s/it] 93%|█████████▎| 6304/6779 [3:54:02<17:03,  2.15s/it]                                                     {'loss': 1.5723, 'learning_rate': 5.033874297571583e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6304/6779 [3:54:02<17:03,  2.15s/it] 93%|█████████▎| 6305/6779 [3:54:04<16:36,  2.10s/it]                                                     {'loss': 1.6579, 'learning_rate': 5.012922432458256e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6305/6779 [3:54:04<16:36,  2.10s/it] 93%|█████████▎| 6306/6779 [3:54:06<16:44,  2.12s/it]                                                     {'loss': 1.6452, 'learning_rate': 4.992013707597232e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6306/6779 [3:54:06<16:44,  2.12s/it] 93%|█████████▎| 6307/6779 [3:54:08<16:48,  2.14s/it]                                                     {'loss': 1.679, 'learning_rate': 4.971148127614478e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6307/6779 [3:54:08<16:48,  2.14s/it] 93%|█████████▎| 6308/6779 [3:54:10<16:35,  2.11s/it]                                                     {'loss': 1.509, 'learning_rate': 4.950325697126479e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6308/6779 [3:54:10<16:35,  2.11s/it] 93%|█████████▎| 6309/6779 [3:54:12<16:29,  2.10s/it]                                                     {'loss': 1.4581, 'learning_rate': 4.929546420740061e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6309/6779 [3:54:12<16:29,  2.10s/it] 93%|█████████▎| 6310/6779 [3:54:14<16:42,  2.14s/it]                                                     {'loss': 1.6829, 'learning_rate': 4.908810303052636e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6310/6779 [3:54:14<16:42,  2.14s/it] 93%|█████████▎| 6311/6779 [3:54:17<16:41,  2.14s/it]                                                     {'loss': 1.7059, 'learning_rate': 4.888117348651955e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6311/6779 [3:54:17<16:41,  2.14s/it] 93%|█████████▎| 6312/6779 [3:54:19<17:00,  2.19s/it]                                                     {'loss': 1.4045, 'learning_rate': 4.86746756211629e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6312/6779 [3:54:19<17:00,  2.19s/it] 93%|█████████▎| 6313/6779 [3:54:21<16:52,  2.17s/it]                                                     {'loss': 1.5169, 'learning_rate': 4.846860948014364e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6313/6779 [3:54:21<16:52,  2.17s/it] 93%|█████████▎| 6314/6779 [3:54:23<16:27,  2.12s/it]                                                     {'loss': 1.7226, 'learning_rate': 4.826297510905242e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6314/6779 [3:54:23<16:27,  2.12s/it] 93%|█████████▎| 6315/6779 [3:54:25<16:55,  2.19s/it]                                                     {'loss': 1.5841, 'learning_rate': 4.8057772553386175e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6315/6779 [3:54:25<16:55,  2.19s/it] 93%|█████████▎| 6316/6779 [3:54:27<16:40,  2.16s/it]                                                     {'loss': 1.531, 'learning_rate': 4.785300185854458e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6316/6779 [3:54:27<16:40,  2.16s/it] 93%|█████████▎| 6317/6779 [3:54:29<16:21,  2.13s/it]                                                     {'loss': 1.6359, 'learning_rate': 4.764866306983273e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6317/6779 [3:54:29<16:21,  2.13s/it] 93%|█████████▎| 6318/6779 [3:54:32<16:39,  2.17s/it]                                                     {'loss': 1.7848, 'learning_rate': 4.744475623246003e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6318/6779 [3:54:32<16:39,  2.17s/it] 93%|█████████▎| 6319/6779 [3:54:34<17:01,  2.22s/it]                                                     {'loss': 1.8942, 'learning_rate': 4.724128139153972e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6319/6779 [3:54:34<17:01,  2.22s/it] 93%|█████████▎| 6320/6779 [3:54:36<16:46,  2.19s/it]                                                     {'loss': 1.5766, 'learning_rate': 4.703823859209066e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6320/6779 [3:54:36<16:46,  2.19s/it] 93%|█████████▎| 6321/6779 [3:54:38<16:25,  2.15s/it]                                                     {'loss': 1.6027, 'learning_rate': 4.683562787903495e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6321/6779 [3:54:38<16:25,  2.15s/it] 93%|█████████▎| 6322/6779 [3:54:40<16:01,  2.10s/it]                                                     {'loss': 1.7105, 'learning_rate': 4.663344929719959e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6322/6779 [3:54:40<16:01,  2.10s/it] 93%|█████████▎| 6323/6779 [3:54:42<16:11,  2.13s/it]                                                     {'loss': 1.8085, 'learning_rate': 4.643170289131593e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6323/6779 [3:54:42<16:11,  2.13s/it] 93%|█████████▎| 6324/6779 [3:54:45<16:14,  2.14s/it]                                                     {'loss': 1.6791, 'learning_rate': 4.6230388706019815e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6324/6779 [3:54:45<16:14,  2.14s/it] 93%|█████████▎| 6325/6779 [3:54:47<16:27,  2.17s/it]                                                     {'loss': 1.7094, 'learning_rate': 4.602950678585116e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6325/6779 [3:54:47<16:27,  2.17s/it] 93%|█████████▎| 6326/6779 [3:54:49<16:26,  2.18s/it]                                                     {'loss': 1.6337, 'learning_rate': 4.582905717525443e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6326/6779 [3:54:49<16:26,  2.18s/it] 93%|█████████▎| 6327/6779 [3:54:51<16:02,  2.13s/it]                                                     {'loss': 1.5669, 'learning_rate': 4.562903991857881e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6327/6779 [3:54:51<16:02,  2.13s/it] 93%|█████████▎| 6328/6779 [3:54:53<16:00,  2.13s/it]                                                     {'loss': 1.5326, 'learning_rate': 4.542945506007712e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6328/6779 [3:54:53<16:00,  2.13s/it] 93%|█████████▎| 6329/6779 [3:54:55<16:15,  2.17s/it]                                                     {'loss': 1.6044, 'learning_rate': 4.523030264390715e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6329/6779 [3:54:55<16:15,  2.17s/it] 93%|█████████▎| 6330/6779 [3:54:57<15:48,  2.11s/it]                                                     {'loss': 1.4474, 'learning_rate': 4.503158271413033e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6330/6779 [3:54:57<15:48,  2.11s/it] 93%|█████████▎| 6331/6779 [3:54:59<15:34,  2.09s/it]                                                     {'loss': 1.4843, 'learning_rate': 4.483329531471303e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6331/6779 [3:54:59<15:34,  2.09s/it] 93%|█████████▎| 6332/6779 [3:55:02<15:45,  2.11s/it]                                                     {'loss': 1.6446, 'learning_rate': 4.463544048952551e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6332/6779 [3:55:02<15:45,  2.11s/it] 93%|█████████▎| 6333/6779 [3:55:04<15:54,  2.14s/it]                                                     {'loss': 1.6281, 'learning_rate': 4.443801828234273e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6333/6779 [3:55:04<15:54,  2.14s/it] 93%|█████████▎| 6334/6779 [3:55:06<15:50,  2.14s/it]                                                     {'loss': 1.5069, 'learning_rate': 4.424102873684355e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6334/6779 [3:55:06<15:50,  2.14s/it] 93%|█████████▎| 6335/6779 [3:55:08<16:23,  2.22s/it]                                                     {'loss': 1.5617, 'learning_rate': 4.404447189661132e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6335/6779 [3:55:08<16:23,  2.22s/it] 93%|█████████▎| 6336/6779 [3:55:10<15:47,  2.14s/it]                                                     {'loss': 1.5601, 'learning_rate': 4.384834780513391e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6336/6779 [3:55:10<15:47,  2.14s/it] 93%|█████████▎| 6337/6779 [3:55:12<15:41,  2.13s/it]                                                     {'loss': 1.6373, 'learning_rate': 4.365265650580241e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6337/6779 [3:55:12<15:41,  2.13s/it] 93%|█████████▎| 6338/6779 [3:55:15<16:03,  2.18s/it]                                                     {'loss': 1.613, 'learning_rate': 4.345739804191351e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6338/6779 [3:55:15<16:03,  2.18s/it] 94%|█████████▎| 6339/6779 [3:55:17<15:44,  2.15s/it]                                                     {'loss': 1.6425, 'learning_rate': 4.326257245666709e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6339/6779 [3:55:17<15:44,  2.15s/it] 94%|█████████▎| 6340/6779 [3:55:19<16:09,  2.21s/it]                                                     {'loss': 1.6697, 'learning_rate': 4.3068179793168014e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6340/6779 [3:55:19<16:09,  2.21s/it] 94%|█████████▎| 6341/6779 [3:55:21<16:09,  2.21s/it]                                                     {'loss': 1.6326, 'learning_rate': 4.287422009442499e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6341/6779 [3:55:21<16:09,  2.21s/it] 94%|█████████▎| 6342/6779 [3:55:24<16:18,  2.24s/it]                                                     {'loss': 1.5806, 'learning_rate': 4.268069340335057e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6342/6779 [3:55:24<16:18,  2.24s/it] 94%|█████████▎| 6343/6779 [3:55:26<16:18,  2.25s/it]                                                     {'loss': 1.4425, 'learning_rate': 4.248759976276251e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6343/6779 [3:55:26<16:18,  2.25s/it] 94%|█████████▎| 6344/6779 [3:55:28<16:21,  2.26s/it]                                                     {'loss': 1.557, 'learning_rate': 4.229493921538152e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6344/6779 [3:55:28<16:21,  2.26s/it] 94%|█████████▎| 6345/6779 [3:55:30<16:07,  2.23s/it]                                                     {'loss': 1.5747, 'learning_rate': 4.210271180383374e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6345/6779 [3:55:30<16:07,  2.23s/it] 94%|█████████▎| 6346/6779 [3:55:33<15:58,  2.21s/it]                                                     {'loss': 1.7054, 'learning_rate': 4.191091757064802e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6346/6779 [3:55:33<15:58,  2.21s/it] 94%|█████████▎| 6347/6779 [3:55:35<16:20,  2.27s/it]                                                     {'loss': 1.5486, 'learning_rate': 4.17195565582591e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6347/6779 [3:55:35<16:20,  2.27s/it] 94%|█████████▎| 6348/6779 [3:55:37<16:21,  2.28s/it]                                                     {'loss': 1.5512, 'learning_rate': 4.152862880900465e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6348/6779 [3:55:37<16:21,  2.28s/it] 94%|█████████▎| 6349/6779 [3:55:40<17:13,  2.40s/it]                                                     {'loss': 1.7099, 'learning_rate': 4.133813436512668e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6349/6779 [3:55:40<17:13,  2.40s/it] 94%|█████████▎| 6350/6779 [3:55:42<16:43,  2.34s/it]                                                     {'loss': 1.5371, 'learning_rate': 4.1148073268771455e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6350/6779 [3:55:42<16:43,  2.34s/it] 94%|█████████▎| 6351/6779 [3:55:44<16:11,  2.27s/it]                                                     {'loss': 1.8071, 'learning_rate': 4.095844556198958e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6351/6779 [3:55:44<16:11,  2.27s/it] 94%|█████████▎| 6352/6779 [3:55:47<16:10,  2.27s/it]                                                     {'loss': 1.6405, 'learning_rate': 4.076925128673525e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6352/6779 [3:55:47<16:10,  2.27s/it] 94%|█████████▎| 6353/6779 [3:55:49<16:31,  2.33s/it]                                                     {'loss': 1.843, 'learning_rate': 4.058049048486723e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6353/6779 [3:55:49<16:31,  2.33s/it] 94%|█████████▎| 6354/6779 [3:55:51<15:43,  2.22s/it]                                                     {'loss': 1.7212, 'learning_rate': 4.039216319814831e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6354/6779 [3:55:51<15:43,  2.22s/it] 94%|█████████▎| 6355/6779 [3:55:53<15:52,  2.25s/it]                                                     {'loss': 1.6518, 'learning_rate': 4.020426946824541e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6355/6779 [3:55:53<15:52,  2.25s/it] 94%|█████████▍| 6356/6779 [3:55:56<16:03,  2.28s/it]                                                     {'loss': 1.8635, 'learning_rate': 4.001680933672925e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6356/6779 [3:55:56<16:03,  2.28s/it] 94%|█████████▍| 6357/6779 [3:55:58<16:20,  2.32s/it]                                                     {'loss': 1.7334, 'learning_rate': 3.982978284507466e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6357/6779 [3:55:58<16:20,  2.32s/it] 94%|█████████▍| 6358/6779 [3:56:00<15:51,  2.26s/it]                                                     {'loss': 1.5416, 'learning_rate': 3.964319003466055e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6358/6779 [3:56:00<15:51,  2.26s/it] 94%|█████████▍| 6359/6779 [3:56:02<15:31,  2.22s/it]                                                     {'loss': 1.5091, 'learning_rate': 3.945703094677033e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6359/6779 [3:56:02<15:31,  2.22s/it] 94%|█████████▍| 6360/6779 [3:56:05<15:48,  2.26s/it]                                                     {'loss': 1.8242, 'learning_rate': 3.927130562259085e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6360/6779 [3:56:05<15:48,  2.26s/it] 94%|█████████▍| 6361/6779 [3:56:07<15:23,  2.21s/it]                                                     {'loss': 1.7633, 'learning_rate': 3.908601410321322e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6361/6779 [3:56:07<15:23,  2.21s/it] 94%|█████████▍| 6362/6779 [3:56:09<16:12,  2.33s/it]                                                     {'loss': 1.5604, 'learning_rate': 3.890115642963265e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6362/6779 [3:56:09<16:12,  2.33s/it] 94%|█████████▍| 6363/6779 [3:56:11<15:32,  2.24s/it]                                                     {'loss': 1.6254, 'learning_rate': 3.8716732642748445e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6363/6779 [3:56:11<15:32,  2.24s/it] 94%|█████████▍| 6364/6779 [3:56:14<15:33,  2.25s/it]                                                     {'loss': 1.8383, 'learning_rate': 3.853274278336349e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6364/6779 [3:56:14<15:33,  2.25s/it] 94%|█████████▍| 6365/6779 [3:56:16<15:05,  2.19s/it]                                                     {'loss': 1.56, 'learning_rate': 3.834918689218503e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6365/6779 [3:56:16<15:05,  2.19s/it] 94%|█████████▍| 6366/6779 [3:56:18<14:47,  2.15s/it]                                                     {'loss': 1.5454, 'learning_rate': 3.816606500982456e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6366/6779 [3:56:18<14:47,  2.15s/it] 94%|█████████▍| 6367/6779 [3:56:20<14:42,  2.14s/it]                                                     {'loss': 1.6987, 'learning_rate': 3.7983377176796563e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6367/6779 [3:56:20<14:42,  2.14s/it] 94%|█████████▍| 6368/6779 [3:56:22<14:19,  2.09s/it]                                                     {'loss': 1.6464, 'learning_rate': 3.780112343352027e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6368/6779 [3:56:22<14:19,  2.09s/it] 94%|█████████▍| 6369/6779 [3:56:24<14:00,  2.05s/it]                                                     {'loss': 1.6683, 'learning_rate': 3.7619303820318974e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6369/6779 [3:56:24<14:00,  2.05s/it] 94%|█████████▍| 6370/6779 [3:56:26<14:16,  2.09s/it]                                                     {'loss': 1.6847, 'learning_rate': 3.7437918377419835e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6370/6779 [3:56:26<14:16,  2.09s/it] 94%|█████████▍| 6371/6779 [3:56:28<14:21,  2.11s/it]                                                     {'loss': 1.5567, 'learning_rate': 3.7256967144953414e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6371/6779 [3:56:28<14:21,  2.11s/it] 94%|█████████▍| 6372/6779 [3:56:31<15:01,  2.22s/it]                                                     {'loss': 1.7332, 'learning_rate': 3.70764501629548e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6372/6779 [3:56:31<15:01,  2.22s/it] 94%|█████████▍| 6373/6779 [3:56:33<14:42,  2.17s/it]                                                     {'loss': 1.7237, 'learning_rate': 3.689636747136227e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6373/6779 [3:56:33<14:42,  2.17s/it] 94%|█████████▍| 6374/6779 [3:56:35<14:56,  2.21s/it]                                                     {'loss': 1.7337, 'learning_rate': 3.6716719110019505e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6374/6779 [3:56:35<14:56,  2.21s/it] 94%|█████████▍| 6375/6779 [3:56:37<14:35,  2.17s/it]                                                     {'loss': 1.6661, 'learning_rate': 3.6537505118672044e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6375/6779 [3:56:37<14:35,  2.17s/it] 94%|█████████▍| 6376/6779 [3:56:39<14:35,  2.17s/it]                                                     {'loss': 1.5606, 'learning_rate': 3.635872553697106e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6376/6779 [3:56:39<14:35,  2.17s/it] 94%|█████████▍| 6377/6779 [3:56:41<14:26,  2.16s/it]                                                     {'loss': 1.7623, 'learning_rate': 3.618038040447114e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6377/6779 [3:56:41<14:26,  2.16s/it] 94%|█████████▍| 6378/6779 [3:56:44<14:37,  2.19s/it]                                                     {'loss': 1.655, 'learning_rate': 3.600246976062982e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6378/6779 [3:56:44<14:37,  2.19s/it] 94%|█████████▍| 6379/6779 [3:56:46<14:25,  2.16s/it]                                                     {'loss': 1.7495, 'learning_rate': 3.5824993644809845e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6379/6779 [3:56:46<14:25,  2.16s/it] 94%|█████████▍| 6380/6779 [3:56:48<15:01,  2.26s/it]                                                     {'loss': 1.6572, 'learning_rate': 3.5647952096276917e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6380/6779 [3:56:48<15:01,  2.26s/it] 94%|█████████▍| 6381/6779 [3:56:50<15:00,  2.26s/it]                                                     {'loss': 1.6646, 'learning_rate': 3.547134515420103e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6381/6779 [3:56:50<15:00,  2.26s/it] 94%|█████████▍| 6382/6779 [3:56:54<16:53,  2.55s/it]                                                     {'loss': 1.5811, 'learning_rate': 3.5295172857655824e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6382/6779 [3:56:54<16:53,  2.55s/it] 94%|█████████▍| 6383/6779 [3:56:56<16:20,  2.48s/it]                                                     {'loss': 1.634, 'learning_rate': 3.511943524561878e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6383/6779 [3:56:56<16:20,  2.48s/it] 94%|█████████▍| 6384/6779 [3:56:58<15:56,  2.42s/it]                                                     {'loss': 1.6526, 'learning_rate': 3.4944132356971693e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6384/6779 [3:56:58<15:56,  2.42s/it] 94%|█████████▍| 6385/6779 [3:57:00<15:19,  2.33s/it]                                                     {'loss': 1.6557, 'learning_rate': 3.476926423049931e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6385/6779 [3:57:00<15:19,  2.33s/it] 94%|█████████▍| 6386/6779 [3:57:03<14:55,  2.28s/it]                                                     {'loss': 1.7822, 'learning_rate': 3.4594830904890683e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6386/6779 [3:57:03<14:55,  2.28s/it] 94%|█████████▍| 6387/6779 [3:57:05<14:51,  2.27s/it]                                                     {'loss': 1.6149, 'learning_rate': 3.4420832418738726e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6387/6779 [3:57:05<14:51,  2.27s/it] 94%|█████████▍| 6388/6779 [3:57:07<14:34,  2.24s/it]                                                     {'loss': 1.588, 'learning_rate': 3.4247268810539967e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6388/6779 [3:57:07<14:34,  2.24s/it] 94%|█████████▍| 6389/6779 [3:57:09<14:29,  2.23s/it]                                                     {'loss': 1.6667, 'learning_rate': 3.407414011869481e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6389/6779 [3:57:09<14:29,  2.23s/it] 94%|█████████▍| 6390/6779 [3:57:11<14:13,  2.20s/it]                                                     {'loss': 1.6512, 'learning_rate': 3.3901446381507273e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6390/6779 [3:57:11<14:13,  2.20s/it] 94%|█████████▍| 6391/6779 [3:57:14<14:32,  2.25s/it]                                                     {'loss': 1.5698, 'learning_rate': 3.372918763718569e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6391/6779 [3:57:14<14:32,  2.25s/it] 94%|█████████▍| 6392/6779 [3:57:16<14:17,  2.22s/it]                                                     {'loss': 1.6498, 'learning_rate': 3.3557363923841343e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6392/6779 [3:57:16<14:17,  2.22s/it] 94%|█████████▍| 6393/6779 [3:57:18<14:22,  2.23s/it]                                                     {'loss': 1.5798, 'learning_rate': 3.3385975279489832e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6393/6779 [3:57:18<14:22,  2.23s/it] 94%|█████████▍| 6394/6779 [3:57:20<14:05,  2.20s/it]                                                     {'loss': 1.5744, 'learning_rate': 3.3215021742050158e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6394/6779 [3:57:20<14:05,  2.20s/it] 94%|█████████▍| 6395/6779 [3:57:22<13:44,  2.15s/it]                                                     {'loss': 1.523, 'learning_rate': 3.3044503349345614e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6395/6779 [3:57:22<13:44,  2.15s/it] 94%|█████████▍| 6396/6779 [3:57:24<13:54,  2.18s/it]                                                     {'loss': 1.5143, 'learning_rate': 3.287442013910247e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6396/6779 [3:57:24<13:54,  2.18s/it] 94%|█████████▍| 6397/6779 [3:57:27<13:53,  2.18s/it]                                                     {'loss': 1.7063, 'learning_rate': 3.2704772148951067e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6397/6779 [3:57:27<13:53,  2.18s/it] 94%|█████████▍| 6398/6779 [3:57:29<13:56,  2.20s/it]                                                     {'loss': 1.4863, 'learning_rate': 3.253555941642583e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6398/6779 [3:57:29<13:56,  2.20s/it] 94%|█████████▍| 6399/6779 [3:57:31<13:59,  2.21s/it]                                                     {'loss': 1.6898, 'learning_rate': 3.2366781978964144e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6399/6779 [3:57:31<13:59,  2.21s/it] 94%|█████████▍| 6400/6779 [3:57:34<14:21,  2.27s/it]                                                     {'loss': 1.7964, 'learning_rate': 3.2198439873907694e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6400/6779 [3:57:34<14:21,  2.27s/it] 94%|█████████▍| 6401/6779 [3:57:36<14:00,  2.22s/it]                                                     {'loss': 1.5999, 'learning_rate': 3.2030533138501575e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6401/6779 [3:57:36<14:00,  2.22s/it] 94%|█████████▍| 6402/6779 [3:57:38<14:06,  2.25s/it]                                                     {'loss': 1.6419, 'learning_rate': 3.1863061809894512e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6402/6779 [3:57:38<14:06,  2.25s/it] 94%|█████████▍| 6403/6779 [3:57:40<13:36,  2.17s/it]                                                     {'loss': 1.6986, 'learning_rate': 3.1696025925139095e-06, 'epoch': 0.94}
+ 94%|��████████▍| 6403/6779 [3:57:40<13:36,  2.17s/it] 94%|█████████▍| 6404/6779 [3:57:42<13:12,  2.11s/it]                                                     {'loss': 1.6914, 'learning_rate': 3.152942552119109e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6404/6779 [3:57:42<13:12,  2.11s/it] 94%|█████████▍| 6405/6779 [3:57:45<14:22,  2.31s/it]                                                     {'loss': 1.6142, 'learning_rate': 3.136326063491102e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6405/6779 [3:57:45<14:22,  2.31s/it] 94%|█████████▍| 6406/6779 [3:57:47<13:42,  2.20s/it]                                                     {'loss': 1.5544, 'learning_rate': 3.1197531303061687e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6406/6779 [3:57:47<13:42,  2.20s/it] 95%|█████████▍| 6407/6779 [3:57:49<13:21,  2.16s/it]                                                     {'loss': 1.5717, 'learning_rate': 3.1032237562310663e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6407/6779 [3:57:49<13:21,  2.16s/it] 95%|█████████▍| 6408/6779 [3:57:51<13:12,  2.14s/it]                                                     {'loss': 1.651, 'learning_rate': 3.0867379449228018e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6408/6779 [3:57:51<13:12,  2.14s/it] 95%|█████████▍| 6409/6779 [3:57:53<13:09,  2.13s/it]                                                     {'loss': 1.5096, 'learning_rate': 3.07029570002888e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6409/6779 [3:57:53<13:09,  2.13s/it] 95%|█████████▍| 6410/6779 [3:57:55<13:01,  2.12s/it]                                                     {'loss': 1.4339, 'learning_rate': 3.0538970251870357e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6410/6779 [3:57:55<13:01,  2.12s/it] 95%|█████████▍| 6411/6779 [3:57:57<13:06,  2.14s/it]                                                     {'loss': 1.5192, 'learning_rate': 3.037541924025433e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6411/6779 [3:57:57<13:06,  2.14s/it] 95%|█████████▍| 6412/6779 [3:57:59<13:02,  2.13s/it]                                                     {'loss': 1.5235, 'learning_rate': 3.0212304001626224e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6412/6779 [3:57:59<13:02,  2.13s/it] 95%|█████████▍| 6413/6779 [3:58:02<13:23,  2.20s/it]                                                     {'loss': 1.6614, 'learning_rate': 3.0049624572074275e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6413/6779 [3:58:02<13:23,  2.20s/it] 95%|█████████▍| 6414/6779 [3:58:04<13:09,  2.16s/it]                                                     {'loss': 1.6197, 'learning_rate': 2.988738098759103e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6414/6779 [3:58:04<13:09,  2.16s/it] 95%|█████████▍| 6415/6779 [3:58:06<12:44,  2.10s/it]                                                     {'loss': 1.5872, 'learning_rate': 2.9725573284072216e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6415/6779 [3:58:06<12:44,  2.10s/it] 95%|█████████▍| 6416/6779 [3:58:08<13:12,  2.18s/it]                                                     {'loss': 1.8542, 'learning_rate': 2.9564201497317424e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6416/6779 [3:58:08<13:12,  2.18s/it] 95%|█████████▍| 6417/6779 [3:58:10<13:06,  2.17s/it]                                                     {'loss': 1.7491, 'learning_rate': 2.9403265663029202e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6417/6779 [3:58:10<13:06,  2.17s/it] 95%|█████████▍| 6418/6779 [3:58:13<13:21,  2.22s/it]                                                     {'loss': 1.6047, 'learning_rate': 2.9242765816814843e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6418/6779 [3:58:13<13:21,  2.22s/it] 95%|█████████▍| 6419/6779 [3:58:15<13:02,  2.17s/it]                                                     {'loss': 1.586, 'learning_rate': 2.9082701994183946e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6419/6779 [3:58:15<13:02,  2.17s/it] 95%|█████████▍| 6420/6779 [3:58:17<13:31,  2.26s/it]                                                     {'loss': 1.6728, 'learning_rate': 2.8923074230549963e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6420/6779 [3:58:17<13:31,  2.26s/it] 95%|█████████▍| 6421/6779 [3:58:19<13:32,  2.27s/it]                                                     {'loss': 1.6279, 'learning_rate': 2.8763882561230416e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6421/6779 [3:58:19<13:32,  2.27s/it] 95%|█████████▍| 6422/6779 [3:58:22<13:26,  2.26s/it]                                                     {'loss': 1.858, 'learning_rate': 2.8605127021445577e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6422/6779 [3:58:22<13:26,  2.26s/it] 95%|█████████▍| 6423/6779 [3:58:24<13:25,  2.26s/it]                                                     {'loss': 1.7113, 'learning_rate': 2.8446807646319795e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6423/6779 [3:58:24<13:25,  2.26s/it] 95%|█████████▍| 6424/6779 [3:58:26<13:09,  2.22s/it]                                                     {'loss': 1.749, 'learning_rate': 2.8288924470880384e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6424/6779 [3:58:26<13:09,  2.22s/it] 95%|█████████▍| 6425/6779 [3:58:28<13:25,  2.27s/it]                                                     {'loss': 1.688, 'learning_rate': 2.813147753005896e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6425/6779 [3:58:28<13:25,  2.27s/it] 95%|█████████▍| 6426/6779 [3:58:31<13:05,  2.22s/it]                                                     {'loss': 1.4847, 'learning_rate': 2.7974466858689876e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6426/6779 [3:58:31<13:05,  2.22s/it] 95%|█████████▍| 6427/6779 [3:58:33<13:06,  2.23s/it]                                                     {'loss': 1.8007, 'learning_rate': 2.7817892491511565e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6427/6779 [3:58:33<13:06,  2.23s/it] 95%|█████████▍| 6428/6779 [3:58:35<13:00,  2.22s/it]                                                     {'loss': 1.6678, 'learning_rate': 2.7661754463165213e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6428/6779 [3:58:35<13:00,  2.22s/it] 95%|█████████▍| 6429/6779 [3:58:37<13:00,  2.23s/it]                                                     {'loss': 1.5327, 'learning_rate': 2.7506052808195625e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6429/6779 [3:58:37<13:00,  2.23s/it] 95%|█████████▍| 6430/6779 [3:58:39<12:58,  2.23s/it]                                                     {'loss': 1.4722, 'learning_rate': 2.7350787561051916e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6430/6779 [3:58:39<12:58,  2.23s/it] 95%|█████████▍| 6431/6779 [3:58:41<12:38,  2.18s/it]                                                     {'loss': 1.649, 'learning_rate': 2.7195958756085493e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6431/6779 [3:58:42<12:38,  2.18s/it] 95%|█████████▍| 6432/6779 [3:58:44<12:44,  2.20s/it]                                                     {'loss': 1.6122, 'learning_rate': 2.704156642755207e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6432/6779 [3:58:44<12:44,  2.20s/it] 95%|█████████▍| 6433/6779 [3:58:46<12:31,  2.17s/it]                                                     {'loss': 1.887, 'learning_rate': 2.688761060961009e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6433/6779 [3:58:46<12:31,  2.17s/it] 95%|█████████▍| 6434/6779 [3:58:48<12:39,  2.20s/it]                                                     {'loss': 1.7114, 'learning_rate': 2.673409133632232e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6434/6779 [3:58:48<12:39,  2.20s/it] 95%|█████████▍| 6435/6779 [3:58:50<12:40,  2.21s/it]                                                     {'loss': 1.7861, 'learning_rate': 2.6581008641653804e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6435/6779 [3:58:50<12:40,  2.21s/it] 95%|█████████▍| 6436/6779 [3:58:53<12:43,  2.23s/it]                                                     {'loss': 1.637, 'learning_rate': 2.6428362559474117e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6436/6779 [3:58:53<12:43,  2.23s/it] 95%|█████████▍| 6437/6779 [3:58:55<13:17,  2.33s/it]                                                     {'loss': 1.5568, 'learning_rate': 2.627615312355536e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6437/6779 [3:58:55<13:17,  2.33s/it] 95%|█████████▍| 6438/6779 [3:58:57<13:02,  2.29s/it]                                                     {'loss': 1.5448, 'learning_rate': 2.6124380367573255e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6438/6779 [3:58:57<13:02,  2.29s/it] 95%|█████████▍| 6439/6779 [3:58:59<12:33,  2.22s/it]                                                     {'loss': 1.5761, 'learning_rate': 2.5973044325107165e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6439/6779 [3:58:59<12:33,  2.22s/it] 95%|█████████▍| 6440/6779 [3:59:02<12:53,  2.28s/it]                                                     {'loss': 1.5631, 'learning_rate': 2.5822145029639865e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6440/6779 [3:59:02<12:53,  2.28s/it] 95%|█████████▌| 6441/6779 [3:59:04<13:12,  2.34s/it]                                                     {'loss': 1.7043, 'learning_rate': 2.5671682514557316e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6441/6779 [3:59:04<13:12,  2.34s/it] 95%|█████████▌| 6442/6779 [3:59:07<12:55,  2.30s/it]                                                     {'loss': 1.5958, 'learning_rate': 2.5521656813148665e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6442/6779 [3:59:07<12:55,  2.30s/it] 95%|█████████▌| 6443/6779 [3:59:09<12:39,  2.26s/it]                                                     {'loss': 1.6115, 'learning_rate': 2.537206795860669e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6443/6779 [3:59:09<12:39,  2.26s/it] 95%|█████████▌| 6444/6779 [3:59:11<12:20,  2.21s/it]                                                     {'loss': 1.5946, 'learning_rate': 2.5222915984027373e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6444/6779 [3:59:11<12:20,  2.21s/it] 95%|█████████▌| 6445/6779 [3:59:13<12:01,  2.16s/it]                                                     {'loss': 1.4496, 'learning_rate': 2.507420092241053e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6445/6779 [3:59:13<12:01,  2.16s/it] 95%|█████████▌| 6446/6779 [3:59:15<11:59,  2.16s/it]                                                     {'loss': 1.5088, 'learning_rate': 2.4925922806658065e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6446/6779 [3:59:15<11:59,  2.16s/it] 95%|█████████▌| 6447/6779 [3:59:17<11:51,  2.14s/it]                                                     {'loss': 1.601, 'learning_rate': 2.4778081669576626e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6447/6779 [3:59:17<11:51,  2.14s/it] 95%|█████████▌| 6448/6779 [3:59:19<11:59,  2.17s/it]                                                     {'loss': 1.6739, 'learning_rate': 2.4630677543875602e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6448/6779 [3:59:19<11:59,  2.17s/it] 95%|█████████▌| 6449/6779 [3:59:21<11:49,  2.15s/it]                                                     {'loss': 1.6199, 'learning_rate': 2.448371046216713e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6449/6779 [3:59:21<11:49,  2.15s/it] 95%|█████████▌| 6450/6779 [3:59:24<11:51,  2.16s/it]                                                     {'loss': 1.6583, 'learning_rate': 2.433718045696787e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6450/6779 [3:59:24<11:51,  2.16s/it] 95%|█████████▌| 6451/6779 [3:59:26<12:17,  2.25s/it]                                                     {'loss': 1.6033, 'learning_rate': 2.4191087560696768e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6451/6779 [3:59:26<12:17,  2.25s/it] 95%|█████████▌| 6452/6779 [3:59:28<12:05,  2.22s/it]                                                     {'loss': 1.5825, 'learning_rate': 2.404543180567642e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6452/6779 [3:59:28<12:05,  2.22s/it] 95%|█████████▌| 6453/6779 [3:59:31<12:15,  2.25s/it]                                                     {'loss': 1.5193, 'learning_rate': 2.3900213224132606e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6453/6779 [3:59:31<12:15,  2.25s/it] 95%|█████████▌| 6454/6779 [3:59:33<12:48,  2.37s/it]                                                     {'loss': 1.3755, 'learning_rate': 2.375543184819473e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6454/6779 [3:59:33<12:48,  2.37s/it] 95%|█████████▌| 6455/6779 [3:59:35<12:21,  2.29s/it]                                                     {'loss': 1.6127, 'learning_rate': 2.3611087709894954e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6455/6779 [3:59:35<12:21,  2.29s/it] 95%|█████████▌| 6456/6779 [3:59:37<12:00,  2.23s/it]                                                     {'loss': 1.5928, 'learning_rate': 2.3467180841168836e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6456/6779 [3:59:37<12:00,  2.23s/it] 95%|█████████▌| 6457/6779 [3:59:40<11:49,  2.20s/it]                                                     {'loss': 1.5337, 'learning_rate': 2.33237112738558e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6457/6779 [3:59:40<11:49,  2.20s/it] 95%|█████████▌| 6458/6779 [3:59:42<11:48,  2.21s/it]                                                     {'loss': 1.7708, 'learning_rate': 2.3180679039697337e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6458/6779 [3:59:42<11:48,  2.21s/it] 95%|█████████▌| 6459/6779 [3:59:44<11:40,  2.19s/it]                                                     {'loss': 1.7184, 'learning_rate': 2.30380841703397e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6459/6779 [3:59:44<11:40,  2.19s/it] 95%|█████████▌| 6460/6779 [3:59:46<11:14,  2.12s/it]                                                     {'loss': 1.675, 'learning_rate': 2.2895926697330537e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6460/6779 [3:59:46<11:14,  2.12s/it] 95%|█████████▌| 6461/6779 [3:59:48<11:32,  2.18s/it]                                                     {'loss': 1.5721, 'learning_rate': 2.2754206652122467e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6461/6779 [3:59:48<11:32,  2.18s/it] 95%|█████████▌| 6462/6779 [3:59:50<11:30,  2.18s/it]                                                     {'loss': 1.7447, 'learning_rate': 2.2612924066070406e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6462/6779 [3:59:50<11:30,  2.18s/it] 95%|█████████▌| 6463/6779 [3:59:52<11:21,  2.16s/it]                                                     {'loss': 1.7785, 'learning_rate': 2.2472078970432686e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6463/6779 [3:59:52<11:21,  2.16s/it] 95%|█████████▌| 6464/6779 [3:59:55<11:38,  2.22s/it]                                                     {'loss': 1.5589, 'learning_rate': 2.2331671396370602e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6464/6779 [3:59:55<11:38,  2.22s/it] 95%|█████████▌| 6465/6779 [3:59:57<11:33,  2.21s/it]                                                     {'loss': 1.701, 'learning_rate': 2.219170137494908e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6465/6779 [3:59:57<11:33,  2.21s/it] 95%|█████████▌| 6466/6779 [3:59:59<11:41,  2.24s/it]                                                     {'loss': 1.5291, 'learning_rate': 2.205216893713602e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6466/6779 [3:59:59<11:41,  2.24s/it] 95%|█████████▌| 6467/6779 [4:00:01<11:30,  2.21s/it]                                                     {'loss': 1.6835, 'learning_rate': 2.191307411380228e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6467/6779 [4:00:01<11:30,  2.21s/it] 95%|█████████▌| 6468/6779 [4:00:04<11:33,  2.23s/it]                                                     {'loss': 1.7665, 'learning_rate': 2.1774416935722576e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6468/6779 [4:00:04<11:33,  2.23s/it] 95%|█████████▌| 6469/6779 [4:00:06<11:51,  2.30s/it]                                                     {'loss': 1.7006, 'learning_rate': 2.1636197433573925e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6469/6779 [4:00:06<11:51,  2.30s/it] 95%|█████████▌| 6470/6779 [4:00:08<11:25,  2.22s/it]                                                     {'loss': 1.4701, 'learning_rate': 2.1498415637937197e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6470/6779 [4:00:08<11:25,  2.22s/it] 95%|█████████▌| 6471/6779 [4:00:10<11:07,  2.17s/it]                                                     {'loss': 1.5181, 'learning_rate': 2.136107157929601e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6471/6779 [4:00:10<11:07,  2.17s/it] 95%|█████████▌| 6472/6779 [4:00:13<11:46,  2.30s/it]                                                     {'loss': 1.6479, 'learning_rate': 2.122416528803739e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6472/6779 [4:00:13<11:46,  2.30s/it] 95%|█████████▌| 6473/6779 [4:00:15<11:41,  2.29s/it]                                                     {'loss': 1.4816, 'learning_rate': 2.108769679445155e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6473/6779 [4:00:15<11:41,  2.29s/it] 96%|█████████▌| 6474/6779 [4:00:17<11:20,  2.23s/it]                                                     {'loss': 1.6485, 'learning_rate': 2.0951666128731227e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6474/6779 [4:00:17<11:20,  2.23s/it] 96%|█████████▌| 6475/6779 [4:00:20<11:19,  2.23s/it]                                                     {'loss': 1.9097, 'learning_rate': 2.081607332097324e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6475/6779 [4:00:20<11:19,  2.23s/it] 96%|█████████▌| 6476/6779 [4:00:22<11:04,  2.19s/it]                                                     {'loss': 1.5317, 'learning_rate': 2.068091840117692e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6476/6779 [4:00:22<11:04,  2.19s/it] 96%|█████████▌| 6477/6779 [4:00:24<10:45,  2.14s/it]                                                     {'loss': 1.5061, 'learning_rate': 2.054620139924457e-06, 'epoch': 0.96}
+ 96%|████████���▌| 6477/6779 [4:00:24<10:45,  2.14s/it] 96%|█████████▌| 6478/6779 [4:00:26<11:10,  2.23s/it]                                                     {'loss': 1.7889, 'learning_rate': 2.041192234498235e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6478/6779 [4:00:26<11:10,  2.23s/it] 96%|█████████▌| 6479/6779 [4:00:28<10:54,  2.18s/it]                                                     {'loss': 1.4932, 'learning_rate': 2.0278081268098714e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6479/6779 [4:00:28<10:54,  2.18s/it] 96%|█████████▌| 6480/6779 [4:00:30<10:42,  2.15s/it]                                                     {'loss': 1.6131, 'learning_rate': 2.0144678198205756e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6480/6779 [4:00:30<10:42,  2.15s/it] 96%|█████████▌| 6481/6779 [4:00:32<10:27,  2.11s/it]                                                     {'loss': 1.6612, 'learning_rate': 2.0011713164818314e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6481/6779 [4:00:32<10:27,  2.11s/it] 96%|█████████▌| 6482/6779 [4:00:34<10:23,  2.10s/it]                                                     {'loss': 1.5341, 'learning_rate': 1.9879186197354405e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6482/6779 [4:00:34<10:23,  2.10s/it] 96%|█████████▌| 6483/6779 [4:00:36<10:29,  2.13s/it]                                                     {'loss': 1.5999, 'learning_rate': 1.974709732513569e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6483/6779 [4:00:36<10:29,  2.13s/it] 96%|█████████▌| 6484/6779 [4:00:38<10:16,  2.09s/it]                                                     {'loss': 1.638, 'learning_rate': 1.9615446577385677e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6484/6779 [4:00:38<10:16,  2.09s/it] 96%|█████████▌| 6485/6779 [4:00:41<10:26,  2.13s/it]                                                     {'loss': 1.7081, 'learning_rate': 1.9484233983232183e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6485/6779 [4:00:41<10:26,  2.13s/it] 96%|█████████▌| 6486/6779 [4:00:43<10:22,  2.13s/it]                                                     {'loss': 1.6173, 'learning_rate': 1.935345957170531e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6486/6779 [4:00:43<10:22,  2.13s/it] 96%|█████████▌| 6487/6779 [4:00:45<10:23,  2.14s/it]                                                     {'loss': 1.8065, 'learning_rate': 1.9223123371738814e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6487/6779 [4:00:45<10:23,  2.14s/it] 96%|█████████▌| 6488/6779 [4:00:47<10:16,  2.12s/it]                                                     {'loss': 1.513, 'learning_rate': 1.9093225412168515e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6488/6779 [4:00:47<10:16,  2.12s/it] 96%|█████████▌| 6489/6779 [4:00:49<10:23,  2.15s/it]                                                     {'loss': 1.6503, 'learning_rate': 1.8963765721734528e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6489/6779 [4:00:49<10:23,  2.15s/it] 96%|█████████▌| 6490/6779 [4:00:51<10:14,  2.13s/it]                                                     {'loss': 1.5806, 'learning_rate': 1.8834744329079057e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6490/6779 [4:00:51<10:14,  2.13s/it] 96%|█████████▌| 6491/6779 [4:00:53<09:56,  2.07s/it]                                                     {'loss': 1.7222, 'learning_rate': 1.8706161262747713e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6491/6779 [4:00:53<09:56,  2.07s/it] 96%|█████████▌| 6492/6779 [4:00:56<10:45,  2.25s/it]                                                     {'loss': 1.6881, 'learning_rate': 1.8578016551189291e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6492/6779 [4:00:56<10:45,  2.25s/it] 96%|█████████▌| 6493/6779 [4:00:58<10:28,  2.20s/it]                                                     {'loss': 1.5652, 'learning_rate': 1.8450310222754896e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6493/6779 [4:00:58<10:28,  2.20s/it] 96%|█████████▌| 6494/6779 [4:01:01<10:51,  2.29s/it]                                                     {'loss': 1.5294, 'learning_rate': 1.8323042305699923e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6494/6779 [4:01:01<10:51,  2.29s/it] 96%|█████████▌| 6495/6779 [4:01:03<10:35,  2.24s/it]                                                     {'loss': 1.6689, 'learning_rate': 1.8196212828180958e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6495/6779 [4:01:03<10:35,  2.24s/it] 96%|█████████▌| 6496/6779 [4:01:05<10:29,  2.22s/it]                                                     {'loss': 1.5522, 'learning_rate': 1.8069821818259559e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6496/6779 [4:01:05<10:29,  2.22s/it] 96%|█████████▌| 6497/6779 [4:01:07<10:23,  2.21s/it]                                                     {'loss': 1.6166, 'learning_rate': 1.794386930389891e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6497/6779 [4:01:07<10:23,  2.21s/it] 96%|█████████▌| 6498/6779 [4:01:09<10:20,  2.21s/it]                                                     {'loss': 1.6669, 'learning_rate': 1.7818355312965385e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6498/6779 [4:01:09<10:20,  2.21s/it] 96%|█████████▌| 6499/6779 [4:01:11<10:09,  2.18s/it]                                                     {'loss': 1.7919, 'learning_rate': 1.7693279873228997e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6499/6779 [4:01:11<10:09,  2.18s/it] 96%|█████████▌| 6500/6779 [4:01:14<10:12,  2.19s/it]                                                     {'loss': 1.6523, 'learning_rate': 1.7568643012362052e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6500/6779 [4:01:14<10:12,  2.19s/it] 96%|█████████▌| 6501/6779 [4:01:16<09:58,  2.15s/it]                                                     {'loss': 1.6476, 'learning_rate': 1.744444475794005e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6501/6779 [4:01:16<09:58,  2.15s/it] 96%|█████████▌| 6502/6779 [4:01:18<09:51,  2.14s/it]                                                     {'loss': 1.7379, 'learning_rate': 1.7320685137441006e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6502/6779 [4:01:18<09:51,  2.14s/it] 96%|█████████▌| 6503/6779 [4:01:20<09:54,  2.15s/it]                                                     {'loss': 1.5865, 'learning_rate': 1.7197364178247243e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6503/6779 [4:01:20<09:54,  2.15s/it] 96%|█████████▌| 6504/6779 [4:01:22<09:44,  2.12s/it]                                                     {'loss': 1.7153, 'learning_rate': 1.7074481907642493e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6504/6779 [4:01:22<09:44,  2.12s/it] 96%|█████████▌| 6505/6779 [4:01:24<09:32,  2.09s/it]                                                     {'loss': 1.7347, 'learning_rate': 1.6952038352814336e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6505/6779 [4:01:24<09:32,  2.09s/it] 96%|█████████▌| 6506/6779 [4:01:26<09:39,  2.12s/it]                                                     {'loss': 1.6718, 'learning_rate': 1.6830033540852663e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6506/6779 [4:01:26<09:39,  2.12s/it] 96%|█████████▌| 6507/6779 [4:01:28<09:52,  2.18s/it]                                                     {'loss': 1.5661, 'learning_rate': 1.670846749875099e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6507/6779 [4:01:28<09:52,  2.18s/it] 96%|█████████▌| 6508/6779 [4:01:31<09:46,  2.17s/it]                                                     {'loss': 1.5801, 'learning_rate': 1.6587340253405358e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6508/6779 [4:01:31<09:46,  2.17s/it] 96%|█████████▌| 6509/6779 [4:01:33<09:49,  2.18s/it]                                                     {'loss': 1.7419, 'learning_rate': 1.6466651831614556e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6509/6779 [4:01:33<09:49,  2.18s/it] 96%|█████████▌| 6510/6779 [4:01:35<09:36,  2.14s/it]                                                     {'loss': 1.5635, 'learning_rate': 1.634640226008055e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6510/6779 [4:01:35<09:36,  2.14s/it] 96%|█████████▌| 6511/6779 [4:01:37<09:36,  2.15s/it]                                                     {'loss': 1.6154, 'learning_rate': 1.6226591565408289e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6511/6779 [4:01:37<09:36,  2.15s/it] 96%|█████████▌| 6512/6779 [4:01:40<09:56,  2.24s/it]                                                     {'loss': 1.6375, 'learning_rate': 1.6107219774105453e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6512/6779 [4:01:40<09:56,  2.24s/it] 96%|█████████▌| 6513/6779 [4:01:42<09:39,  2.18s/it]                                                     {'loss': 1.5316, 'learning_rate': 1.5988286912582695e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6513/6779 [4:01:42<09:39,  2.18s/it] 96%|█████████▌| 6514/6779 [4:01:44<09:39,  2.19s/it]                                                     {'loss': 1.726, 'learning_rate': 1.586979300715341e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6514/6779 [4:01:44<09:39,  2.19s/it] 96%|█████████▌| 6515/6779 [4:01:46<09:26,  2.14s/it]                                                     {'loss': 1.6716, 'learning_rate': 1.5751738084034185e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6515/6779 [4:01:46<09:26,  2.14s/it] 96%|█████████▌| 6516/6779 [4:01:48<09:39,  2.20s/it]                                                     {'loss': 1.5696, 'learning_rate': 1.5634122169344122e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6516/6779 [4:01:48<09:39,  2.20s/it] 96%|█████████▌| 6517/6779 [4:01:51<10:01,  2.30s/it]                                                     {'loss': 1.7227, 'learning_rate': 1.55169452891053e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6517/6779 [4:01:51<10:01,  2.30s/it] 96%|█████████▌| 6518/6779 [4:01:53<09:40,  2.22s/it]                                                     {'loss': 1.7175, 'learning_rate': 1.5400207469242978e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6518/6779 [4:01:53<09:40,  2.22s/it] 96%|█████████▌| 6519/6779 [4:01:55<09:32,  2.20s/it]                                                     {'loss': 1.5555, 'learning_rate': 1.5283908735584718e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6519/6779 [4:01:55<09:32,  2.20s/it] 96%|█████████▌| 6520/6779 [4:01:57<09:30,  2.20s/it]                                                     {'loss': 1.5824, 'learning_rate': 1.5168049113861494e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6520/6779 [4:01:57<09:30,  2.20s/it] 96%|█████████▌| 6521/6779 [4:01:59<09:36,  2.23s/it]                                                     {'loss': 1.5801, 'learning_rate': 1.50526286297068e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6521/6779 [4:01:59<09:36,  2.23s/it] 96%|█████████▌| 6522/6779 [4:02:02<09:33,  2.23s/it]                                                     {'loss': 1.4922, 'learning_rate': 1.4937647308656655e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6522/6779 [4:02:02<09:33,  2.23s/it] 96%|█████████▌| 6523/6779 [4:02:04<09:28,  2.22s/it]                                                     {'loss': 1.72, 'learning_rate': 1.482310517615093e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6523/6779 [4:02:04<09:28,  2.22s/it] 96%|█████████▌| 6524/6779 [4:02:06<09:23,  2.21s/it]                                                     {'loss': 1.5267, 'learning_rate': 1.4709002257531358e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6524/6779 [4:02:06<09:23,  2.21s/it] 96%|█████████▋| 6525/6779 [4:02:08<09:29,  2.24s/it]                                                     {'loss': 1.5903, 'learning_rate': 1.4595338578042627e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6525/6779 [4:02:08<09:29,  2.24s/it] 96%|█████████▋| 6526/6779 [4:02:11<09:45,  2.32s/it]                                                     {'loss': 1.6377, 'learning_rate': 1.4482114162833072e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6526/6779 [4:02:11<09:45,  2.32s/it] 96%|█████████▋| 6527/6779 [4:02:13<09:22,  2.23s/it]                                                     {'loss': 1.5848, 'learning_rate': 1.436932903695265e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6527/6779 [4:02:13<09:22,  2.23s/it] 96%|█████████▋| 6528/6779 [4:02:15<09:04,  2.17s/it]                                                     {'loss': 1.6164, 'learning_rate': 1.425698322535496e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6528/6779 [4:02:15<09:04,  2.17s/it] 96%|█████████▋| 6529/6779 [4:02:17<08:48,  2.11s/it]                                                     {'loss': 1.4911, 'learning_rate': 1.414507675289589e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6529/6779 [4:02:17<08:48,  2.11s/it] 96%|█████████▋| 6530/6779 [4:02:19<08:52,  2.14s/it]                                                     {'loss': 1.4337, 'learning_rate': 1.4033609644334977e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6530/6779 [4:02:19<08:52,  2.14s/it] 96%|█████████▋| 6531/6779 [4:02:21<08:35,  2.08s/it]                                                     {'loss': 1.5585, 'learning_rate': 1.3922581924333155e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6531/6779 [4:02:21<08:35,  2.08s/it] 96%|█████████▋| 6532/6779 [4:02:23<08:57,  2.17s/it]                                                     {'loss': 1.7184, 'learning_rate': 1.3811993617455443e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6532/6779 [4:02:23<08:57,  2.17s/it] 96%|█████████▋| 6533/6779 [4:02:26<08:58,  2.19s/it]                                                     {'loss': 1.6545, 'learning_rate': 1.3701844748169157e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6533/6779 [4:02:26<08:58,  2.19s/it] 96%|█████████▋| 6534/6779 [4:02:28<08:58,  2.20s/it]                                                     {'loss': 1.67, 'learning_rate': 1.3592135340844359e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6534/6779 [4:02:28<08:58,  2.20s/it] 96%|█████████▋| 6535/6779 [4:02:30<09:06,  2.24s/it]                                                     {'loss': 1.6941, 'learning_rate': 1.3482865419753632e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6535/6779 [4:02:30<09:06,  2.24s/it] 96%|█████████▋| 6536/6779 [4:02:32<09:00,  2.22s/it]                                                     {'loss': 1.6365, 'learning_rate': 1.3374035009072749e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6536/6779 [4:02:32<09:00,  2.22s/it] 96%|█████████▋| 6537/6779 [4:02:35<09:35,  2.38s/it]                                                     {'loss': 1.68, 'learning_rate': 1.3265644132880229e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6537/6779 [4:02:35<09:35,  2.38s/it] 96%|█████████▋| 6538/6779 [4:02:38<10:28,  2.61s/it]                                                     {'loss': 1.6786, 'learning_rate': 1.3157692815156885e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6538/6779 [4:02:38<10:28,  2.61s/it] 96%|█████████▋| 6539/6779 [4:02:40<09:46,  2.44s/it]                                                     {'loss': 1.5628, 'learning_rate': 1.3050181079786728e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6539/6779 [4:02:40<09:46,  2.44s/it] 96%|█████████▋| 6540/6779 [4:02:42<09:28,  2.38s/it]                                                     {'loss': 1.5027, 'learning_rate': 1.2943108950556503e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6540/6779 [4:02:42<09:28,  2.38s/it] 96%|█████████▋| 6541/6779 [4:02:45<09:10,  2.31s/it]                                                     {'loss': 1.4352, 'learning_rate': 1.2836476451155489e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6541/6779 [4:02:45<09:10,  2.31s/it] 97%|█████████▋| 6542/6779 [4:02:47<08:50,  2.24s/it]                                                     {'loss': 1.7568, 'learning_rate': 1.2730283605175696e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6542/6779 [4:02:47<08:50,  2.24s/it] 97%|█████████▋| 6543/6779 [4:02:49<08:48,  2.24s/it]                                                     {'loss': 1.6581, 'learning_rate': 1.2624530436112114e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6543/6779 [4:02:49<08:48,  2.24s/it] 97%|█████████▋| 6544/6779 [4:02:51<08:46,  2.24s/it]                                                     {'loss': 1.7204, 'learning_rate': 1.2519216967362025e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6544/6779 [4:02:51<08:46,  2.24s/it] 97%|█████████▋| 6545/6779 [4:02:53<08:38,  2.22s/it]                                                     {'loss': 1.8664, 'learning_rate': 1.24143432222259e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6545/6779 [4:02:53<08:38,  2.22s/it] 97%|█████████▋| 6546/6779 [4:02:56<08:39,  2.23s/it]                                                     {'loss': 1.6533, 'learning_rate': 1.2309909223906735e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6546/6779 [4:02:56<08:39,  2.23s/it] 97%|█████████▋| 6547/6779 [4:02:58<08:29,  2.20s/it]                                                     {'loss': 1.7419, 'learning_rate': 1.220591499551027e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6547/6779 [4:02:58<08:29,  2.20s/it] 97%|█████████▋| 6548/6779 [4:03:00<08:42,  2.26s/it]                                                     {'loss': 1.8143, 'learning_rate': 1.2102360560044545e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6548/6779 [4:03:00<08:42,  2.26s/it] 97%|█████████▋| 6549/6779 [4:03:02<08:30,  2.22s/it]                                                     {'loss': 1.6267, 'learning_rate': 1.199924594042079e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6549/6779 [4:03:02<08:30,  2.22s/it] 97%|█████████▋| 6550/6779 [4:03:05<08:33,  2.24s/it]                                                     {'loss': 1.6291, 'learning_rate': 1.1896571159452974e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6550/6779 [4:03:05<08:33,  2.24s/it] 97%|█████████▋| 6551/6779 [4:03:07<08:26,  2.22s/it]                                                     {'loss': 1.6014, 'learning_rate': 1.1794336239857373e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6551/6779 [4:03:07<08:26,  2.22s/it] 97%|█████████▋| 6552/6779 [4:03:09<08:18,  2.20s/it]                                                     {'loss': 1.6725, 'learning_rate': 1.1692541204253228e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6552/6779 [4:03:09<08:18,  2.20s/it] 97%|█████████▋| 6553/6779 [4:03:11<08:12,  2.18s/it]                                                     {'loss': 1.6122, 'learning_rate': 1.1591186075162074e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6553/6779 [4:03:11<08:12,  2.18s/it] 97%|█████████▋| 6554/6779 [4:03:13<08:11,  2.18s/it]                                                     {'loss': 1.6652, 'learning_rate': 1.1490270875008868e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6554/6779 [4:03:13<08:11,  2.18s/it] 97%|█████████▋| 6555/6779 [4:03:15<08:08,  2.18s/it]                                                     {'loss': 1.866, 'learning_rate': 1.1389795626120414e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6555/6779 [4:03:15<08:08,  2.18s/it] 97%|█████████▋| 6556/6779 [4:03:18<08:15,  2.22s/it]                                                     {'loss': 1.6975, 'learning_rate': 1.128976035072693e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6556/6779 [4:03:18<08:15,  2.22s/it] 97%|█████████▋| 6557/6779 [4:03:20<08:47,  2.37s/it]                                                     {'loss': 1.5336, 'learning_rate': 1.1190165070960267e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6557/6779 [4:03:20<08:47,  2.37s/it] 97%|█████████▋| 6558/6779 [4:03:23<08:34,  2.33s/it]                                                     {'loss': 1.7221, 'learning_rate': 1.1091009808855912e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6558/6779 [4:03:23<08:34,  2.33s/it] 97%|█████████▋| 6559/6779 [4:03:25<08:12,  2.24s/it]                                                     {'loss': 1.6277, 'learning_rate': 1.0992294586351647e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6559/6779 [4:03:25<08:12,  2.24s/it] 97%|█████████▋| 6560/6779 [4:03:27<08:07,  2.22s/it]                                                     {'loss': 1.5253, 'learning_rate': 1.0894019425288005e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6560/6779 [4:03:27<08:07,  2.22s/it] 97%|█████████▋| 6561/6779 [4:03:29<07:53,  2.17s/it]                                                     {'loss': 1.7413, 'learning_rate': 1.079618434740781e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6561/6779 [4:03:29<07:53,  2.17s/it] 97%|█████████▋| 6562/6779 [4:03:31<08:03,  2.23s/it]                                                     {'loss': 1.6649, 'learning_rate': 1.0698789374356865e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6562/6779 [4:03:31<08:03,  2.23s/it] 97%|█████████▋| 6563/6779 [4:03:33<07:53,  2.19s/it]                                                     {'loss': 1.688, 'learning_rate': 1.0601834527683486e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6563/6779 [4:03:33<07:53,  2.19s/it] 97%|█████████▋| 6564/6779 [4:03:35<07:34,  2.12s/it]                                                     {'loss': 1.6027, 'learning_rate': 1.050531982883851e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6564/6779 [4:03:35<07:34,  2.12s/it] 97%|█████████▋| 6565/6779 [4:03:38<07:46,  2.18s/it]                                                     {'loss': 1.6766, 'learning_rate': 1.0409245299175751e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6565/6779 [4:03:38<07:46,  2.18s/it] 97%|█████████▋| 6566/6779 [4:03:40<07:37,  2.15s/it]                                                     {'loss': 1.7388, 'learning_rate': 1.0313610959951091e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6566/6779 [4:03:40<07:37,  2.15s/it] 97%|█████████▋| 6567/6779 [4:03:42<07:52,  2.23s/it]                                                     {'loss': 1.5363, 'learning_rate': 1.0218416832323606e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6567/6779 [4:03:42<07:52,  2.23s/it] 97%|█████████▋| 6568/6779 [4:03:44<07:48,  2.22s/it]                                                     {'loss': 1.5975, 'learning_rate': 1.012366293735445e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6568/6779 [4:03:44<07:48,  2.22s/it] 97%|█████████▋| 6569/6779 [4:03:46<07:41,  2.20s/it]                                                     {'loss': 1.6285, 'learning_rate': 1.0029349296007517e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6569/6779 [4:03:46<07:41,  2.20s/it] 97%|█████████▋| 6570/6779 [4:03:49<07:40,  2.20s/it]                                                     {'loss': 1.7217, 'learning_rate': 9.935475929149895e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6570/6779 [4:03:49<07:40,  2.20s/it] 97%|█████████▋| 6571/6779 [4:03:51<07:31,  2.17s/it]                                                     {'loss': 1.6974, 'learning_rate': 9.842042857550081e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6571/6779 [4:03:51<07:31,  2.17s/it] 97%|█████████▋| 6572/6779 [4:03:53<07:31,  2.18s/it]                                                     {'loss': 1.778, 'learning_rate': 9.74905010188043e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6572/6779 [4:03:53<07:31,  2.18s/it] 97%|█████████▋| 6573/6779 [4:03:55<07:47,  2.27s/it]                                                     {'loss': 1.5061, 'learning_rate': 9.656497682714927e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6573/6779 [4:03:55<07:47,  2.27s/it] 97%|█████████▋| 6574/6779 [4:03:58<07:36,  2.23s/it]                                                     {'loss': 1.5774, 'learning_rate': 9.564385620530746e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6574/6779 [4:03:58<07:36,  2.23s/it] 97%|█████████▋| 6575/6779 [4:04:00<07:26,  2.19s/it]                                                     {'loss': 1.6186, 'learning_rate': 9.472713935706923e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6575/6779 [4:04:00<07:26,  2.19s/it] 97%|█████████▋| 6576/6779 [4:04:02<07:30,  2.22s/it]                                                     {'loss': 1.7119, 'learning_rate': 9.381482648526118e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6576/6779 [4:04:02<07:30,  2.22s/it] 97%|█████████▋| 6577/6779 [4:04:04<07:32,  2.24s/it]                                                     {'loss': 1.7089, 'learning_rate': 9.290691779172633e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6577/6779 [4:04:04<07:32,  2.24s/it] 97%|█████████▋| 6578/6779 [4:04:07<07:31,  2.25s/it]                                                     {'loss': 1.5627, 'learning_rate': 9.20034134773351e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6578/6779 [4:04:07<07:31,  2.25s/it] 97%|█████████▋| 6579/6779 [4:04:09<07:45,  2.33s/it]                                                     {'loss': 1.5681, 'learning_rate': 9.11043137419898e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6579/6779 [4:04:09<07:45,  2.33s/it] 97%|█████████▋| 6580/6779 [4:04:11<07:28,  2.25s/it]                                                     {'loss': 1.6415, 'learning_rate': 9.020961878460688e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6580/6779 [4:04:11<07:28,  2.25s/it] 97%|█████████▋| 6581/6779 [4:04:13<07:30,  2.28s/it]                                                     {'loss': 1.7874, 'learning_rate': 8.931932880313909e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6581/6779 [4:04:13<07:30,  2.28s/it] 97%|█████████▋| 6582/6779 [4:04:16<07:25,  2.26s/it]                                                     {'loss': 1.6776, 'learning_rate': 8.843344399455778e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6582/6779 [4:04:16<07:25,  2.26s/it] 97%|█████████▋| 6583/6779 [4:04:18<07:21,  2.25s/it]                                                     {'loss': 1.7491, 'learning_rate': 8.755196455486392e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6583/6779 [4:04:18<07:21,  2.25s/it] 97%|█████████▋| 6584/6779 [4:04:20<07:16,  2.24s/it]                                                     {'loss': 1.5274, 'learning_rate': 8.667489067908152e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6584/6779 [4:04:20<07:16,  2.24s/it] 97%|█████████▋| 6585/6779 [4:04:22<07:20,  2.27s/it]                                                     {'loss': 1.675, 'learning_rate': 8.580222256126202e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6585/6779 [4:04:22<07:20,  2.27s/it] 97%|█████████▋| 6586/6779 [4:04:25<07:25,  2.31s/it]                                                     {'loss': 1.6711, 'learning_rate': 8.493396039447543e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6586/6779 [4:04:25<07:25,  2.31s/it] 97%|█████████▋| 6587/6779 [4:04:27<07:15,  2.27s/it]                                                     {'loss': 1.7236, 'learning_rate': 8.407010437082585e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6587/6779 [4:04:27<07:15,  2.27s/it] 97%|█████████▋| 6588/6779 [4:04:30<07:27,  2.34s/it]                                                     {'loss': 1.7017, 'learning_rate': 8.321065468143818e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6588/6779 [4:04:30<07:27,  2.34s/it] 97%|█████████▋| 6589/6779 [4:04:32<07:08,  2.25s/it]                                                     {'loss': 1.6888, 'learning_rate': 8.235561151646254e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6589/6779 [4:04:32<07:08,  2.25s/it] 97%|█████████▋| 6590/6779 [4:04:34<07:25,  2.36s/it]                                                     {'loss': 1.6685, 'learning_rate': 8.150497506507427e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6590/6779 [4:04:34<07:25,  2.36s/it] 97%|█████████▋| 6591/6779 [4:04:36<07:08,  2.28s/it]                                                     {'loss': 1.7613, 'learning_rate': 8.06587455154717e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6591/6779 [4:04:36<07:08,  2.28s/it] 97%|█████████▋| 6592/6779 [4:04:38<06:56,  2.23s/it]                                                     {'loss': 1.5865, 'learning_rate': 7.981692305488508e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6592/6779 [4:04:38<06:56,  2.23s/it] 97%|█████████▋| 6593/6779 [4:04:41<06:49,  2.20s/it]                                                     {'loss': 1.71, 'learning_rate': 7.897950786956099e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6593/6779 [4:04:41<06:49,  2.20s/it] 97%|█████████▋| 6594/6779 [4:04:43<07:04,  2.29s/it]                                                     {'loss': 1.8735, 'learning_rate': 7.814650014477787e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6594/6779 [4:04:43<07:04,  2.29s/it] 97%|█████████▋| 6595/6779 [4:04:45<06:50,  2.23s/it]                                                     {'loss': 1.6397, 'learning_rate': 7.731790006483053e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6595/6779 [4:04:45<06:50,  2.23s/it] 97%|█████████▋| 6596/6779 [4:04:48<07:16,  2.38s/it]                                                     {'loss': 1.7023, 'learning_rate': 7.64937078130501e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6596/6779 [4:04:48<07:16,  2.38s/it] 97%|█████████▋| 6597/6779 [4:04:50<06:59,  2.31s/it]                                                     {'loss': 1.6329, 'learning_rate': 7.567392357178404e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6597/6779 [4:04:50<06:59,  2.31s/it] 97%|█████████▋| 6598/6779 [4:04:52<07:04,  2.35s/it]                                                     {'loss': 1.649, 'learning_rate': 7.485854752240729e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6598/6779 [4:04:52<07:04,  2.35s/it] 97%|█████████▋| 6599/6779 [4:04:55<07:15,  2.42s/it]                                                     {'loss': 1.8148, 'learning_rate': 7.404757984531774e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6599/6779 [4:04:55<07:15,  2.42s/it] 97%|█████████▋| 6600/6779 [4:04:57<06:57,  2.33s/it]                                                     {'loss': 1.6367, 'learning_rate': 7.324102071994077e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6600/6779 [4:04:57<06:57,  2.33s/it] 97%|█████████▋| 6601/6779 [4:05:00<07:44,  2.61s/it]                                                     {'loss': 1.511, 'learning_rate': 7.243887032472252e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6601/6779 [4:05:00<07:44,  2.61s/it] 97%|█████████▋| 6602/6779 [4:05:03<07:18,  2.48s/it]                                                     {'loss': 1.532, 'learning_rate': 7.164112883714103e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6602/6779 [4:05:03<07:18,  2.48s/it] 97%|█████████▋| 6603/6779 [4:05:05<07:03,  2.40s/it]                                                     {'loss': 1.4913, 'learning_rate': 7.084779643368844e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6603/6779 [4:05:05<07:03,  2.40s/it] 97%|█████████▋| 6604/6779 [4:05:07<06:39,  2.28s/it]                                                     {'loss': 1.6697, 'learning_rate': 7.005887328989102e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6604/6779 [4:05:07<06:39,  2.28s/it] 97%|█████████▋| 6605/6779 [4:05:09<06:42,  2.31s/it]                                                     {'loss': 1.5438, 'learning_rate': 6.92743595802936e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6605/6779 [4:05:09<06:42,  2.31s/it] 97%|█████████▋| 6606/6779 [4:05:11<06:36,  2.29s/it]                                                     {'loss': 1.66, 'learning_rate': 6.849425547846844e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6606/6779 [4:05:11<06:36,  2.29s/it] 97%|█████████▋| 6607/6779 [4:05:14<06:34,  2.29s/it]                                                     {'loss': 1.7126, 'learning_rate': 6.771856115700858e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6607/6779 [4:05:14<06:34,  2.29s/it] 97%|█████████▋| 6608/6779 [4:05:16<06:46,  2.38s/it]                                                     {'loss': 1.588, 'learning_rate': 6.694727678753898e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6608/6779 [4:05:16<06:46,  2.38s/it] 97%|█████████▋| 6609/6779 [4:05:19<06:45,  2.39s/it]                                                     {'loss': 1.6312, 'learning_rate': 6.618040254069647e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6609/6779 [4:05:19<06:45,  2.39s/it] 98%|█████████▊| 6610/6779 [4:05:21<06:35,  2.34s/it]                                                     {'loss': 1.804, 'learning_rate': 6.54179385861542e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6610/6779 [4:05:21<06:35,  2.34s/it] 98%|█████████▊| 6611/6779 [4:05:23<06:24,  2.29s/it]                                                     {'loss': 1.7312, 'learning_rate': 6.46598850926039e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6611/6779 [4:05:23<06:24,  2.29s/it] 98%|█████████▊| 6612/6779 [4:05:25<06:17,  2.26s/it]                                                     {'loss': 1.6933, 'learning_rate': 6.390624222776253e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6612/6779 [4:05:25<06:17,  2.26s/it] 98%|█████████▊| 6613/6779 [4:05:28<06:11,  2.24s/it]                                                     {'loss': 1.5176, 'learning_rate': 6.315701015837228e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6613/6779 [4:05:28<06:11,  2.24s/it] 98%|█████████▊| 6614/6779 [4:05:30<06:29,  2.36s/it]                                                     {'loss': 1.7957, 'learning_rate': 6.241218905019608e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6614/6779 [4:05:30<06:29,  2.36s/it] 98%|█████████▊| 6615/6779 [4:05:32<06:22,  2.33s/it]                                                     {'loss': 1.6987, 'learning_rate': 6.167177906802435e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6615/6779 [4:05:32<06:22,  2.33s/it] 98%|█████████▊| 6616/6779 [4:05:35<06:12,  2.29s/it]                                                     {'loss': 1.6234, 'learning_rate': 6.093578037567049e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6616/6779 [4:05:35<06:12,  2.29s/it] 98%|█████████▊| 6617/6779 [4:05:37<06:09,  2.28s/it]                                                     {'loss': 1.7968, 'learning_rate': 6.02041931359687e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6617/6779 [4:05:37<06:09,  2.28s/it] 98%|█████████▊| 6618/6779 [4:05:39<06:01,  2.25s/it]                                                     {'loss': 1.6912, 'learning_rate': 5.947701751078727e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6618/6779 [4:05:39<06:01,  2.25s/it] 98%|█████████▊| 6619/6779 [4:05:41<06:00,  2.25s/it]                                                     {'loss': 1.7291, 'learning_rate': 5.875425366100417e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6619/6779 [4:05:41<06:00,  2.25s/it] 98%|█████████▊| 6620/6779 [4:05:44<05:57,  2.25s/it]                                                     {'loss': 1.6812, 'learning_rate': 5.803590174653151e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6620/6779 [4:05:44<05:57,  2.25s/it] 98%|█████████▊| 6621/6779 [4:05:46<06:02,  2.29s/it]                                                     {'loss': 1.6107, 'learning_rate': 5.732196192630434e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6621/6779 [4:05:46<06:02,  2.29s/it] 98%|█████████▊| 6622/6779 [4:05:48<05:53,  2.25s/it]                                                     {'loss': 1.7981, 'learning_rate': 5.661243435827634e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6622/6779 [4:05:48<05:53,  2.25s/it] 98%|█████████▊| 6623/6779 [4:05:50<05:45,  2.21s/it]                                                     {'loss': 1.5663, 'learning_rate': 5.590731919942859e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6623/6779 [4:05:50<05:45,  2.21s/it] 98%|█████████▊| 6624/6779 [4:05:52<05:39,  2.19s/it]                                                     {'loss': 1.5484, 'learning_rate': 5.520661660576521e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6624/6779 [4:05:52<05:39,  2.19s/it] 98%|█████████▊| 6625/6779 [4:05:55<05:38,  2.20s/it]                                                     {'loss': 1.5726, 'learning_rate': 5.45103267323177e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6625/6779 [4:05:55<05:38,  2.20s/it] 98%|█████████▊| 6626/6779 [4:05:57<05:36,  2.20s/it]                                                     {'loss': 1.7493, 'learning_rate': 5.381844973313399e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6626/6779 [4:05:57<05:36,  2.20s/it] 98%|█████████▊| 6627/6779 [4:05:59<05:38,  2.23s/it]                                                     {'loss': 1.6112, 'learning_rate': 5.313098576129383e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6627/6779 [4:05:59<05:38,  2.23s/it] 98%|█████████▊| 6628/6779 [4:06:01<05:40,  2.25s/it]                                                     {'loss': 1.5342, 'learning_rate': 5.244793496889111e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6628/6779 [4:06:01<05:40,  2.25s/it] 98%|█████████▊| 6629/6779 [4:06:03<05:29,  2.19s/it]                                                     {'loss': 1.4973, 'learning_rate': 5.176929750705162e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6629/6779 [4:06:03<05:29,  2.19s/it] 98%|█████████▊| 6630/6779 [4:06:06<05:29,  2.21s/it]                                                     {'loss': 1.804, 'learning_rate': 5.109507352592191e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6630/6779 [4:06:06<05:29,  2.21s/it] 98%|█████████▊| 6631/6779 [4:06:08<05:22,  2.18s/it]                                                     {'loss': 1.7558, 'learning_rate': 5.042526317466933e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6631/6779 [4:06:08<05:22,  2.18s/it] 98%|█████████▊| 6632/6779 [4:06:10<05:23,  2.20s/it]                                                     {'loss': 1.7638, 'learning_rate': 4.97598666014909e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6632/6779 [4:06:10<05:23,  2.20s/it] 98%|█████████▊| 6633/6779 [4:06:12<05:21,  2.20s/it]                                                     {'loss': 1.6983, 'learning_rate': 4.909888395360218e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6633/6779 [4:06:12<05:21,  2.20s/it] 98%|█████████▊| 6634/6779 [4:06:15<05:26,  2.25s/it]                                                     {'loss': 1.5687, 'learning_rate': 4.844231537724175e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6634/6779 [4:06:15<05:26,  2.25s/it] 98%|█████████▊| 6635/6779 [4:06:17<05:17,  2.21s/it]                                                     {'loss': 1.5617, 'learning_rate': 4.779016101767342e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6635/6779 [4:06:17<05:17,  2.21s/it] 98%|█████████▊| 6636/6779 [4:06:19<05:16,  2.21s/it]                                                     {'loss': 1.5721, 'learning_rate': 4.71424210191862e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6636/6779 [4:06:19<05:16,  2.21s/it] 98%|█████████▊| 6637/6779 [4:06:21<05:11,  2.19s/it]                                                     {'loss': 1.4198, 'learning_rate': 4.649909552508991e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6637/6779 [4:06:21<05:11,  2.19s/it] 98%|█████████▊| 6638/6779 [4:06:23<05:12,  2.22s/it]                                                     {'loss': 1.6253, 'learning_rate': 4.5860184677717355e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6638/6779 [4:06:23<05:12,  2.22s/it] 98%|█████████▊| 6639/6779 [4:06:26<05:13,  2.24s/it]                                                     {'loss': 1.681, 'learning_rate': 4.5225688618424357e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6639/6779 [4:06:26<05:13,  2.24s/it] 98%|█████████▊| 6640/6779 [4:06:28<05:14,  2.26s/it]                                                     {'loss': 1.7289, 'learning_rate': 4.459560748759417e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6640/6779 [4:06:28<05:14,  2.26s/it] 98%|█████████▊| 6641/6779 [4:06:30<05:09,  2.24s/it]                                                     {'loss': 1.4958, 'learning_rate': 4.39699414246264e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6641/6779 [4:06:30<05:09,  2.24s/it] 98%|█████████▊| 6642/6779 [4:06:33<05:18,  2.32s/it]                                                     {'loss': 1.5269, 'learning_rate': 4.3348690567952545e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6642/6779 [4:06:33<05:18,  2.32s/it] 98%|█████████▊| 6643/6779 [4:06:35<05:35,  2.46s/it]                                                     {'loss': 1.6264, 'learning_rate': 4.27318550550182e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6643/6779 [4:06:35<05:35,  2.46s/it] 98%|█████████▊| 6644/6779 [4:06:38<05:27,  2.42s/it]                                                     {'loss': 1.7954, 'learning_rate': 4.2119435022296425e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6644/6779 [4:06:38<05:27,  2.42s/it] 98%|█████████▊| 6645/6779 [4:06:40<05:13,  2.34s/it]                                                     {'loss': 1.6733, 'learning_rate': 4.151143060528551e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6645/6779 [4:06:40<05:13,  2.34s/it] 98%|█████████▊| 6646/6779 [4:06:42<05:02,  2.28s/it]                                                     {'loss': 1.8281, 'learning_rate': 4.090784193850228e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6646/6779 [4:06:42<05:02,  2.28s/it] 98%|█████████▊| 6647/6779 [4:06:44<04:56,  2.25s/it]                                                     {'loss': 1.5991, 'learning_rate': 4.030866915549103e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6647/6779 [4:06:44<04:56,  2.25s/it] 98%|█████████▊| 6648/6779 [4:06:47<04:55,  2.25s/it]                                                     {'loss': 1.5756, 'learning_rate': 3.971391238881461e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6648/6779 [4:06:47<04:55,  2.25s/it] 98%|█████████▊| 6649/6779 [4:06:49<05:02,  2.33s/it]                                                     {'loss': 1.771, 'learning_rate': 3.9123571770061094e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6649/6779 [4:06:49<05:02,  2.33s/it] 98%|█████████▊| 6650/6779 [4:06:51<04:53,  2.28s/it]                                                     {'loss': 1.6147, 'learning_rate': 3.853764742984378e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6650/6779 [4:06:51<04:53,  2.28s/it] 98%|█████████▊| 6651/6779 [4:06:53<04:49,  2.26s/it]                                                     {'loss': 1.665, 'learning_rate': 3.795613949779231e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6651/6779 [4:06:53<04:49,  2.26s/it] 98%|█████████▊| 6652/6779 [4:06:56<04:46,  2.25s/it]                                                     {'loss': 1.5171, 'learning_rate': 3.7379048102568205e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6652/6779 [4:06:56<04:46,  2.25s/it] 98%|█████████▊| 6653/6779 [4:06:58<04:48,  2.29s/it]                                                     {'loss': 1.6592, 'learning_rate': 3.6806373371847115e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6653/6779 [4:06:58<04:48,  2.29s/it] 98%|█████████▊| 6654/6779 [4:07:00<04:48,  2.31s/it]                                                     {'loss': 1.7444, 'learning_rate': 3.623811543233435e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6654/6779 [4:07:00<04:48,  2.31s/it] 98%|█████████▊| 6655/6779 [4:07:02<04:38,  2.25s/it]                                                     {'loss': 1.6964, 'learning_rate': 3.5674274409753797e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6655/6779 [4:07:02<04:38,  2.25s/it] 98%|█████████▊| 6656/6779 [4:07:05<04:33,  2.23s/it]                                                     {'loss': 1.5473, 'learning_rate': 3.511485042885232e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6656/6779 [4:07:05<04:33,  2.23s/it] 98%|█████████▊| 6657/6779 [4:07:07<04:27,  2.20s/it]                                                     {'loss': 1.6347, 'learning_rate': 3.455984361340425e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6657/6779 [4:07:07<04:27,  2.20s/it] 98%|█████████▊| 6658/6779 [4:07:09<04:30,  2.24s/it]                                                     {'loss': 1.8455, 'learning_rate': 3.400925408619804e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6658/6779 [4:07:09<04:30,  2.24s/it] 98%|█████████▊| 6659/6779 [4:07:11<04:25,  2.21s/it]                                                     {'loss': 1.6506, 'learning_rate': 3.346308196905401e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6659/6779 [4:07:11<04:25,  2.21s/it] 98%|█████████▊| 6660/6779 [4:07:13<04:14,  2.14s/it]                                                     {'loss': 1.5607, 'learning_rate': 3.292132738280884e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6660/6779 [4:07:13<04:14,  2.14s/it] 98%|█████████▊| 6661/6779 [4:07:15<04:06,  2.09s/it]                                                     {'loss': 1.5427, 'learning_rate': 3.238399044732443e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6661/6779 [4:07:15<04:06,  2.09s/it] 98%|█████████▊| 6662/6779 [4:07:17<04:10,  2.14s/it]                                                     {'loss': 1.7343, 'learning_rate': 3.185107128148346e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6662/6779 [4:07:17<04:10,  2.14s/it] 98%|█████████▊| 6663/6779 [4:07:20<04:26,  2.30s/it]                                                     {'loss': 1.6405, 'learning_rate': 3.132257000319605e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6663/6779 [4:07:20<04:26,  2.30s/it] 98%|█████████▊| 6664/6779 [4:07:22<04:18,  2.25s/it]                                                     {'loss': 1.6307, 'learning_rate': 3.0798486729386454e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6664/6779 [4:07:22<04:18,  2.25s/it] 98%|█████████▊| 6665/6779 [4:07:25<04:21,  2.29s/it]                                                     {'loss': 1.7581, 'learning_rate': 3.027882157601303e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6665/6779 [4:07:25<04:21,  2.29s/it] 98%|█████████▊| 6666/6779 [4:07:27<04:14,  2.25s/it]                                                     {'loss': 1.6582, 'learning_rate': 2.9763574658043805e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6666/6779 [4:07:27<04:14,  2.25s/it] 98%|█████████▊| 6667/6779 [4:07:30<04:34,  2.45s/it]                                                     {'loss': 1.4963, 'learning_rate': 2.9252746089476477e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6667/6779 [4:07:30<04:34,  2.45s/it] 98%|█████████▊| 6668/6779 [4:07:32<04:21,  2.35s/it]                                                     {'loss': 1.6619, 'learning_rate': 2.8746335983333983e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6668/6779 [4:07:32<04:21,  2.35s/it] 98%|█████████▊| 6669/6779 [4:07:34<04:13,  2.31s/it]                                                     {'loss': 1.6194, 'learning_rate': 2.824434445165558e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6669/6779 [4:07:34<04:13,  2.31s/it] 98%|█████████▊| 6670/6779 [4:07:36<04:04,  2.24s/it]                                                     {'loss': 1.6523, 'learning_rate': 2.774677160550354e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6670/6779 [4:07:36<04:04,  2.24s/it] 98%|█████████▊| 6671/6779 [4:07:38<04:04,  2.27s/it]                                                     {'loss': 1.7409, 'learning_rate': 2.7253617554965363e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6671/6779 [4:07:38<04:04,  2.27s/it] 98%|█████████▊| 6672/6779 [4:07:41<03:59,  2.23s/it]                                                     {'loss': 1.574, 'learning_rate': 2.6764882409151536e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6672/6779 [4:07:41<03:59,  2.23s/it] 98%|█████████▊| 6673/6779 [4:07:43<03:52,  2.20s/it]                                                     {'loss': 1.5414, 'learning_rate': 2.628056627619113e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6673/6779 [4:07:43<03:52,  2.20s/it] 98%|█████████▊| 6674/6779 [4:07:45<04:00,  2.29s/it]                                                     {'loss': 1.7259, 'learning_rate': 2.580066926323843e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6674/6779 [4:07:45<04:00,  2.29s/it] 98%|█████████▊| 6675/6779 [4:07:48<04:09,  2.40s/it]                                                     {'loss': 1.8061, 'learning_rate': 2.53251914764685e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6675/6779 [4:07:48<04:09,  2.40s/it] 98%|█████████▊| 6676/6779 [4:07:50<03:58,  2.32s/it]                                                     {'loss': 1.6941, 'learning_rate': 2.485413302107942e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6676/6779 [4:07:50<03:58,  2.32s/it] 98%|█████████▊| 6677/6779 [4:07:52<03:48,  2.24s/it]                                                     {'loss': 1.6787, 'learning_rate': 2.4387494001292255e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6677/6779 [4:07:52<03:48,  2.24s/it] 99%|█████████▊| 6678/6779 [4:07:54<03:38,  2.16s/it]                                                     {'loss': 1.6114, 'learning_rate': 2.3925274520348874e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6678/6779 [4:07:54<03:38,  2.16s/it] 99%|█████████▊| 6679/6779 [4:07:56<03:34,  2.15s/it]                                                     {'loss': 1.659, 'learning_rate': 2.3467474680511914e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6679/6779 [4:07:56<03:34,  2.15s/it] 99%|█████████▊| 6680/6779 [4:07:59<03:38,  2.21s/it]                                                     {'loss': 1.5866, 'learning_rate': 2.3014094583071465e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6680/6779 [4:07:59<03:38,  2.21s/it] 99%|█████████▊| 6681/6779 [4:08:01<03:33,  2.18s/it]                                                     {'loss': 1.6975, 'learning_rate': 2.256513432833396e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6681/6779 [4:08:01<03:33,  2.18s/it] 99%|█████████▊| 6682/6779 [4:08:03<03:33,  2.20s/it]                                                     {'loss': 1.6787, 'learning_rate': 2.2120594015628827e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6682/6779 [4:08:03<03:33,  2.20s/it] 99%|█████████▊| 6683/6779 [4:08:05<03:29,  2.18s/it]                                                     {'loss': 1.637, 'learning_rate': 2.1680473743312946e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6683/6779 [4:08:05<03:29,  2.18s/it] 99%|█████████▊| 6684/6779 [4:08:07<03:30,  2.21s/it]                                                     {'loss': 1.7548, 'learning_rate': 2.1244773608761758e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6684/6779 [4:08:07<03:30,  2.21s/it] 99%|█████████▊| 6685/6779 [4:08:10<03:28,  2.22s/it]                                                     {'loss': 1.639, 'learning_rate': 2.081349370836927e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6685/6779 [4:08:10<03:28,  2.22s/it] 99%|█████████▊| 6686/6779 [4:08:12<03:28,  2.24s/it]                                                     {'loss': 1.5657, 'learning_rate': 2.0386634137554707e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6686/6779 [4:08:12<03:28,  2.24s/it] 99%|█████████▊| 6687/6779 [4:08:14<03:33,  2.32s/it]                                                     {'loss': 1.3843, 'learning_rate': 1.996419499076252e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6687/6779 [4:08:14<03:33,  2.32s/it] 99%|█████████▊| 6688/6779 [4:08:17<03:29,  2.30s/it]                                                     {'loss': 1.5935, 'learning_rate': 1.9546176361453505e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6688/6779 [4:08:17<03:29,  2.30s/it] 99%|█████████▊| 6689/6779 [4:08:19<03:22,  2.24s/it]                                                     {'loss': 1.5317, 'learning_rate': 1.9132578342113682e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6689/6779 [4:08:19<03:22,  2.24s/it] 99%|█████████▊| 6690/6779 [4:08:21<03:19,  2.25s/it]                                                     {'loss': 1.5584, 'learning_rate': 1.8723401024249855e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6690/6779 [4:08:21<03:19,  2.25s/it] 99%|█████████▊| 6691/6779 [4:08:23<03:17,  2.25s/it]                                                     {'loss': 1.7973, 'learning_rate': 1.8318644498391824e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6691/6779 [4:08:23<03:17,  2.25s/it] 99%|█████████▊| 6692/6779 [4:08:26<03:19,  2.30s/it]                                                     {'loss': 1.5472, 'learning_rate': 1.7918308854090182e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6692/6779 [4:08:26<03:19,  2.30s/it] 99%|█████████▊| 6693/6779 [4:08:28<03:14,  2.26s/it]                                                     {'loss': 1.8151, 'learning_rate': 1.7522394179918523e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6693/6779 [4:08:28<03:14,  2.26s/it] 99%|█████████▊| 6694/6779 [4:08:30<03:06,  2.20s/it]                                                     {'loss': 1.5415, 'learning_rate': 1.7130900563471218e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6694/6779 [4:08:30<03:06,  2.20s/it] 99%|█████████▉| 6695/6779 [4:08:32<03:01,  2.16s/it]                                                     {'loss': 1.7322, 'learning_rate': 1.6743828091363433e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6695/6779 [4:08:32<03:01,  2.16s/it] 99%|█████████▉| 6696/6779 [4:08:34<02:59,  2.17s/it]                                                     {'loss': 1.7706, 'learning_rate': 1.6361176849235548e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6696/6779 [4:08:34<02:59,  2.17s/it] 99%|█████████▉| 6697/6779 [4:08:36<03:01,  2.22s/it]                                                     {'loss': 1.625, 'learning_rate': 1.598294692174873e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6697/6779 [4:08:36<03:01,  2.22s/it] 99%|█████████▉| 6698/6779 [4:08:41<03:56,  2.93s/it]                                                     {'loss': 1.6415, 'learning_rate': 1.560913839258271e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6698/6779 [4:08:41<03:56,  2.93s/it] 99%|█████████▉| 6699/6779 [4:08:43<03:35,  2.69s/it]                                                     {'loss': 1.641, 'learning_rate': 1.5239751344442444e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6699/6779 [4:08:43<03:35,  2.69s/it] 99%|█████████▉| 6700/6779 [4:08:45<03:15,  2.47s/it]                                                     {'loss': 1.5029, 'learning_rate': 1.4874785859055885e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6700/6779 [4:08:45<03:15,  2.47s/it] 99%|█████████▉| 6701/6779 [4:08:47<03:04,  2.37s/it]                                                     {'loss': 1.6915, 'learning_rate': 1.4514242017165113e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6701/6779 [4:08:47<03:04,  2.37s/it] 99%|█████████▉| 6702/6779 [4:08:50<03:06,  2.42s/it]                                                     {'loss': 1.4707, 'learning_rate': 1.4158119898546318e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6702/6779 [4:08:50<03:06,  2.42s/it] 99%|█████████▉| 6703/6779 [4:08:52<02:58,  2.34s/it]                                                     {'loss': 1.63, 'learning_rate': 1.3806419581983144e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6703/6779 [4:08:52<02:58,  2.34s/it] 99%|█████████▉| 6704/6779 [4:08:54<02:48,  2.25s/it]                                                     {'loss': 1.5542, 'learning_rate': 1.3459141145293342e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6704/6779 [4:08:54<02:48,  2.25s/it] 99%|█████████▉| 6705/6779 [4:08:56<02:45,  2.23s/it]                                                     {'loss': 1.4933, 'learning_rate': 1.3116284665308786e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6705/6779 [4:08:56<02:45,  2.23s/it] 99%|█████████▉| 6706/6779 [4:08:59<02:46,  2.28s/it]                                                     {'loss': 1.7535, 'learning_rate': 1.2777850217884358e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6706/6779 [4:08:59<02:46,  2.28s/it] 99%|█████████▉| 6707/6779 [4:09:01<02:42,  2.25s/it]                                                     {'loss': 1.5854, 'learning_rate': 1.2443837877902376e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6707/6779 [4:09:01<02:42,  2.25s/it] 99%|█████████▉| 6708/6779 [4:09:03<02:44,  2.32s/it]                                                     {'loss': 1.6385, 'learning_rate': 1.2114247719254845e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6708/6779 [4:09:03<02:44,  2.32s/it] 99%|█████████▉| 6709/6779 [4:09:05<02:39,  2.28s/it]                                                     {'loss': 1.5931, 'learning_rate': 1.1789079814867876e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6709/6779 [4:09:05<02:39,  2.28s/it] 99%|█████████▉| 6710/6779 [4:09:08<02:42,  2.36s/it]                                                     {'loss': 1.6102, 'learning_rate': 1.146833423668392e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6710/6779 [4:09:08<02:42,  2.36s/it] 99%|█████████▉| 6711/6779 [4:09:10<02:40,  2.36s/it]                                                     {'loss': 1.4849, 'learning_rate': 1.1152011055663991e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6711/6779 [4:09:10<02:40,  2.36s/it] 99%|█████████▉| 6712/6779 [4:09:13<02:42,  2.42s/it]                                                     {'loss': 1.6799, 'learning_rate': 1.084011034179433e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6712/6779 [4:09:13<02:42,  2.42s/it] 99%|█████████▉| 6713/6779 [4:09:15<02:36,  2.38s/it]                                                     {'loss': 1.5738, 'learning_rate': 1.0532632164081957e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6713/6779 [4:09:15<02:36,  2.38s/it] 99%|█████████▉| 6714/6779 [4:09:17<02:32,  2.35s/it]                                                     {'loss': 1.7244, 'learning_rate': 1.02295765905569e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6714/6779 [4:09:17<02:32,  2.35s/it] 99%|█████████▉| 6715/6779 [4:09:19<02:22,  2.23s/it]                                                     {'loss': 1.4775, 'learning_rate': 9.930943688267747e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6715/6779 [4:09:19<02:22,  2.23s/it] 99%|█████████▉| 6716/6779 [4:09:22<02:19,  2.21s/it]                                                     {'loss': 1.5882, 'learning_rate': 9.63673352328609e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6716/6779 [4:09:22<02:19,  2.21s/it] 99%|█████████▉| 6717/6779 [4:09:24<02:17,  2.22s/it]                                                     {'loss': 1.7264, 'learning_rate': 9.346946160704307e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6717/6779 [4:09:24<02:17,  2.22s/it] 99%|█████████▉| 6718/6779 [4:09:26<02:15,  2.22s/it]                                                     {'loss': 1.8125, 'learning_rate': 9.061581664639995e-08, 'epoch': 0.99}
+ 99%|██��██████▉| 6718/6779 [4:09:26<02:15,  2.22s/it] 99%|█████████▉| 6719/6779 [4:09:28<02:14,  2.24s/it]                                                     {'loss': 1.7882, 'learning_rate': 8.7806400982271e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6719/6779 [4:09:28<02:14,  2.24s/it] 99%|█████████▉| 6720/6779 [4:09:30<02:10,  2.21s/it]                                                     {'loss': 1.5904, 'learning_rate': 8.504121523622566e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6720/6779 [4:09:30<02:10,  2.21s/it] 99%|█████████▉| 6721/6779 [4:09:33<02:11,  2.27s/it]                                                     {'loss': 1.8363, 'learning_rate': 8.232026002004123e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6721/6779 [4:09:33<02:11,  2.27s/it] 99%|█████████▉| 6722/6779 [4:09:35<02:09,  2.26s/it]                                                     {'loss': 1.6809, 'learning_rate': 7.964353593574725e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6722/6779 [4:09:35<02:09,  2.26s/it] 99%|█████████▉| 6723/6779 [4:09:37<02:05,  2.24s/it]                                                     {'loss': 1.5631, 'learning_rate': 7.701104357555889e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6723/6779 [4:09:37<02:05,  2.24s/it] 99%|█████████▉| 6724/6779 [4:09:39<01:58,  2.16s/it]                                                     {'loss': 1.7291, 'learning_rate': 7.442278352187693e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6724/6779 [4:09:39<01:58,  2.16s/it] 99%|█████████▉| 6725/6779 [4:09:41<01:56,  2.16s/it]                                                     {'loss': 1.4773, 'learning_rate': 7.187875634737662e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6725/6779 [4:09:41<01:56,  2.16s/it] 99%|█████████▉| 6726/6779 [4:09:44<01:56,  2.19s/it]                                                     {'loss': 1.7487, 'learning_rate': 6.937896261489663e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6726/6779 [4:09:44<01:56,  2.19s/it] 99%|█████████▉| 6727/6779 [4:09:46<01:55,  2.22s/it]                                                     {'loss': 1.6251, 'learning_rate': 6.692340287750564e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6727/6779 [4:09:46<01:55,  2.22s/it] 99%|█████████▉| 6728/6779 [4:09:48<01:55,  2.26s/it]                                                     {'loss': 1.7076, 'learning_rate': 6.451207767850242e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6728/6779 [4:09:48<01:55,  2.26s/it] 99%|█████████▉| 6729/6779 [4:09:51<01:53,  2.26s/it]                                                     {'loss': 1.7341, 'learning_rate': 6.214498755139352e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6729/6779 [4:09:51<01:53,  2.26s/it] 99%|█████████▉| 6730/6779 [4:09:53<01:52,  2.30s/it]                                                     {'loss': 1.6301, 'learning_rate': 5.982213301987117e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6730/6779 [4:09:53<01:52,  2.30s/it] 99%|█████████▉| 6731/6779 [4:09:55<01:50,  2.29s/it]                                                     {'loss': 1.8338, 'learning_rate': 5.754351459785756e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6731/6779 [4:09:55<01:50,  2.29s/it] 99%|█████████▉| 6732/6779 [4:09:58<01:47,  2.29s/it]                                                     {'loss': 1.7783, 'learning_rate': 5.5309132789505e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6732/6779 [4:09:58<01:47,  2.29s/it] 99%|█████████▉| 6733/6779 [4:09:59<01:40,  2.18s/it]                                                     {'loss': 1.585, 'learning_rate': 5.3118988089151386e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6733/6779 [4:09:59<01:40,  2.18s/it] 99%|█████████▉| 6734/6779 [4:10:02<01:40,  2.23s/it]                                                     {'loss': 1.7663, 'learning_rate': 5.097308098134246e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6734/6779 [4:10:02<01:40,  2.23s/it] 99%|█████████▉| 6735/6779 [4:10:04<01:38,  2.25s/it]                                                     {'loss': 1.7101, 'learning_rate': 4.8871411940898396e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6735/6779 [4:10:04<01:38,  2.25s/it] 99%|█████████▉| 6736/6779 [4:10:06<01:35,  2.22s/it]                                                     {'loss': 1.5368, 'learning_rate': 4.681398143275839e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6736/6779 [4:10:06<01:35,  2.22s/it] 99%|█████████▉| 6737/6779 [4:10:08<01:31,  2.18s/it]                                                     {'loss': 1.5959, 'learning_rate': 4.48007899121583e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6737/6779 [4:10:08<01:31,  2.18s/it] 99%|█████████▉| 6738/6779 [4:10:10<01:28,  2.16s/it]                                                     {'loss': 1.4509, 'learning_rate': 4.28318378244974e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6738/6779 [4:10:10<01:28,  2.16s/it] 99%|█████████▉| 6739/6779 [4:10:13<01:26,  2.17s/it]                                                     {'loss': 1.6258, 'learning_rate': 4.0907125605404994e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6739/6779 [4:10:13<01:26,  2.17s/it] 99%|█████████▉| 6740/6779 [4:10:15<01:24,  2.18s/it]                                                     {'loss': 1.6929, 'learning_rate': 3.9026653680696026e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6740/6779 [4:10:15<01:24,  2.18s/it] 99%|█████████▉| 6741/6779 [4:10:17<01:19,  2.10s/it]                                                     {'loss': 1.7135, 'learning_rate': 3.719042246643767e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6741/6779 [4:10:17<01:19,  2.10s/it] 99%|█████████▉| 6742/6779 [4:10:19<01:18,  2.14s/it]                                                     {'loss': 1.6043, 'learning_rate': 3.5398432368904947e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6742/6779 [4:10:19<01:18,  2.14s/it] 99%|█████████▉| 6743/6779 [4:10:21<01:18,  2.17s/it]                                                     {'loss': 1.7113, 'learning_rate': 3.3650683784536285e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6743/6779 [4:10:21<01:18,  2.17s/it] 99%|█████████▉| 6744/6779 [4:10:23<01:16,  2.20s/it]                                                     {'loss': 1.7011, 'learning_rate': 3.194717710002238e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6744/6779 [4:10:24<01:16,  2.20s/it] 99%|█████████▉| 6745/6779 [4:10:26<01:15,  2.23s/it]                                                     {'loss': 1.5847, 'learning_rate': 3.0287912692283924e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6745/6779 [4:10:26<01:15,  2.23s/it]100%|█████████▉| 6746/6779 [4:10:28<01:13,  2.21s/it]                                                     {'loss': 1.5644, 'learning_rate': 2.8672890928405082e-08, 'epoch': 1.0}
+100%|█████████▉| 6746/6779 [4:10:28<01:13,  2.21s/it]100%|█████████▉| 6747/6779 [4:10:30<01:10,  2.20s/it]                                                     {'loss': 1.7419, 'learning_rate': 2.7102112165700022e-08, 'epoch': 1.0}
+100%|█████████▉| 6747/6779 [4:10:30<01:10,  2.20s/it]100%|█████████▉| 6748/6779 [4:10:32<01:05,  2.12s/it]                                                     {'loss': 1.4936, 'learning_rate': 2.557557675171296e-08, 'epoch': 1.0}
+100%|█████████▉| 6748/6779 [4:10:32<01:05,  2.12s/it]100%|█████████▉| 6749/6779 [4:10:34<01:03,  2.13s/it]                                                     {'loss': 1.5803, 'learning_rate': 2.409328502417374e-08, 'epoch': 1.0}
+100%|█████████▉| 6749/6779 [4:10:34<01:03,  2.13s/it]100%|█████████▉| 6750/6779 [4:10:36<01:00,  2.10s/it]                                                     {'loss': 1.7107, 'learning_rate': 2.2655237311042244e-08, 'epoch': 1.0}
+100%|█████████▉| 6750/6779 [4:10:36<01:00,  2.10s/it]100%|█████████▉| 6751/6779 [4:10:39<01:00,  2.15s/it]                                                     {'loss': 1.6591, 'learning_rate': 2.1261433930486187e-08, 'epoch': 1.0}
+100%|█████████▉| 6751/6779 [4:10:39<01:00,  2.15s/it]100%|█████████▉| 6752/6779 [4:10:41<00:58,  2.17s/it]                                                     {'loss': 1.7434, 'learning_rate': 1.9911875190881114e-08, 'epoch': 1.0}
+100%|█████████▉| 6752/6779 [4:10:41<00:58,  2.17s/it]100%|█████████▉| 6753/6779 [4:10:43<00:55,  2.14s/it]                                                     {'loss': 1.5472, 'learning_rate': 1.86065613907882e-08, 'epoch': 1.0}
+100%|█████████▉| 6753/6779 [4:10:43<00:55,  2.14s/it]100%|█████████▉| 6754/6779 [4:10:45<00:52,  2.11s/it]                                                     {'loss': 1.6049, 'learning_rate': 1.734549281902087e-08, 'epoch': 1.0}
+100%|█████████▉| 6754/6779 [4:10:45<00:52,  2.11s/it]100%|█████████▉| 6755/6779 [4:10:47<00:51,  2.14s/it]                                                     {'loss': 1.8405, 'learning_rate': 1.6128669754600366e-08, 'epoch': 1.0}
+100%|█████████▉| 6755/6779 [4:10:47<00:51,  2.14s/it]100%|█████████▉| 6756/6779 [4:10:49<00:48,  2.12s/it]                                                     {'loss': 1.7371, 'learning_rate': 1.495609246671137e-08, 'epoch': 1.0}
+100%|█████████▉| 6756/6779 [4:10:49<00:48,  2.12s/it]100%|█████████▉| 6757/6779 [4:10:51<00:47,  2.15s/it]                                                     {'loss': 1.6655, 'learning_rate': 1.38277612148352e-08, 'epoch': 1.0}
+100%|█████████▉| 6757/6779 [4:10:51<00:47,  2.15s/it]100%|█████████▉| 6758/6779 [4:10:53<00:44,  2.12s/it]                                                     {'loss': 1.5733, 'learning_rate': 1.2743676248549995e-08, 'epoch': 1.0}
+100%|█████████▉| 6758/6779 [4:10:53<00:44,  2.12s/it]100%|█████████▉| 6759/6779 [4:10:56<00:43,  2.16s/it]                                                     {'loss': 1.7348, 'learning_rate': 1.1703837807730545e-08, 'epoch': 1.0}
+100%|█████████▉| 6759/6779 [4:10:56<00:43,  2.16s/it]100%|█████████▉| 6760/6779 [4:10:58<00:41,  2.20s/it]                                                     {'loss': 1.4912, 'learning_rate': 1.0708246122459464e-08, 'epoch': 1.0}
+100%|█████████▉| 6760/6779 [4:10:58<00:41,  2.20s/it]100%|█████████▉| 6761/6779 [4:11:00<00:39,  2.21s/it]                                                     {'loss': 1.6322, 'learning_rate': 9.7569014129828e-09, 'epoch': 1.0}
+100%|█████████▉| 6761/6779 [4:11:00<00:39,  2.21s/it]100%|█████████▉| 6762/6779 [4:11:02<00:36,  2.15s/it]                                                     {'loss': 1.6059, 'learning_rate': 8.849803889798835e-09, 'epoch': 1.0}
+100%|█████████▉| 6762/6779 [4:11:02<00:36,  2.15s/it]100%|█████████▉| 6763/6779 [4:11:04<00:34,  2.15s/it]                                                     {'loss': 1.6064, 'learning_rate': 7.986953753591486e-09, 'epoch': 1.0}
+100%|█████████▉| 6763/6779 [4:11:04<00:34,  2.15s/it]100%|█████████▉| 6764/6779 [4:11:06<00:31,  2.12s/it]                                                     {'loss': 1.7037, 'learning_rate': 7.168351195252498e-09, 'epoch': 1.0}
+100%|█████████▉| 6764/6779 [4:11:06<00:31,  2.12s/it]100%|█████████▉| 6765/6779 [4:11:08<00:29,  2.10s/it]                                                     {'loss': 1.6314, 'learning_rate': 6.3939963959036566e-09, 'epoch': 1.0}
+100%|█████████▉| 6765/6779 [4:11:08<00:29,  2.10s/it]100%|█████████▉| 6766/6779 [4:11:11<00:27,  2.11s/it]                                                     {'loss': 1.7732, 'learning_rate': 5.663889526874578e-09, 'epoch': 1.0}
+100%|█████████▉| 6766/6779 [4:11:11<00:27,  2.11s/it]100%|█████████▉| 6767/6779 [4:11:13<00:26,  2.17s/it]                                                     {'loss': 1.6985, 'learning_rate': 4.978030749702711e-09, 'epoch': 1.0}
+100%|█████████▉| 6767/6779 [4:11:13<00:26,  2.17s/it]100%|█████████▉| 6768/6779 [4:11:15<00:23,  2.14s/it]                                                     {'loss': 1.7096, 'learning_rate': 4.3364202161111364e-09, 'epoch': 1.0}
+100%|█████████▉| 6768/6779 [4:11:15<00:23,  2.14s/it]100%|█████████▉| 6769/6779 [4:11:17<00:22,  2.24s/it]                                                     {'loss': 1.5892, 'learning_rate': 3.739058068075174e-09, 'epoch': 1.0}
+100%|█████████▉| 6769/6779 [4:11:17<00:22,  2.24s/it]100%|█████████▉| 6770/6779 [4:11:20<00:19,  2.20s/it]                                                     {'loss': 1.6825, 'learning_rate': 3.185944437733568e-09, 'epoch': 1.0}
+100%|█████████▉| 6770/6779 [4:11:20<00:19,  2.20s/it]100%|█████████▉| 6771/6779 [4:11:22<00:17,  2.14s/it]                                                     {'loss': 1.6493, 'learning_rate': 2.6770794474995085e-09, 'epoch': 1.0}
+100%|█████████▉| 6771/6779 [4:11:22<00:17,  2.14s/it]100%|█████████▉| 6772/6779 [4:11:24<00:15,  2.16s/it]                                                     {'loss': 1.48, 'learning_rate': 2.2124632099274067e-09, 'epoch': 1.0}
+100%|█████████▉| 6772/6779 [4:11:24<00:15,  2.16s/it]100%|█████████▉| 6773/6779 [4:11:26<00:12,  2.15s/it]                                                     {'loss': 1.623, 'learning_rate': 1.7920958278239141e-09, 'epoch': 1.0}
+100%|█████████▉| 6773/6779 [4:11:26<00:12,  2.15s/it]100%|█████████▉| 6774/6779 [4:11:28<00:11,  2.22s/it]                                                     {'loss': 1.6811, 'learning_rate': 1.415977394203516e-09, 'epoch': 1.0}
+100%|█████████▉| 6774/6779 [4:11:28<00:11,  2.22s/it]100%|█████████▉| 6775/6779 [4:11:31<00:08,  2.24s/it]                                                     {'loss': 1.6737, 'learning_rate': 1.084107992244121e-09, 'epoch': 1.0}
+100%|█████████▉| 6775/6779 [4:11:31<00:08,  2.24s/it]100%|█████████▉| 6776/6779 [4:11:33<00:06,  2.23s/it]                                                     {'loss': 1.5417, 'learning_rate': 7.964876954202893e-10, 'epoch': 1.0}
+100%|█████████▉| 6776/6779 [4:11:33<00:06,  2.23s/it]100%|█████████▉| 6777/6779 [4:11:35<00:04,  2.21s/it]                                                     {'loss': 1.6738, 'learning_rate': 5.531165673255956e-10, 'epoch': 1.0}
+100%|█████████▉| 6777/6779 [4:11:35<00:04,  2.21s/it]100%|█████████▉| 6778/6779 [4:11:37<00:02,  2.19s/it]                                                     {'loss': 1.6419, 'learning_rate': 3.5399466182806095e-10, 'epoch': 1.0}
+100%|█████████▉| 6778/6779 [4:11:37<00:02,  2.19s/it]100%|██████████| 6779/6779 [4:11:39<00:00,  2.25s/it]                                                     {'loss': 1.7514, 'learning_rate': 1.991220229813351e-10, 'epoch': 1.0}
+100%|██████████| 6779/6779 [4:11:39<00:00,  2.25s/it]                                                     {'train_runtime': 15107.5523, 'train_samples_per_second': 14.359, 'train_steps_per_second': 0.449, 'train_loss': 1.7056976145990375, 'epoch': 1.0}
+100%|██████████| 6779/6779 [4:11:39<00:00,  2.25s/it]100%|██████████| 6779/6779 [4:11:39<00:00,  2.23s/it]
+wandb: 
+wandb: Run history:
+wandb:                    train/epoch ▁▁▁▁▂▂▂▂▂▃▃▃▃▃▄▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▆▇▇▇▇████
+wandb:              train/global_step ▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███
+wandb:            train/learning_rate ▅███████▇▇▇▇▇▆▆▆▆▅▅▅▄▄▄▄▃▃▃▃▂▂▂▂▂▁▁▁▁▁▁▁
+wandb:                     train/loss ▇█▅▄▄▅▆█▆▄▅▅▆▄▅▅▅▆▄▇▅▅▄▅▃▆▃▄▄▆▇▃▃▄▁▃▃▃▃▃
+wandb:               train/total_flos ▁
+wandb:               train/train_loss ▁
+wandb:            train/train_runtime ▁
+wandb: train/train_samples_per_second ▁
+wandb:   train/train_steps_per_second ▁
+wandb: 
+wandb: Run summary:
+wandb:                    train/epoch 1.0
+wandb:              train/global_step 6779
+wandb:            train/learning_rate 0.0
+wandb:                     train/loss 1.7514
+wandb:               train/total_flos 1.5507444499386204e+18
+wandb:               train/train_loss 1.7057
+wandb:            train/train_runtime 15107.5523
+wandb: train/train_samples_per_second 14.359
+wandb:   train/train_steps_per_second 0.449
+wandb: 
+wandb: 🚀 View run belle_dolphine-p12 at: https://wandb.ai/nus_keyu/lora-moe/runs/39wnh4vr
+wandb: Synced 6 W&B file(s), 0 media file(s), 0 artifact file(s) and 0 other file(s)
+wandb: Find logs at: ./wandb/run-20231229_074425-39wnh4vr/logs