ZeroUniqueness commited on Aug 18, 2023

Commit

3ca1cd1

1 Parent(s): 39da2b1

donezos

Browse files

Files changed (50) hide show

README.md +13 -0
adapter_model.bin +1 -1
checkpoint-77500/adapter_model.bin +0 -3
checkpoint-77500/adapter_model/adapter_model.bin +0 -3
checkpoint-78000/adapter_model.bin +0 -3
checkpoint-78000/adapter_model/adapter_model.bin +0 -3
{checkpoint-76500 → checkpoint-78500}/README.md +0 -0
{checkpoint-76500 → checkpoint-78500}/adapter_config.json +0 -0
{checkpoint-76500 → checkpoint-78500}/adapter_model.bin +1 -1
{checkpoint-76500 → checkpoint-78500}/adapter_model/README.md +0 -0
{checkpoint-76500 → checkpoint-78500}/adapter_model/adapter_config.json +0 -0
{checkpoint-76500 → checkpoint-78500}/adapter_model/adapter_model.bin +1 -1
{checkpoint-77000 → checkpoint-78500}/optimizer.pt +1 -1
{checkpoint-77000 → checkpoint-78500}/rng_state.pth +1 -1
{checkpoint-77500 → checkpoint-78500}/scheduler.pt +1 -1
{checkpoint-78000 → checkpoint-78500}/trainer_state.json +19 -5
{checkpoint-76500 → checkpoint-78500}/training_args.bin +0 -0
{checkpoint-77000 → checkpoint-79000}/README.md +0 -0
{checkpoint-77000 → checkpoint-79000}/adapter_config.json +0 -0
{checkpoint-77000 → checkpoint-79000}/adapter_model.bin +1 -1
{checkpoint-77000 → checkpoint-79000}/adapter_model/README.md +0 -0
{checkpoint-77000 → checkpoint-79000}/adapter_model/adapter_config.json +0 -0
{checkpoint-77000 → checkpoint-79000}/adapter_model/adapter_model.bin +1 -1
{checkpoint-77500 → checkpoint-79000}/optimizer.pt +1 -1
{checkpoint-77500 → checkpoint-79000}/rng_state.pth +1 -1
{checkpoint-77000 → checkpoint-79000}/scheduler.pt +1 -1
{checkpoint-77500 → checkpoint-79000}/trainer_state.json +47 -5
{checkpoint-77000 → checkpoint-79000}/training_args.bin +0 -0
{checkpoint-77500 → checkpoint-79500}/README.md +0 -0
{checkpoint-77500 → checkpoint-79500}/adapter_config.json +0 -0
checkpoint-79500/adapter_model.bin +3 -0
{checkpoint-77500 → checkpoint-79500}/adapter_model/README.md +0 -0
{checkpoint-77500 → checkpoint-79500}/adapter_model/adapter_config.json +0 -0
checkpoint-79500/adapter_model/adapter_model.bin +3 -0
{checkpoint-76500 → checkpoint-79500}/optimizer.pt +1 -1
{checkpoint-78000 → checkpoint-79500}/rng_state.pth +1 -1
{checkpoint-76500 → checkpoint-79500}/scheduler.pt +1 -1
{checkpoint-77000 → checkpoint-79500}/trainer_state.json +75 -5
{checkpoint-77500 → checkpoint-79500}/training_args.bin +0 -0
{checkpoint-78000 → checkpoint-80000}/README.md +0 -0
{checkpoint-78000 → checkpoint-80000}/adapter_config.json +0 -0
checkpoint-80000/adapter_model.bin +3 -0
{checkpoint-78000 → checkpoint-80000}/adapter_model/README.md +0 -0
{checkpoint-78000 → checkpoint-80000}/adapter_model/adapter_config.json +0 -0
checkpoint-80000/adapter_model/adapter_model.bin +3 -0
{checkpoint-78000 → checkpoint-80000}/optimizer.pt +1 -1
{checkpoint-76500 → checkpoint-80000}/rng_state.pth +1 -1
{checkpoint-78000 → checkpoint-80000}/scheduler.pt +1 -1
{checkpoint-76500 → checkpoint-80000}/trainer_state.json +103 -5
{checkpoint-78000 → checkpoint-80000}/training_args.bin +0 -0

README.md CHANGED Viewed

@@ -4,6 +4,18 @@ library_name: peft
 ## Training procedure
 The following `bitsandbytes` quantization config was used during training:
 - load_in_8bit: False
 - load_in_4bit: True
@@ -76,5 +88,6 @@ The following `bitsandbytes` quantization config was used during training:
 - PEFT 0.5.0.dev0
 - PEFT 0.5.0.dev0
 - PEFT 0.5.0.dev0
 - PEFT 0.5.0.dev0

 ## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: True
+- bnb_4bit_compute_dtype: bfloat16
 The following `bitsandbytes` quantization config was used during training:
 - load_in_8bit: False
 - load_in_4bit: True
 - PEFT 0.5.0.dev0
 - PEFT 0.5.0.dev0
 - PEFT 0.5.0.dev0
+- PEFT 0.5.0.dev0
 - PEFT 0.5.0.dev0

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8a95e49326f95cbf72dea87596b1fd0bcc1abcccd06310612c0ac6bdb3314bc1
 size 500897101

 version https://git-lfs.github.com/spec/v1
+oid sha256:a63171e37485368f4ae8c7a1aa1cb52caf8554a5c9b41c606ea3445d147683d5
 size 500897101

checkpoint-77500/adapter_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:a884eb86c6d63307c9acb52dd6a2b1b5697accc52a54a952355462a2d1ff4bb1
-size 500897101

checkpoint-77500/adapter_model/adapter_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:a884eb86c6d63307c9acb52dd6a2b1b5697accc52a54a952355462a2d1ff4bb1
-size 500897101

checkpoint-78000/adapter_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:8a95e49326f95cbf72dea87596b1fd0bcc1abcccd06310612c0ac6bdb3314bc1
-size 500897101

checkpoint-78000/adapter_model/adapter_model.bin DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:8a95e49326f95cbf72dea87596b1fd0bcc1abcccd06310612c0ac6bdb3314bc1
-size 500897101

{checkpoint-76500 → checkpoint-78500}/README.md RENAMED Viewed

File without changes

{checkpoint-76500 → checkpoint-78500}/adapter_config.json RENAMED Viewed

File without changes

{checkpoint-76500 → checkpoint-78500}/adapter_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3aac0f31027f89872a0b3f8a0a220bec95e100567f0e22fd44826f62a28c01a6
 size 500897101

 version https://git-lfs.github.com/spec/v1
+oid sha256:a63171e37485368f4ae8c7a1aa1cb52caf8554a5c9b41c606ea3445d147683d5
 size 500897101

{checkpoint-76500 → checkpoint-78500}/adapter_model/README.md RENAMED Viewed

File without changes

{checkpoint-76500 → checkpoint-78500}/adapter_model/adapter_config.json RENAMED Viewed

File without changes

{checkpoint-76500 → checkpoint-78500}/adapter_model/adapter_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3aac0f31027f89872a0b3f8a0a220bec95e100567f0e22fd44826f62a28c01a6
 size 500897101

 version https://git-lfs.github.com/spec/v1
+oid sha256:a63171e37485368f4ae8c7a1aa1cb52caf8554a5c9b41c606ea3445d147683d5
 size 500897101

{checkpoint-77000 → checkpoint-78500}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b09958ee930a5c1cdb447dc5ca98b44b0a8ac3e23351c47128a6daf915aa3809
 size 1001724605

 version https://git-lfs.github.com/spec/v1
+oid sha256:b94c97020101dfe8988e5cf3a67d34dc5cd78e5e4685fc7e9f6428c508ff53ce
 size 1001724605

{checkpoint-77000 → checkpoint-78500}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f162395a6f7d2e1af70b53e882440048027967f43d5301d750609c6c591e4ca3
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:b76070aa3a97b4296cfe30e77dcd74707dea42092548a8b07d9605050d31f3af
 size 14575

{checkpoint-77500 → checkpoint-78500}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ea97f91717d4e226e2157501dd3a83bc130311da389f901511bd22351a008c26
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:b0b4a7a47b7400044f7b7933b36f7c700f5c879afac5320d98411ec041812fdc
 size 627

{checkpoint-78000 → checkpoint-78500}/trainer_state.json RENAMED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 0.4757947325706482,
-  "best_model_checkpoint": "./qlora-out/checkpoint-78000",
-  "epoch": 2.908168972074121,
   "eval_steps": 500,
-  "global_step": 78000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -4551,13 +4551,27 @@
       "eval_samples_per_second": 0.427,
       "eval_steps_per_second": 0.427,
       "step": 78000
     }
   ],
   "logging_steps": 500,
   "max_steps": 80463,
   "num_train_epochs": 3,
   "save_steps": 500,
-  "total_flos": 2.1910553027265577e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.47572794556617737,
+  "best_model_checkpoint": "./qlora-out/checkpoint-78500",
+  "epoch": 2.926811080869468,
   "eval_steps": 500,
+  "global_step": 78500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 0.427,
       "eval_steps_per_second": 0.427,
       "step": 78000
+    },
+    {
+      "epoch": 2.93,
+      "learning_rate": 2.9363864105907967e-07,
+      "loss": 0.3633,
+      "step": 78500
+    },
+    {
+      "epoch": 2.93,
+      "eval_loss": 0.47572794556617737,
+      "eval_runtime": 1284.2805,
+      "eval_samples_per_second": 0.422,
+      "eval_steps_per_second": 0.422,
+      "step": 78500
     }
   ],
   "logging_steps": 500,
   "max_steps": 80463,
   "num_train_epochs": 3,
   "save_steps": 500,
+  "total_flos": 2.205083454877704e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-76500 → checkpoint-78500}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-77000 → checkpoint-79000}/README.md RENAMED Viewed

File without changes

{checkpoint-77000 → checkpoint-79000}/adapter_config.json RENAMED Viewed

File without changes

{checkpoint-77000 → checkpoint-79000}/adapter_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1427c39ed89366176a26d42309badaecc4eaac4173d3df01371a38612540cbce
 size 500897101

 version https://git-lfs.github.com/spec/v1
+oid sha256:54cdaa3b50871ca412658af6dafb529a52b86753ff9526fee0e1b74954640aa4
 size 500897101

{checkpoint-77000 → checkpoint-79000}/adapter_model/README.md RENAMED Viewed

File without changes

{checkpoint-77000 → checkpoint-79000}/adapter_model/adapter_config.json RENAMED Viewed

File without changes

{checkpoint-77000 → checkpoint-79000}/adapter_model/adapter_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1427c39ed89366176a26d42309badaecc4eaac4173d3df01371a38612540cbce
 size 500897101

 version https://git-lfs.github.com/spec/v1
+oid sha256:54cdaa3b50871ca412658af6dafb529a52b86753ff9526fee0e1b74954640aa4
 size 500897101

{checkpoint-77500 → checkpoint-79000}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:21a191193d80b976badbd98b5f53b496006b6f2a29af8b6d8dca0b1e0b7ecbe4
 size 1001724605

 version https://git-lfs.github.com/spec/v1
+oid sha256:50d0a52aeee43e33265bda6c05b10da12477313f3f2c4ef29276aa29bb0cd412
 size 1001724605

{checkpoint-77500 → checkpoint-79000}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:077d679486328cc243c50097dc890c036a89503397938038ef9689bd7097c327
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:eac837ea1eac58f4aaf90b3c888590c6a34139d2391df0c00f93ad613d9d2fe4
 size 14575

{checkpoint-77000 → checkpoint-79000}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:35a18202efac039c56b779ce26337552adb710311faff67d76d05cf3142d22af
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:818c4b15e458686761dbc223e6f958ab0a422ba783d422c1d2eee54f27b9caa2
 size 627

{checkpoint-77500 → checkpoint-79000}/trainer_state.json RENAMED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 0.47582224011421204,
-  "best_model_checkpoint": "./qlora-out/checkpoint-77000",
-  "epoch": 2.889526863278774,
   "eval_steps": 500,
-  "global_step": 77500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -4537,13 +4537,55 @@
       "eval_samples_per_second": 0.413,
       "eval_steps_per_second": 0.413,
       "step": 77500
     }
   ],
   "logging_steps": 500,
   "max_steps": 80463,
   "num_train_epochs": 3,
   "save_steps": 500,
-  "total_flos": 2.1768185355260805e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.47572794556617737,
+  "best_model_checkpoint": "./qlora-out/checkpoint-78500",
+  "epoch": 2.945453189664815,
   "eval_steps": 500,
+  "global_step": 79000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 0.413,
       "eval_steps_per_second": 0.413,
       "step": 77500
+    },
+    {
+      "epoch": 2.91,
+      "learning_rate": 4.6214609844061894e-07,
+      "loss": 0.3696,
+      "step": 78000
+    },
+    {
+      "epoch": 2.91,
+      "eval_loss": 0.4757947325706482,
+      "eval_runtime": 1268.9631,
+      "eval_samples_per_second": 0.427,
+      "eval_steps_per_second": 0.427,
+      "step": 78000
+    },
+    {
+      "epoch": 2.93,
+      "learning_rate": 2.9363864105907967e-07,
+      "loss": 0.3633,
+      "step": 78500
+    },
+    {
+      "epoch": 2.93,
+      "eval_loss": 0.47572794556617737,
+      "eval_runtime": 1284.2805,
+      "eval_samples_per_second": 0.422,
+      "eval_steps_per_second": 0.422,
+      "step": 78500
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 1.6313824917496555e-07,
+      "loss": 0.3712,
+      "step": 79000
+    },
+    {
+      "epoch": 2.95,
+      "eval_loss": 0.47579219937324524,
+      "eval_runtime": 1333.9827,
+      "eval_samples_per_second": 0.406,
+      "eval_steps_per_second": 0.406,
+      "step": 79000
     }
   ],
   "logging_steps": 500,
   "max_steps": 80463,
   "num_train_epochs": 3,
   "save_steps": 500,
+  "total_flos": 2.219205598424703e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-77000 → checkpoint-79000}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-77500 → checkpoint-79500}/README.md RENAMED Viewed

File without changes

{checkpoint-77500 → checkpoint-79500}/adapter_config.json RENAMED Viewed

File without changes

checkpoint-79500/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0aec4531d523e5f1c6d00064a04d505d2c8cc46f2254d5f97c50a6d3f19d57e7
+size 500897101

{checkpoint-77500 → checkpoint-79500}/adapter_model/README.md RENAMED Viewed

File without changes

{checkpoint-77500 → checkpoint-79500}/adapter_model/adapter_config.json RENAMED Viewed

File without changes

checkpoint-79500/adapter_model/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0aec4531d523e5f1c6d00064a04d505d2c8cc46f2254d5f97c50a6d3f19d57e7
+size 500897101

{checkpoint-76500 → checkpoint-79500}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dbbb89893d47261fd01a9f3778a4172d980e5d5d899645ffb5c27307d67df6b6
 size 1001724605

 version https://git-lfs.github.com/spec/v1
+oid sha256:66d9344a9200b364b04ea1c7047cb7f771a81a931263b0a8299e74a1dbc21123
 size 1001724605

{checkpoint-78000 → checkpoint-79500}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cae952b189b908268d157bce31712cd2487d9ad50a53ef0ae319c8f965d6c13c
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:66d629d451a682f1240d2ed68e0aa31eff4552d6f44511ee41e17ea77a083291
 size 14575

{checkpoint-76500 → checkpoint-79500}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:220829e44432d3fbc0f85c119c5401ba1c2989f858b8188acbaba28a1379d42e
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:85630629004d37069a695741c2bbf4ff767e7519f39623048a26a45a1e93ca39
 size 627

{checkpoint-77000 → checkpoint-79500}/trainer_state.json RENAMED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 0.47582224011421204,
-  "best_model_checkpoint": "./qlora-out/checkpoint-77000",
-  "epoch": 2.870884754483427,
   "eval_steps": 500,
-  "global_step": 77000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -4523,13 +4523,83 @@
       "eval_samples_per_second": 0.419,
       "eval_steps_per_second": 0.419,
       "step": 77000
     }
   ],
   "logging_steps": 500,
   "max_steps": 80463,
   "num_train_epochs": 3,
   "save_steps": 500,
-  "total_flos": 2.1626487594830807e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.47572794556617737,
+  "best_model_checkpoint": "./qlora-out/checkpoint-78500",
+  "epoch": 2.964095298460162,
   "eval_steps": 500,
+  "global_step": 79500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 0.419,
       "eval_steps_per_second": 0.419,
       "step": 77000
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 6.685963879659362e-07,
+      "loss": 0.3675,
+      "step": 77500
+    },
+    {
+      "epoch": 2.89,
+      "eval_loss": 0.4758478105068207,
+      "eval_runtime": 1311.0096,
+      "eval_samples_per_second": 0.413,
+      "eval_steps_per_second": 0.413,
+      "step": 77500
+    },
+    {
+      "epoch": 2.91,
+      "learning_rate": 4.6214609844061894e-07,
+      "loss": 0.3696,
+      "step": 78000
+    },
+    {
+      "epoch": 2.91,
+      "eval_loss": 0.4757947325706482,
+      "eval_runtime": 1268.9631,
+      "eval_samples_per_second": 0.427,
+      "eval_steps_per_second": 0.427,
+      "step": 78000
+    },
+    {
+      "epoch": 2.93,
+      "learning_rate": 2.9363864105907967e-07,
+      "loss": 0.3633,
+      "step": 78500
+    },
+    {
+      "epoch": 2.93,
+      "eval_loss": 0.47572794556617737,
+      "eval_runtime": 1284.2805,
+      "eval_samples_per_second": 0.422,
+      "eval_steps_per_second": 0.422,
+      "step": 78500
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 1.6313824917496555e-07,
+      "loss": 0.3712,
+      "step": 79000
+    },
+    {
+      "epoch": 2.95,
+      "eval_loss": 0.47579219937324524,
+      "eval_runtime": 1333.9827,
+      "eval_samples_per_second": 0.406,
+      "eval_steps_per_second": 0.406,
+      "step": 79000
+    },
+    {
+      "epoch": 2.96,
+      "learning_rate": 7.069466822952065e-08,
+      "loss": 0.37,
+      "step": 79500
+    },
+    {
+      "epoch": 2.96,
+      "eval_loss": 0.47579482197761536,
+      "eval_runtime": 1343.7136,
+      "eval_samples_per_second": 0.403,
+      "eval_steps_per_second": 0.403,
+      "step": 79500
     }
   ],
   "logging_steps": 500,
   "max_steps": 80463,
   "num_train_epochs": 3,
   "save_steps": 500,
+  "total_flos": 2.2334186767367946e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-77500 → checkpoint-79500}/training_args.bin RENAMED Viewed

File without changes

{checkpoint-78000 → checkpoint-80000}/README.md RENAMED Viewed

File without changes

{checkpoint-78000 → checkpoint-80000}/adapter_config.json RENAMED Viewed

File without changes

checkpoint-80000/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bb4d05e080adb0e5195e39d104132e2826c45ae5f84e265fc57e9babe3f31e2e
+size 500897101

{checkpoint-78000 → checkpoint-80000}/adapter_model/README.md RENAMED Viewed

File without changes

{checkpoint-78000 → checkpoint-80000}/adapter_model/adapter_config.json RENAMED Viewed

File without changes

checkpoint-80000/adapter_model/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bb4d05e080adb0e5195e39d104132e2826c45ae5f84e265fc57e9babe3f31e2e
+size 500897101

{checkpoint-78000 → checkpoint-80000}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ad0ade3b6ce4741aa4976bb9b0aae8b16a0605bea6020968a870961a9dc6cf7f
 size 1001724605

 version https://git-lfs.github.com/spec/v1
+oid sha256:d872aa8649276d07a16445e8ad1f9857b024aeb2bc7ef434f10697d68093bd70
 size 1001724605

{checkpoint-76500 → checkpoint-80000}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:77cc93baddf8ab32d29af2c1c219f38a87a8af2868d723737c13df696ee1f2ad
 size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:88aed6b668511a80acef03aeb5954058975243c279e1a2f0605b6635eddb4d13
 size 14575

{checkpoint-78000 → checkpoint-80000}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:495a1512040b6a087956ab3f68fd532032c899c1dae932d93c4b1ba403b50d1d
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:07c85d472815ff7897a1300024f3cab1032a73a2e8ce83cd10c397998eec29c6
 size 627

{checkpoint-76500 → checkpoint-80000}/trainer_state.json RENAMED Viewed

@@ -1,9 +1,9 @@
 {
-  "best_metric": 0.4760077893733978,
-  "best_model_checkpoint": "./qlora-out/checkpoint-76500",
-  "epoch": 2.8522426456880803,
   "eval_steps": 500,
-  "global_step": 76500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -4509,13 +4509,111 @@
       "eval_samples_per_second": 0.419,
       "eval_steps_per_second": 0.419,
       "step": 76500
     }
   ],
   "logging_steps": 500,
   "max_steps": 80463,
   "num_train_epochs": 3,
   "save_steps": 500,
-  "total_flos": 2.14853629526682e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.47572794556617737,
+  "best_model_checkpoint": "./qlora-out/checkpoint-78500",
+  "epoch": 2.9827374072555086,
   "eval_steps": 500,
+  "global_step": 80000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 0.419,
       "eval_steps_per_second": 0.419,
       "step": 76500
+    },
+    {
+      "epoch": 2.87,
+      "learning_rate": 9.129108128541176e-07,
+      "loss": 0.3658,
+      "step": 77000
+    },
+    {
+      "epoch": 2.87,
+      "eval_loss": 0.47582224011421204,
+      "eval_runtime": 1293.6591,
+      "eval_samples_per_second": 0.419,
+      "eval_steps_per_second": 0.419,
+      "step": 77000
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 6.685963879659362e-07,
+      "loss": 0.3675,
+      "step": 77500
+    },
+    {
+      "epoch": 2.89,
+      "eval_loss": 0.4758478105068207,
+      "eval_runtime": 1311.0096,
+      "eval_samples_per_second": 0.413,
+      "eval_steps_per_second": 0.413,
+      "step": 77500
+    },
+    {
+      "epoch": 2.91,
+      "learning_rate": 4.6214609844061894e-07,
+      "loss": 0.3696,
+      "step": 78000
+    },
+    {
+      "epoch": 2.91,
+      "eval_loss": 0.4757947325706482,
+      "eval_runtime": 1268.9631,
+      "eval_samples_per_second": 0.427,
+      "eval_steps_per_second": 0.427,
+      "step": 78000
+    },
+    {
+      "epoch": 2.93,
+      "learning_rate": 2.9363864105907967e-07,
+      "loss": 0.3633,
+      "step": 78500
+    },
+    {
+      "epoch": 2.93,
+      "eval_loss": 0.47572794556617737,
+      "eval_runtime": 1284.2805,
+      "eval_samples_per_second": 0.422,
+      "eval_steps_per_second": 0.422,
+      "step": 78500
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 1.6313824917496555e-07,
+      "loss": 0.3712,
+      "step": 79000
+    },
+    {
+      "epoch": 2.95,
+      "eval_loss": 0.47579219937324524,
+      "eval_runtime": 1333.9827,
+      "eval_samples_per_second": 0.406,
+      "eval_steps_per_second": 0.406,
+      "step": 79000
+    },
+    {
+      "epoch": 2.96,
+      "learning_rate": 7.069466822952065e-08,
+      "loss": 0.37,
+      "step": 79500
+    },
+    {
+      "epoch": 2.96,
+      "eval_loss": 0.47579482197761536,
+      "eval_runtime": 1343.7136,
+      "eval_samples_per_second": 0.403,
+      "eval_steps_per_second": 0.403,
+      "step": 79500
+    },
+    {
+      "epoch": 2.98,
+      "learning_rate": 1.6343136789165324e-08,
+      "loss": 0.3647,
+      "step": 80000
+    },
+    {
+      "epoch": 2.98,
+      "eval_loss": 0.475759357213974,
+      "eval_runtime": 1306.8248,
+      "eval_samples_per_second": 0.415,
+      "eval_steps_per_second": 0.415,
+      "step": 80000
     }
   ],
   "logging_steps": 500,
   "max_steps": 80463,
   "num_train_epochs": 3,
   "save_steps": 500,
+  "total_flos": 2.2475568675952804e+19,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-78000 → checkpoint-80000}/training_args.bin RENAMED Viewed

File without changes