Upload folder using huggingface_hub

Files changed (5) hide show

adapter_config.json CHANGED Viewed

@@ -20,13 +20,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "q_proj",
-    "v_proj",
-    "up_proj",
-    "k_proj",
     "gate_proj",
     "down_proj",
-    "o_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "gate_proj",
     "down_proj",
+    "v_proj",
+    "o_proj",
+    "q_proj",
+    "up_proj",
+    "k_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9d1f2f5cfc5826a2b2fef3a62b0c9435c2c082d599ec3d97712eb11bec1ab2af
 size 35669232

 version https://git-lfs.github.com/spec/v1
+oid sha256:ded5364855d145f720ea7e00dc68cf96967cb2c2a0ce8c86772e68e7294ab5a7
 size 35669232

image_projector.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:67ace4e904ebf5e0524ca78eeb7d9899e1d5f6a4d84135469950b27c791e10a9
-size 29379352

 version https://git-lfs.github.com/spec/v1
+oid sha256:64fd5e1ea7b8443db753d169bc706acaf8e1a1fca73042f29a25af4323e8528a
+size 22031128

lora_weights.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:05190f07b7d3f2c882001373a6156ca05d7ee7a5324beddc57959449720c41e6
 size 35697862

 version https://git-lfs.github.com/spec/v1
+oid sha256:ae5b274f8048254edcd77a1bd6b687e9a1d2eb23a8e7d3300614e5d23c63b803
 size 35697862

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "epoch": 0.16309412861137,
-  "global_step": 350,
   "max_steps": 2146,
   "logging_steps": 25,
   "eval_steps": 50,
@@ -8,7 +8,7 @@
   "train_batch_size": 8,
   "num_train_epochs": 1,
   "num_input_tokens_seen": 0,
-  "total_flos": 1.6047778948703846e+17,
   "log_history": [
     {
       "loss": 3.9545,
@@ -163,6 +163,13 @@
       "eval_steps_per_second": 0.14,
       "epoch": 0.16309412861137,
       "step": 350
     }
   ],
   "best_metric": null,

 {
+  "epoch": 0.17474370922646784,
+  "global_step": 375,
   "max_steps": 2146,
   "logging_steps": 25,
   "eval_steps": 50,
   "train_batch_size": 8,
   "num_train_epochs": 1,
   "num_input_tokens_seen": 0,
+  "total_flos": 1.73442819438379e+17,
   "log_history": [
     {
       "loss": 3.9545,
       "eval_steps_per_second": 0.14,
       "epoch": 0.16309412861137,
       "step": 350
+    },
+    {
+      "loss": 198.4288,
+      "grad_norm": NaN,
+      "learning_rate": 5.8139534883720933e-05,
+      "epoch": 0.17474370922646784,
+      "step": 375
     }
   ],
   "best_metric": null,