Upload 8 files

Files changed (4) hide show

adapter_config.json CHANGED Viewed

@@ -20,10 +20,10 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "k_proj",
-    "o_proj",
     "v_proj",
-    "q_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "q_proj",
     "k_proj",
     "v_proj",
+    "o_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a540b5dd60deae2a231f54fc71723b1cea277ad2d9090d330b659e4c5d04dd09
 size 54560368

 version https://git-lfs.github.com/spec/v1
+oid sha256:5f7ae94145a7d9d45bfad555abaa683530e58eab28941d65fe8ca5d97352cbd8
 size 54560368

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:eefd55f3982033908b15a5413dde53f62e591c8452205947c099eb4c27ae5713
 size 27612436

 version https://git-lfs.github.com/spec/v1
+oid sha256:5d823a5493bb5bfd77d12f614b2a30284a47069e0725a72824d16a9ab470392e
 size 27612436

trainer_state.json CHANGED Viewed

@@ -10,32 +10,32 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "grad_norm": 0.8120932579040527,
       "learning_rate": 0.00020029985007496252,
-      "loss": 0.8282,
       "step": 334
     },
     {
       "epoch": 1.0,
-      "eval_loss": 0.681446373462677,
-      "eval_runtime": 19.1333,
-      "eval_samples_per_second": 7.787,
-      "eval_steps_per_second": 0.993,
       "step": 334
     },
     {
       "epoch": 2.0,
-      "grad_norm": 1.972465991973877,
       "learning_rate": 0.0,
-      "loss": 0.6323,
       "step": 668
     },
     {
       "epoch": 2.0,
-      "eval_loss": 0.6428781151771545,
-      "eval_runtime": 18.9197,
-      "eval_samples_per_second": 7.875,
-      "eval_steps_per_second": 1.004,
       "step": 668
     }
   ],

   "log_history": [
     {
       "epoch": 1.0,
+      "grad_norm": 0.7986670732498169,
       "learning_rate": 0.00020029985007496252,
+      "loss": 0.8294,
       "step": 334
     },
     {
       "epoch": 1.0,
+      "eval_loss": 0.6858757138252258,
+      "eval_runtime": 18.9055,
+      "eval_samples_per_second": 7.881,
+      "eval_steps_per_second": 1.005,
       "step": 334
     },
     {
       "epoch": 2.0,
+      "grad_norm": 1.891516089439392,
       "learning_rate": 0.0,
+      "loss": 0.6325,
       "step": 668
     },
     {
       "epoch": 2.0,
+      "eval_loss": 0.6478394865989685,
+      "eval_runtime": 18.8168,
+      "eval_samples_per_second": 7.918,
+      "eval_steps_per_second": 1.01,
       "step": 668
     }
   ],