End of training

Files changed (4) hide show

README.md CHANGED Viewed

@@ -33,13 +33,13 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 1e-05
 - train_batch_size: 1024
 - eval_batch_size: 1024
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 10
 ### Training results

 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.001
 - train_batch_size: 1024
 - eval_batch_size: 1024
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 5
 ### Training results

adapter_config.json CHANGED Viewed

@@ -24,9 +24,9 @@
   "revision": null,
   "target_modules": [
     "k",
-    "v",
     "o",
-    "q"
   ],
   "task_type": "SEQ_2_SEQ_LM",
   "use_dora": false,

   "revision": null,
   "target_modules": [
     "k",
+    "q",
     "o",
+    "v"
   ],
   "task_type": "SEQ_2_SEQ_LM",
   "use_dora": false,

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b363d16c4098943fc007cc1b99cbdb1a333779321276ed72c7ecef508d07d710
 size 1199384

 version https://git-lfs.github.com/spec/v1
+oid sha256:2b0daea06e06c634dfd7ad669acd665a841941548316ffc09bb71bccd7e1fbf0
 size 1199384

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:06fdec916fdf25d4f1b4897338682dba2f4232c26ec64c3054667b4c1f36b316
 size 5304

 version https://git-lfs.github.com/spec/v1
+oid sha256:eed9b2001bc949ac37be32bec2dcded208be79218c3ae0b3318072f8a4489304
 size 5304