OpenPipe
/

Hermes-2-Pro-Llama-3-8B-32k

corbt commited on May 17

Commit

e0bb49b

•

1 Parent(s): 59331ab

enable rope_scaling to allow context lengths up to 32k tokens

Files changed (1) hide show

config.json CHANGED Viewed

@@ -18,7 +18,10 @@
   "num_key_value_heads": 8,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
-  "rope_scaling": null,
   "rope_theta": 500000.0,
   "tie_word_embeddings": false,
   "torch_dtype": "float16",

   "num_key_value_heads": 8,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "type": "dynamic",
+    "factor": 4.0
+  },
   "rope_theta": 500000.0,
   "tie_word_embeddings": false,
   "torch_dtype": "float16",