TheBloke
/

TinyLlama-1.1B-Chat-v0.3-AWQ

Text Generation

text-generation-inference

4-bit precision

Model card Files Files and versions Community

TheBloke commited on Nov 9, 2023

Commit

d87af94

•

1 Parent(s): d37052e

Update for Transformers AWQ support

Files changed (1) hide show

config.json +9 -2

config.json CHANGED Viewed

@@ -24,5 +24,12 @@
   "torch_dtype": "float16",
   "transformers_version": "4.34.0.dev0",
   "use_cache": true,
-  "vocab_size": 32003
-}

   "torch_dtype": "float16",
   "transformers_version": "4.34.0.dev0",
   "use_cache": true,
+  "vocab_size": 32003,
+  "quantization_config": {
+    "quant_method": "awq",
+    "zero_point": true,
+    "group_size": 128,
+    "bits": 4,
+    "version": "gemm"
+  }
+}