Upload folder using huggingface_hub

Browse files

Files changed (13) hide show

.gitattributes +11 -0
README.md +94 -0
gemma-2-9b-it-BF16.gguf +3 -0
gemma-2-9b-it-F32.gguf +3 -0
gemma-2-9b-it-Q3_K_L.gguf +3 -0
gemma-2-9b-it-Q3_K_M.gguf +3 -0
gemma-2-9b-it-Q3_K_S.gguf +3 -0
gemma-2-9b-it-Q4_K_M.gguf +3 -0
gemma-2-9b-it-Q4_K_S.gguf +3 -0
gemma-2-9b-it-Q5_K_M.gguf +3 -0
gemma-2-9b-it-Q5_K_S.gguf +3 -0
gemma-2-9b-it-Q6_K.gguf +3 -0
gemma-2-9b-it-Q8_0.gguf +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,14 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+gemma-2-9b-it-BF16.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-2-9b-it-F32.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-2-9b-it-Q3_K_L.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-2-9b-it-Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-2-9b-it-Q3_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-2-9b-it-Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-2-9b-it-Q4_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-2-9b-it-Q5_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-2-9b-it-Q5_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-2-9b-it-Q6_K.gguf filter=lfs diff=lfs merge=lfs -text
+gemma-2-9b-it-Q8_0.gguf filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,94 @@

+---
+license: gemma
+library_name: transformers
+pipeline_tag: text-generation
+tags:
+- conversational
+- gguf
+- llamacpp
+---
+# Gemma 2 9b Instruction Tuned - GGUF
+These are GGUF quants of [google/gemma-2-9b-it](https://huggingface.co/google/gemma-2-9b-it)
+Details about the model can be found at the above model page.
+## Llamacpp Version
+These quants were made with llamacpp tag b3408.
+If you have problems loading these models, please update your software to se the latest llamacpp version.
+## Perplexity Scoring
+Below are the perplexity scores for the GGUF models. A lower score is better.
+| Quant Level | Perplexity Score | Standard Deviation |
+|-------------|------------------|--------------------|
+| F32 | 8.7849 | 0.06498 |
+| BF16 | 8.7849 | 0.06498 |
+| Q8_0 | 8.7869 | 0.06500 |
+| Q6_K | 8.7972 | 0.06510 |
+| Q5_K_M | 8.7791 | 0.06489 |
+| Q5_K_S | 8.7899 | 0.06503 |
+| Q4_K_M | 8.8745 | 0.06575 |
+| Q4_K_S | 8.9293 | 0.06636 |
+| Q3_K_L | 9.0210 | 0.06693 |
+| Q3_K_M | 9.1213 | 0.06784 |
+| Q3_K_S | 9.1857 | 0.06726 |
+## Quant Details
+This is the script used for quantization.
+```bash
+#!/bin/bash
+# Define MODEL_NAME above the loop
+MODEL_NAME="gemma-2-9b-it"
+# Define the output directory
+outputDir="${MODEL_NAME}-GGUF"
+# Create the output directory if it doesn't exist
+mkdir -p "${outputDir}"
+# Make the F32 quant
+f32file="${outputDir}/${MODEL_NAME}-F32.gguf"
+if [ -f "${f32file}" ]; then
+    echo "Skipping f32 as ${f32file} already exists."
+else
+    python convert_hf_to_gguf.py "~/src/models/${MODEL_NAME}" --outfile "${f32file}" --outtype "f32"
+fi
+# Abort out if the F32 didn't work
+if [ ! -f "${f32file}" ]; then
+   echo "No ${f32file} found."
+   exit 1
+fi
+# Define the array of quantization strings
+quants=("Q8_0" "Q6_K" "Q5_K_M" "Q5_K_S" "Q4_K_M" "Q4_K_S" "Q3_K_L" "Q3_K_M" "Q3_K_S")
+# Loop through the quants array
+for quant in "${quants[@]}"; do
+    outfile="${outputDir}/${MODEL_NAME}-${quant}.gguf"
+    # Check if the outfile already exists
+    if [ -f "${outfile}" ]; then
+        echo "Skipping ${quant} as ${outfile} already exists."
+    else
+        # Run the command with the current quant string
+        ./llama-quantize "${f32file}" "${outfile}" "${quant}"
+        echo "Processed ${quant} and generated ${outfile}"
+    fi
+done
+```

gemma-2-9b-it-BF16.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ca744f215443891f4a431d30209d95f8d0dd6d14a4ff3e277d826561198a4a42
+size 18490680000

gemma-2-9b-it-F32.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e9cd90b8278ffcdb88a1a7554d628e34949e359ca08b0b94d139be72fcf4ad4c
+size 36972880576

gemma-2-9b-it-Q3_K_L.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f78ecceece6cd813f857734076a3c343d08807b34f28e0a869774fef4df6eeff
+size 5132452544

gemma-2-9b-it-Q3_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a2e9f59f7259b8c264444cd2e6687945dea0f85bc1eea03d05dfe1915e080b3c
+size 4761780928

gemma-2-9b-it-Q3_K_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:00f04bad26222a170ab8274ab60c7465f92eb3a29087b95737a059397383d014
+size 4337664704

gemma-2-9b-it-Q4_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b81832fbf2374bef685a93a2db4559f2ea6d91a4bc2eee69ba0d0d257afca2ac
+size 5761057472

gemma-2-9b-it-Q4_K_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb42f812cf50f18ba70ce322d3327a532fd472a106a338533f87765d2ed74518
+size 5478924992

gemma-2-9b-it-Q5_K_M.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:651036e5957221a51d8c5f0cb4cb135d03158a365438c76e5fb9f5dea09e76e1
+size 6647366336

gemma-2-9b-it-Q5_K_S.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ca05d290fed5940110b4c0cfeb089588f678dd10ef6bd0b50765eefa87e6b7f
+size 6483591872

gemma-2-9b-it-Q6_K.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:af29dd73f1ca6eb4426566c00870c4d795a37f064a0efffc7b8f56ad43011e09
+size 7589069504

gemma-2-9b-it-Q8_0.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:399ac085a1814916bf309e7b622e5a91aadaee839a77c26dcc534d17c7af429a
+size 9827148480