TheBloke
/

Airoboros-L2-70B-2.1-GGUF

Transformers

GGUF

llama

text-generation-inference

Model card Files Files and versions Community

TheBloke commited on Aug 29, 2023

Commit

e2434f0

•

1 Parent(s): d20b92b

Initial GGUF model commit

Browse files

Files changed (1) hide show

README.md +7 -45

README.md CHANGED Viewed

@@ -5,7 +5,7 @@ inference: false
 license: llama2
 model_creator: Jon Durbin
 model_link: https://huggingface.co/jondurbin/airoboros-l2-70b-2.1
-model_name: Airoboros L2 70B
 model_type: llama
 quantized_by: TheBloke
 ---
@@ -27,13 +27,13 @@ quantized_by: TheBloke
 <hr style="margin-top: 1.0em; margin-bottom: 1.0em;">
 <!-- header end -->
-# Airoboros L2 70B - GGUF
 - Model creator: [Jon Durbin](https://huggingface.co/jondurbin)
-- Original model: [Airoboros L2 70B](https://huggingface.co/jondurbin/airoboros-l2-70b-2.1)
 ## Description
-This repo contains GGUF format model files for [Jon Durbin's Airoboros L2 70B](https://huggingface.co/jondurbin/airoboros-l2-70b-2.1).
 <!-- README_GGUF.md-about-gguf start -->
 ### About GGUF
@@ -109,53 +109,15 @@ Refer to the Provided Files table below to see what files use which methods, and
 | [airoboros-l2-70b-2.1.Q3_K_S.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q3_K_S.gguf) | Q3_K_S | 3 | 29.92 GB| 32.42 GB | very small, high quality loss |
 | [airoboros-l2-70b-2.1.Q3_K_M.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q3_K_M.gguf) | Q3_K_M | 3 | 33.19 GB| 35.69 GB | very small, high quality loss |
 | [airoboros-l2-70b-2.1.Q3_K_L.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q3_K_L.gguf) | Q3_K_L | 3 | 36.15 GB| 38.65 GB | small, substantial quality loss |
-| [airoboros-l2-70b-2.1.Q8_0.gguf-split-b](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q8_0.gguf-split-b) | Q8_0 | 8 | 36.53 GB| 39.03 GB | very large, extremely low quality loss - not recommended |
 | [airoboros-l2-70b-2.1.Q6_K.gguf-split-a](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q6_K.gguf-split-a) | Q6_K | 6 | 36.70 GB| 39.20 GB | very large, extremely low quality loss |
 | [airoboros-l2-70b-2.1.Q8_0.gguf-split-a](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q8_0.gguf-split-a) | Q8_0 | 8 | 36.70 GB| 39.20 GB | very large, extremely low quality loss - not recommended |
 | [airoboros-l2-70b-2.1.Q4_K_S.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q4_K_S.gguf) | Q4_K_S | 4 | 39.07 GB| 41.57 GB | small, greater quality loss |
 | [airoboros-l2-70b-2.1.Q4_K_M.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q4_K_M.gguf) | Q4_K_M | 4 | 41.42 GB| 43.92 GB | medium, balanced quality - recommended |
 | [airoboros-l2-70b-2.1.Q5_K_S.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q5_K_S.gguf) | Q5_K_S | 5 | 47.46 GB| 49.96 GB | large, low quality loss - recommended |
 | [airoboros-l2-70b-2.1.Q5_K_M.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q5_K_M.gguf) | Q5_K_M | 5 | 48.75 GB| 51.25 GB | large, very low quality loss - recommended |
-| airoboros-l2-70b-2.1.Q6_K.gguf | q6_K | 6 | 56.82 GB | 59.32 GB | very large, extremely low quality loss |
-| airoboros-l2-70b-2.1.Q8_0.gguf | q8_0 | 8 | 73.29 GB | 75.79 GB | very large, extremely low quality loss - not recommended |
 **Note**: the above RAM figures assume no GPU offloading. If layers are offloaded to the GPU, this will reduce RAM usage and use VRAM instead.
-### Q6_K and Q8_0 files are split and require joining
-**Note:** HF does not support uploading files larger than 50GB. Therefore I have uploaded the Q6_K and Q8_0 files as split files.
-<details>
-  <summary>Click for instructions regarding Q6_K and Q8_0 files</summary>
-### q6_K
-Please download:
-* `airoboros-l2-70b-2.1.Q6_K.gguf-split-a`
-* `airoboros-l2-70b-2.1.Q6_K.gguf-split-b`
-### q8_0
-Please download:
-* `airoboros-l2-70b-2.1.Q8_0.gguf-split-a`
-* `airoboros-l2-70b-2.1.Q8_0.gguf-split-b`
-To join the files, do the following:
-Linux and macOS:
-```
-cat airoboros-l2-70b-2.1.Q6_K.gguf-split-* > airoboros-l2-70b-2.1.Q6_K.gguf && rm airoboros-l2-70b-2.1.Q6_K.gguf-split-*
-cat airoboros-l2-70b-2.1.Q8_0.gguf-split-* > airoboros-l2-70b-2.1.Q8_0.gguf && rm airoboros-l2-70b-2.1.Q8_0.gguf-split-*
-```
-Windows command line:
-```
-COPY /B airoboros-l2-70b-2.1.Q6_K.gguf-split-a + airoboros-l2-70b-2.1.Q6_K.gguf-split-b airoboros-l2-70b-2.1.Q6_K.gguf
-del airoboros-l2-70b-2.1.Q6_K.gguf-split-a airoboros-l2-70b-2.1.Q6_K.gguf-split-b
-COPY /B airoboros-l2-70b-2.1.Q8_0.gguf-split-a + airoboros-l2-70b-2.1.Q8_0.gguf-split-b airoboros-l2-70b-2.1.Q8_0.gguf
-del airoboros-l2-70b-2.1.Q8_0.gguf-split-a airoboros-l2-70b-2.1.Q8_0.gguf-split-b
-```
-</details>
 <!-- README_GGUF.md-provided-files end -->
 <!-- README_GGUF.md-how-to-run start -->
@@ -216,7 +178,7 @@ And thank you again to a16z for their generous grant.
 <!-- footer end -->
 <!-- original-model-card start -->
-# Original model card: Jon Durbin's Airoboros L2 70B
 ### Overview
@@ -243,7 +205,7 @@ This is an instruction fine-tuned llama-2 model, using synthetic data generated
 - laws vary widely based on time and location
 - language model may conflate certain words with laws, e.g. it may think "stealing eggs from a chicken" is illegal
 - these models just produce text, what you do with that text is your resonsibility
-- many people and industries deal with "sensitive" content; imagine if a court stenographer's eqipment filtered illegal content - it would be useless
 ### Prompt format

 license: llama2
 model_creator: Jon Durbin
 model_link: https://huggingface.co/jondurbin/airoboros-l2-70b-2.1
+model_name: Airoboros L2 70B 2.1
 model_type: llama
 quantized_by: TheBloke
 ---
 <hr style="margin-top: 1.0em; margin-bottom: 1.0em;">
 <!-- header end -->
+# Airoboros L2 70B 2.1 - GGUF
 - Model creator: [Jon Durbin](https://huggingface.co/jondurbin)
+- Original model: [Airoboros L2 70B 2.1](https://huggingface.co/jondurbin/airoboros-l2-70b-2.1)
 ## Description
+This repo contains GGUF format model files for [Jon Durbin's Airoboros L2 70B 2.1](https://huggingface.co/jondurbin/airoboros-l2-70b-2.1).
 <!-- README_GGUF.md-about-gguf start -->
 ### About GGUF
 | [airoboros-l2-70b-2.1.Q3_K_S.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q3_K_S.gguf) | Q3_K_S | 3 | 29.92 GB| 32.42 GB | very small, high quality loss |
 | [airoboros-l2-70b-2.1.Q3_K_M.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q3_K_M.gguf) | Q3_K_M | 3 | 33.19 GB| 35.69 GB | very small, high quality loss |
 | [airoboros-l2-70b-2.1.Q3_K_L.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q3_K_L.gguf) | Q3_K_L | 3 | 36.15 GB| 38.65 GB | small, substantial quality loss |
+| [airoboros-l2-70b-2.1.Q8_0.gguf-split-b](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q8_0.gguf-split-b) | Q8_0 | 8 | 36.59 GB| 39.09 GB | very large, extremely low quality loss - not recommended |
 | [airoboros-l2-70b-2.1.Q6_K.gguf-split-a](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q6_K.gguf-split-a) | Q6_K | 6 | 36.70 GB| 39.20 GB | very large, extremely low quality loss |
 | [airoboros-l2-70b-2.1.Q8_0.gguf-split-a](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q8_0.gguf-split-a) | Q8_0 | 8 | 36.70 GB| 39.20 GB | very large, extremely low quality loss - not recommended |
 | [airoboros-l2-70b-2.1.Q4_K_S.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q4_K_S.gguf) | Q4_K_S | 4 | 39.07 GB| 41.57 GB | small, greater quality loss |
 | [airoboros-l2-70b-2.1.Q4_K_M.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q4_K_M.gguf) | Q4_K_M | 4 | 41.42 GB| 43.92 GB | medium, balanced quality - recommended |
 | [airoboros-l2-70b-2.1.Q5_K_S.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q5_K_S.gguf) | Q5_K_S | 5 | 47.46 GB| 49.96 GB | large, low quality loss - recommended |
 | [airoboros-l2-70b-2.1.Q5_K_M.gguf](https://huggingface.co/TheBloke/Airoboros-L2-70B-2.1-GGUF/blob/main/airoboros-l2-70b-2.1.Q5_K_M.gguf) | Q5_K_M | 5 | 48.75 GB| 51.25 GB | large, very low quality loss - recommended |
 **Note**: the above RAM figures assume no GPU offloading. If layers are offloaded to the GPU, this will reduce RAM usage and use VRAM instead.
 <!-- README_GGUF.md-provided-files end -->
 <!-- README_GGUF.md-how-to-run start -->
 <!-- footer end -->
 <!-- original-model-card start -->
+# Original model card: Jon Durbin's Airoboros L2 70B 2.1
 ### Overview
 - laws vary widely based on time and location
 - language model may conflate certain words with laws, e.g. it may think "stealing eggs from a chicken" is illegal
 - these models just produce text, what you do with that text is your resonsibility
+- many people and industries deal with "sensitive" content; imagine if a court stenographer's equipment filtered illegal content - it would be useless
 ### Prompt format