sail
/

Sailor-4B-Chat-gguf

@@ -65,17 +65,17 @@ Finally, we continually pre-train the Qwen1.5-0.5B model with 400 Billion tokens
 ### GGUF model list
 | Name                                                         | Quant method | Bits | Size    | Use case                                                     |
 | ------------------------------------------------------------ | ------------ | ---- | ------- | ------------------------------------------------------------ |
-| [ggml-model-Q2_K.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q2_K.gguf) | Q2_K         | 2    | 1.62 GB | smallest, significant quality loss ❗️ not recommended for most purposes |
-| [ggml-model-Q3_K_L.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q3_K_L.gguf) | Q3_K_L       | 3    | 2.17 GB | small, substantial quality loss                              |
-| [ggml-model-Q3_K_M.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q3_K_M.gguf) | Q3_K_M       | 3    | 2.03 GB | very small, balanced quality                                 |
-| [ggml-model-Q3_K_S.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q3_K_S.gguf) | Q3_K_S       | 3    | 1.86 GB | very small, high quality loss                                |
 | [ggml-model-Q4_K_M.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q4_K_M.gguf) | Q4_K_M       | 4    | 2.46 GB | medium, balanced quality                                     |
-| [ggml-model-Q4_K_S.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q4_K_S.gguf) | Q4_K_S       | 4    | 2.34 GB | small, greater quality loss                                  |
-| [ggml-model-Q5_K_M.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q5_K_M.gguf) | Q5_K_M       | 5    | 2.84 GB | large, balanced quality                                      |
 | [ggml-model-Q5_K_S.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q5_K_S.gguf) | Q5_K_S       | 5    | 2.78 GB | medium, very low quality loss                                |
-| [ggml-model-Q6_K.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q6_K.gguf) | Q6_K         | 6    | 3.25 GB | very large, extremely low quality loss                       |
-| [ggml-model-Q8_0.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q8_0.gguf) | Q8_0         | 8    | 4.2 GB  | very large, extremely low quality loss                       |
-| [ggml-model-f16.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-f16.gguf) | f16          | 16   | 7.91 GB | original size, no quality loss                               |
 ### How to run with `llama.cpp`

 ### GGUF model list
 | Name                                                         | Quant method | Bits | Size    | Use case                                                     |
 | ------------------------------------------------------------ | ------------ | ---- | ------- | ------------------------------------------------------------ |
+| [ggml-model-Q2_K.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q2_K.gguf) | Q2_K         | 2    | 1.62 GB | small, significant quality loss ❗️ not recommended for most purposes |
+| [ggml-model-Q3_K_L.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q3_K_L.gguf) | Q3_K_L       | 3    | 2.17 GB | medium, substantial quality loss                              |
+| [ggml-model-Q3_K_M.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q3_K_M.gguf) | Q3_K_M       | 3    | 2.03 GB | medium, balanced quality                                 |
+| [ggml-model-Q3_K_S.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q3_K_S.gguf) | Q3_K_S       | 3    | 1.86 GB | small, high quality loss                                |
 | [ggml-model-Q4_K_M.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q4_K_M.gguf) | Q4_K_M       | 4    | 2.46 GB | medium, balanced quality                                     |
+| [ggml-model-Q4_K_S.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q4_K_S.gguf) | Q4_K_S       | 4    | 2.34 GB | medium, greater quality loss                                  |
+| [ggml-model-Q5_K_M.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q5_K_M.gguf) | Q5_K_M       | 5    | 2.84 GB | medium, balanced quality                                      |
 | [ggml-model-Q5_K_S.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q5_K_S.gguf) | Q5_K_S       | 5    | 2.78 GB | medium, very low quality loss                                |
+| [ggml-model-Q6_K.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q6_K.gguf) | Q6_K         | 6    | 3.25 GB | medium, extremely low quality loss                       |
+| [ggml-model-Q8_0.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-Q8_0.gguf) | Q8_0         | 8    | 4.2 GB  | large, extremely low quality loss                       |
+| [ggml-model-f16.gguf](https://huggingface.co/sail/Sailor-4B-Chat-gguf/blob/main/ggml-model-f16.gguf) | f16          | 16   | 7.91 GB | very large, no quality loss                               |
 ### How to run with `llama.cpp`