GGUF
English
Japanese
Inference Endpoints
mmnga commited on
Commit
bd25719
1 Parent(s): ece67f3

Upload README.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +23 -0
README.md ADDED
@@ -0,0 +1,23 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+
2
+ ---
3
+ license: apache-2.0
4
+ language:
5
+ - en
6
+ - ja
7
+ datasets:
8
+ - TFMC/imatrix-dataset-for-japanese-llm
9
+ ---
10
+
11
+ # Ninja-v1-128k-gguf
12
+ [Local-Novel-LLM-projectさんが公開しているNinja-v1-128k](https://huggingface.co/Local-Novel-LLM-project/Ninja-v1-128k)のggufフォーマット変換版です。
13
+
14
+ imatrixのデータは[TFMC/imatrix-dataset-for-japanese-llm](https://huggingface.co/datasets/TFMC/imatrix-dataset-for-japanese-llm)を使用して作成しました。
15
+
16
+ ## Usage
17
+
18
+ ```
19
+ git clone https://github.com/ggerganov/llama.cpp.git
20
+ cd llama.cpp
21
+ make -j
22
+ ./main -m 'Ninja-v1-128k-Q4_0.gguf' -n 128 -p 'USER: こんにちわ。 ASSISTANT: '
23
+ ```