GGUF
English
Japanese
Inference Endpoints
File size: 903 Bytes
bd25719
 
 
 
 
 
 
 
 
 
 
 
 
 
c0cb406
 
 
64dc6a5
7b3b766
bd25719
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

---
license: apache-2.0
language:
- en
- ja
datasets:
- TFMC/imatrix-dataset-for-japanese-llm
---

# Ninja-v1-128k-gguf
[Local-Novel-LLM-projectさんが公開しているNinja-v1-128k](https://huggingface.co/Local-Novel-LLM-project/Ninja-v1-128k)のggufフォーマット変換版です。  

imatrixのデータは[TFMC/imatrix-dataset-for-japanese-llm](https://huggingface.co/datasets/TFMC/imatrix-dataset-for-japanese-llm)を使用して作成しました。  

# 他のモデル
[mmnga/Ninja-v1-128k-gguf](https://huggingface.co/mmnga/Ninja-v1-128k-gguf)  
[mmnga/Ninja-v1-NSFW-128k-gguf](https://huggingface.co/mmnga/Ninja-v1-NSFW-128k-gguf)  
[mmnga/Vecteus-v1-gguf](https://huggingface.co/mmnga/Vecteus-v1-gguf)  
  
## Usage

```
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
make -j
./main -m 'Ninja-v1-128k-Q4_0.gguf' -n 128 -p 'USER: こんにちわ。 ASSISTANT: '
```