OsakanaTeishoku
commited on
Update README.md
Browse files
README.md
CHANGED
@@ -13,9 +13,9 @@ license: cc-by-nc-sa-4.0
|
|
13 |
# はじめに
|
14 |
これは,東京大学松尾・岩澤研究室のLLM講座2024のコンペティションで提出するためのモデルです.
|
15 |
|
16 |
-
llm-jp/llm-jp-3-13bに,QLoRAによるSFTを施して,LoRAアダプタのみをこちらにアップしています.
|
17 |
|
18 |
-
chat templateは,weblab-GENIAC/Tanuki-8B-dpo-v1.0のものと同一のものを使用しています.
|
19 |
|
20 |
# 推論方法
|
21 |
提供された環境で,以下のように推論します.L4 GPU×1のインスタンスで,vLLMを用いて推論します.
|
@@ -111,7 +111,7 @@ with open(file_path_with_unicode, 'w', encoding='utf-8') as file:
|
|
111 |
print(f"Saved json {file_path_with_unicode} !")
|
112 |
```
|
113 |
# Change log
|
114 |
-
- 2024/12/26:
|
115 |
|
116 |
# Uploaded model
|
117 |
|
|
|
13 |
# はじめに
|
14 |
これは,東京大学松尾・岩澤研究室のLLM講座2024のコンペティションで提出するためのモデルです.
|
15 |
|
16 |
+
[llm-jp/llm-jp-3-13b](https://huggingface.co/llm-jp/llm-jp-3-13b)に,QLoRAによるSFTを施して,LoRAアダプタのみをこちらにアップしています.
|
17 |
|
18 |
+
chat templateは,[weblab-GENIAC/Tanuki-8B-dpo-v1.0](https://huggingface.co/weblab-GENIAC/Tanuki-8B-dpo-v1.0)のものと同一のものを使用しています.
|
19 |
|
20 |
# 推論方法
|
21 |
提供された環境で,以下のように推論します.L4 GPU×1のインスタンスで,vLLMを用いて推論します.
|
|
|
111 |
print(f"Saved json {file_path_with_unicode} !")
|
112 |
```
|
113 |
# Change log
|
114 |
+
- 2024/12/26: 推論コードの余分なコメント部分の削除,リンクの追加
|
115 |
|
116 |
# Uploaded model
|
117 |
|