Upload Training-Inference-code.ipynb
Browse files- Training-Inference-code.ipynb +11 -16
Training-Inference-code.ipynb
CHANGED
@@ -1,18 +1,14 @@
|
|
1 |
{
|
2 |
"cells": [
|
3 |
{
|
4 |
-
"cell_type": "
|
|
|
5 |
"metadata": {
|
6 |
"id": "Y7Wdw0O6o2xa"
|
7 |
},
|
|
|
8 |
"source": [
|
9 |
-
"#
|
10 |
-
"\n",
|
11 |
-
"こちらは、コンペにてFineーTuningを行いたい方に向けたテンプレートとなるFine-tuningコードです。\n",
|
12 |
-
"こちらを実行いただくだけでコンペの基準に達することができると思います。上手く活用してコンペ上位を目指しましょう!!\n",
|
13 |
-
"\n",
|
14 |
-
"本コードはOmnicampusで提供される演習環境での実行を想定しています。 \n",
|
15 |
-
"それ以外の環境で実行される場合は適宜、修正して下さい。 "
|
16 |
]
|
17 |
},
|
18 |
{
|
@@ -368,10 +364,10 @@
|
|
368 |
"outputs": [],
|
369 |
"source": [
|
370 |
"# Hugging Face Token\n",
|
371 |
-
"HF_TOKEN = \"
|
372 |
"\n",
|
373 |
"# WANDB Token\n",
|
374 |
-
"WB_TOKEN = \"
|
375 |
]
|
376 |
},
|
377 |
{
|
@@ -491,9 +487,6 @@
|
|
491 |
"outputs": [],
|
492 |
"source": [
|
493 |
"# モデルを読み込み。\n",
|
494 |
-
"# llm-jp-3 1.8B, 3.7B, 13Bのsnapshotをダウンロード済みでmodelsディレクトリに格納してあります。\n",
|
495 |
-
"# base_model_idの値はomnicampusの環境におけるモデルのパスを表しており、それ以外の環境で実行する場合は変更の必要があります。\n",
|
496 |
-
"# その他のモデルは取得に承諾が必要なため、各自でダウンロードお願いします。\n",
|
497 |
"base_model_id = \"models/models--llm-jp--llm-jp-3-13b/snapshots/cd3823f4c1fcbb0ad2e2af46036ab1b0ca13192a\" #Fine-Tuningするベースモデル\n",
|
498 |
"# omnicampus以外の環境をご利用の方は以下をご利用ください。\n",
|
499 |
"# base_model_id = \"llm-jp/llm-jp-3-13b\" \n",
|
@@ -3814,14 +3807,14 @@
|
|
3814 |
},
|
3815 |
{
|
3816 |
"cell_type": "code",
|
3817 |
-
"execution_count":
|
3818 |
"metadata": {},
|
3819 |
"outputs": [
|
3820 |
{
|
3821 |
"name": "stderr",
|
3822 |
"output_type": "stream",
|
3823 |
"text": [
|
3824 |
-
"100%|██████████| 100/100 [
|
3825 |
]
|
3826 |
}
|
3827 |
],
|
@@ -3847,8 +3840,10 @@
|
|
3847 |
" tokenized_input,\n",
|
3848 |
" attention_mask=attention_mask,\n",
|
3849 |
" max_new_tokens=512,\n",
|
3850 |
-
" do_sample=
|
3851 |
" repetition_penalty=1.2,\n",
|
|
|
|
|
3852 |
" pad_token_id=tokenizer.eos_token_id\n",
|
3853 |
" )[0]\n",
|
3854 |
" output = tokenizer.decode(outputs[tokenized_input.size(1):], skip_special_tokens=True)\n",
|
|
|
1 |
{
|
2 |
"cells": [
|
3 |
{
|
4 |
+
"cell_type": "code",
|
5 |
+
"execution_count": null,
|
6 |
"metadata": {
|
7 |
"id": "Y7Wdw0O6o2xa"
|
8 |
},
|
9 |
+
"outputs": [],
|
10 |
"source": [
|
11 |
+
"# FineTuning code "
|
|
|
|
|
|
|
|
|
|
|
|
|
12 |
]
|
13 |
},
|
14 |
{
|
|
|
364 |
"outputs": [],
|
365 |
"source": [
|
366 |
"# Hugging Face Token\n",
|
367 |
+
"HF_TOKEN = \"Your Token\" #\"write権限のあるトークン\"\n",
|
368 |
"\n",
|
369 |
"# WANDB Token\n",
|
370 |
+
"WB_TOKEN = \"Your Token\""
|
371 |
]
|
372 |
},
|
373 |
{
|
|
|
487 |
"outputs": [],
|
488 |
"source": [
|
489 |
"# モデルを読み込み。\n",
|
|
|
|
|
|
|
490 |
"base_model_id = \"models/models--llm-jp--llm-jp-3-13b/snapshots/cd3823f4c1fcbb0ad2e2af46036ab1b0ca13192a\" #Fine-Tuningするベースモデル\n",
|
491 |
"# omnicampus以外の環境をご利用の方は以下をご利用ください。\n",
|
492 |
"# base_model_id = \"llm-jp/llm-jp-3-13b\" \n",
|
|
|
3807 |
},
|
3808 |
{
|
3809 |
"cell_type": "code",
|
3810 |
+
"execution_count": 30,
|
3811 |
"metadata": {},
|
3812 |
"outputs": [
|
3813 |
{
|
3814 |
"name": "stderr",
|
3815 |
"output_type": "stream",
|
3816 |
"text": [
|
3817 |
+
"100%|██████████| 100/100 [28:10<00:00, 16.91s/it]\n"
|
3818 |
]
|
3819 |
}
|
3820 |
],
|
|
|
3840 |
" tokenized_input,\n",
|
3841 |
" attention_mask=attention_mask,\n",
|
3842 |
" max_new_tokens=512,\n",
|
3843 |
+
" do_sample=True,\n",
|
3844 |
" repetition_penalty=1.2,\n",
|
3845 |
+
" top_k=4,\n",
|
3846 |
+
" num_beams=1,\n",
|
3847 |
" pad_token_id=tokenizer.eos_token_id\n",
|
3848 |
" )[0]\n",
|
3849 |
" output = tokenizer.decode(outputs[tokenized_input.size(1):], skip_special_tokens=True)\n",
|