Update README.md
Browse files
README.md
CHANGED
@@ -100,9 +100,7 @@ def select_best_response(file_path, output_dir):
|
|
100 |
* 4bit量子化
|
101 |
* LoRAによるSFT
|
102 |
* learning_rate = 2e-4
|
103 |
-
*
|
104 |
-
* lr_scheduler_type="cosine"
|
105 |
-
* weight_decay=0.01
|
106 |
|
107 |
## Bias, Risks, and Limitations
|
108 |
RLHF,DPOを実施していないため不適切な表現が出力される可能性があります。
|
|
|
100 |
* 4bit量子化
|
101 |
* LoRAによるSFT
|
102 |
* learning_rate = 2e-4
|
103 |
+
* num_train_epochs = 2
|
|
|
|
|
104 |
|
105 |
## Bias, Risks, and Limitations
|
106 |
RLHF,DPOを実施していないため不適切な表現が出力される可能性があります。
|