Dooroo_2508: ์ฌ์ ๊ด๊ด ํนํ ์ฑ๋ด ๋ชจ๋ธ
์ด ๋ชจ๋ธ์ unsloth/Qwen3-4B-Instruct-2507 ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก, ๋ํ๋ฏผ๊ตญ ์ฌ์์์ ๊ด๊ด ์ ๋ณด์ ์ฌ ์ ๋ณด์ ๋ํด ํนํ๋ ์ง์์ ๊ฐ๋๋ก ํ์ธํ๋๋์์ต๋๋ค.
Unsloth ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ LoRA(Low-Rank Adaptation) ๊ธฐ๋ฒ์ผ๋ก ํจ์จ์ ์ธ ํ์ต์ ์งํํ์ผ๋ฉฐ, ์ฌ์ ์ฌํ์ ๊ดํ ์ง๋ฌธ์ ์์ฐ์ค๋ฝ๊ณ ์ ํํ ๋ต๋ณ์ ์์ฑํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
๐ ๏ธ ํ์ต ๊ณผ์ (Training Procedure)
1. ๊ธฐ๋ฐ ๋ชจ๋ธ (Base Model)
- Model:
unsloth/Qwen3-4B-Instruct-2507 - Library:
Unsloth๋ฅผ ์ฌ์ฉํ์ฌ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ์ต์ ํํ๊ณ ํ์ต ์๋๋ฅผ ํฌ๊ฒ ํฅ์์์ผฐ์ต๋๋ค.
2. ๋ฐ์ดํฐ์ (Dataset)
ํ์ต์๋ ์๋ ๋ ๊ฐ์ง ๋ฐ์ดํฐ์
์ ๋ณํฉํ์ฌ ์ฌ์ฉํ์ต๋๋ค. ๊ฐ ๋ฐ์ดํฐ์
์ train๊ณผ test ์คํ๋ฆฟ์ ํฉ์น ํ, train ๋ฐ์ดํฐ์
์ ๋ฌด์์๋ก ์์ด ๋ชจ๋ธ์ด ํน์ ์ฃผ์ ์ ํธํฅ๋์ง ์๋๋ก ํ์ต๋๋ค.
- kingkim/yeosu_tour: ์ฌ์ ๊ด๊ด ๋ช ์ ๊ด๋ จ ๋ฐ์ดํฐ
- kingkim/yeosu_island: ์ฌ์ ์ฌ ๊ด๋ จ ๋ฐ์ดํฐ
3. ํ์ดํผํ๋ผ๋ฏธํฐ (Hyperparameters)
๋ชจ๋ธ ํ์ต์ ์ฌ์ฉ๋ ์ฃผ์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
LoRA ์ค์
| ํ๋ผ๋ฏธํฐ | ๊ฐ | ์ค๋ช |
|---|---|---|
r |
16 |
LoRA ํ๋ ฌ์ ๋ญํฌ (rank) |
lora_alpha |
32 |
LoRA ์ค์ผ์ผ๋ง ์ธ์ |
lora_dropout |
0.05 |
LoRA ๋ ์ด์ด์ ๋๋กญ์์ ๋น์จ |
target_modules |
q_proj, k_proj, v_proj, o_proj, gate_proj, up_proj, down_proj |
LoRA๋ฅผ ์ ์ฉํ ๋์ ๋ชจ๋ |
Training Arguments
| ํ๋ผ๋ฏธํฐ | ๊ฐ | ์ค๋ช |
|---|---|---|
num_train_epochs |
15 |
์ด ํ์ต ์ํฌํฌ ์ |
learning_rate |
4e-6 |
ํ์ต๋ฅ |
per_device_train_batch_size |
32 |
๋๋ฐ์ด์ค๋น ํ์ต ๋ฐฐ์น ํฌ๊ธฐ |
gradient_accumulation_steps |
2 |
๊ทธ๋๋์ธํธ ๋์ ์คํ |
optimizer |
adamw_8bit |
8๋นํธ AdamW ์ตํฐ๋ง์ด์ |
lr_scheduler_type |
linear |
์ ํ ํ์ต๋ฅ ์ค์ผ์ค๋ฌ |
๐ ํ๊ฐ ๊ฒฐ๊ณผ (Evaluation Results)
eval_dataset์ ๋ํ ์ต์ข
ํ๊ฐ ๊ฒฐ๊ณผ์
๋๋ค. Loss๋ ๋ชจ๋ธ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ๊ฐ์ ์ฐจ์ด๋ฅผ ๋ํ๋ด๋ฉฐ, ๋ฎ์์๋ก ๋ชจ๋ธ์ ์ฑ๋ฅ์ด ์ข์์ ์๋ฏธํฉ๋๋ค.
| ๋ฉํธ๋ฆญ (Metric) | ๊ฐ (Value) |
|---|---|
eval_loss |
1.5407 |
eval_runtime |
30.8676 ์ด |
eval_samples_per_second |
68.551 |
eval_steps_per_second |
8.585 |
epoch |
15.0 |
license: apache-2.0 tags:
- unsloth
- trl
- sft
- Downloads last month
- 1
Model tree for kingkim/Dooroo_2508
Base model
Qwen/Qwen3-4B-Instruct-2507