adpater_config.json์ ์ญํ : adapter_config.json์ ์ด๋ํฐ ๊ธฐ๋ฐ ๋ชจ๋ธ ํธ๋ ์ด๋์ ์ฌ์ฉ๋๋ ์ค์ ํ์ผ์ ๋๋ค. ์ด๋ํฐ๋ ์ ๊ฒฝ๋ง ๋ชจ๋ธ์์ ๊ธฐ์กด์ ๋ ์ด์ด ๊ตฌ์กฐ๋ฅผ ๋ณ๊ฒฝํ์ง ์๊ณ ์๋ก์ด ์์ ์ด๋ ๋๋ฉ์ธ์ ๋ํด ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ๋ ๊ธฐ์ ์ ๋๋ค. ์ด ํ์ผ์ ๋ ์ด์ด์ ์ถ๊ฐ๋๋ ์ด๋ํฐ์ ์, ํฌ๊ธฐ, ํ์ฑํ ํจ์, ํ์ต๋ฅ ๋ฑ๊ณผ ๊ฐ์ ์ค์ํ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์ ์ํฉ๋๋ค. ์ด๋ํฐ๋ฅผ ์ฌ์ฉํ๋ฉด ์ ์ฒด ๋ชจ๋ธ์ ์ฌํ์ตํ ํ์ ์์ด ํจ์จ์ ์ผ๋ก ๋ฏธ์ธ ์กฐ์ ํ ์ ์์ด, ๊ณ์ฐ ๋น์ฉ๊ณผ ์๊ฐ์ ์ ์ฝํ ์ ์์ต๋๋ค. ์ด๋ฐ ๋ฐฉ์์ ํนํ ํฐ ๋ชจ๋ธ์ ์ ์ฉํ๋ฉฐ, ๋ค์ํ ์์ ์ ํ๋์ ๋ชจ๋ธ์ ์ ์ฉํ ์ ์๋ ์ ์ฐ์ฑ์ ์ ๊ณตํฉ๋๋ค.
ํ ์คํธ ๋ฐ์ดํฐ์ ๋ํ ์ค๋ช : ํ ์คํธ ๋ฐ์ดํฐ์ 'nsmc'๋ ํ๊ตญ์ด ์ํ ๋ฆฌ๋ทฐ ๋ฐ์ดํฐ์ ์ผ๋ก, ๊ฐ์ฑ ๋ถ์ ์์ ์ ์์ฃผ ์ฌ์ฉ๋ฉ๋๋ค. ์ด ๋ฐ์ดํฐ์ ์ ๋ฆฌ๋ทฐ ํ ์คํธ์ ํด๋น ๋ฆฌ๋ทฐ๊ฐ ๊ธ์ ์ ์ธ์ง ๋ถ์ ์ ์ธ์ง๋ฅผ ๋ํ๋ด๋ ๋ผ๋ฒจ๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค. ์ด ์ฝ๋์์๋ ์ด ๋ฐ์ดํฐ์ ์ ์ผ๋ถ๋ฅผ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ํ ์คํธํฉ๋๋ค. ํ ์คํธ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ๋ ๋ชฉ์ ์ ํ๋ จ๋ ๋ชจ๋ธ์ด ์ค์ ์ธ๊ณ ๋ฐ์ดํฐ์ ๋ํด ์ผ๋ง๋ ์ ์๋ํ๋์ง๋ฅผ ํ๊ฐํ๋ ๊ฒ์ ๋๋ค. ์ด ๊ณผ์ ์์ ๋ชจ๋ธ์ ์ผ๋ฐํ ๋ฅ๋ ฅ๊ณผ ๊ฐ์ธ์ฑ์ ๊ฒ์ฆํ ์ ์์ต๋๋ค.
์ด ์ฝ๋์์ ์ฌ์ฉ๋ ํ ์คํธ ์กฐ๊ฑด์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
๋ฐ์ดํฐ์ ๊ณผ ์ํ ํฌ๊ธฐ:
์ฌ์ฉ๋ ๋ฐ์ดํฐ์ ์ 'nsmc'๋ก, ํ๊ตญ์ด ์ํ ๋ฆฌ๋ทฐ๋ฅผ ๋ด๊ณ ์์ต๋๋ค. ์ด ๋ฐ์ดํฐ์ ์์ 1000๊ฐ์ ํ ์คํธ ์ํ์ ์ฌ์ฉํ์ต๋๋ค. ๊ฐ ์ํ์ ํ ์คํธ ๋ฆฌ๋ทฐ์ ์ด ๋ฆฌ๋ทฐ๊ฐ ๊ธ์ ์ ์ธ์ง ๋ถ์ ์ ์ธ์ง๋ฅผ ๋ํ๋ด๋ ๋ผ๋ฒจ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค. ์ ๋ ฅ ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ:
ํ ์คํธ ๊ณผ์ ์์ ๊ฐ ๋ฆฌ๋ทฐ ํ ์คํธ๋ ๋ชจ๋ธ์ ์ ๋ ฅ๋๊ธฐ ์ ์ ํน์ ํฌ๋งท์ผ๋ก ๋ณํ๋ฉ๋๋ค. ์ด ํฌ๋งท์ ๋ชจ๋ธ์ด ์ดํดํ ์ ์๋๋ก ํ ์คํธ๋ฅผ ๊ตฌ์กฐํํ๋ ๋ฐฉ๋ฒ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ์ ์์ผ๋ฉฐ, ์ผ๋ฐ์ ์ผ๋ก ํ ํฐํ ๊ณผ์ ์ ํฌํจํฉ๋๋ค. ๋ชจ๋ธ์ ์์ธก๊ณผ ํ๊ฐ ๋ฐฉ๋ฒ:
๋ชจ๋ธ์ ๊ฐ ํ ์คํธ ์ํ์ ๋ํด ๊ธ์ ์ ๋๋ ๋ถ์ ์ ์ธ ๊ฐ์ฑ์ ์์ธกํฉ๋๋ค. ์ด ์์ธก์ ์ค์ ๋ผ๋ฒจ(๊ธ์ /๋ถ์ )๊ณผ ๋น๊ต๋์ด ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํฉ๋๋ค. ์ฑ๋ฅ ํ๊ฐ ์งํ:
ํ ์คํธ ๊ณผ์ ์์ ์ฃผ๋ก ์ฌ์ฉ๋ ์ฑ๋ฅ ํ๊ฐ ์งํ๋ ์ ํ๋(accuracy)์ ๋๋ค. ์ ํ๋๋ ๋ชจ๋ธ์ด ์ฌ๋ฐ๋ฅด๊ฒ ์์ธกํ ์ํ์ ๋น์จ๋ก ๊ณ์ฐ๋ฉ๋๋ค. ์ฑ๋ฅ ํ๊ฐ๋ฅผ ์ํ ๊ณ์ฐ ๋ฐฉ๋ฒ:
์ฝ๋๋ True Positive (TP), True Negative (TN), False Positive (FP), False Negative (FN)๋ฅผ ๊ณ์ฐํ์ฌ ๋ชจ๋ธ์ ์ ํ๋๋ฅผ ๋์ถํฉ๋๋ค. ์ด ๊ฐ๋ค์ ๋ชจ๋ธ์ด ์ค์ ๊ธ์ (positive) ๋ผ๋ฒจ์ ๊ธ์ ์ผ๋ก, ์ค์ ๋ถ์ (negative) ๋ผ๋ฒจ์ ๋ถ์ ์ผ๋ก ์ ํํ ์์ธกํ ๊ฒฝ์ฐ์ ๊ทธ๋ ์ง ๋ชปํ ๊ฒฝ์ฐ๋ฅผ ๋ํ๋ ๋๋ค.
ํ ์คํธ ์กฐ๊ฑด ๋ฐ ๋ฐฉ๋ฒ๋ก : ๋ชจ๋ธ ํ ์คํธ๋ ์ฃผ์ด์ง ์ ๋ ฅ์ ๋ํ ๋ชจ๋ธ์ ์์ธก๊ณผ ์ค์ ๋ผ๋ฒจ์ ๋น๊ตํ๋ ๊ณผ์ ์ ๋๋ค. ์ด ์ฝ๋์์๋ True Positive (TP), True Negative (TN), False Positive (FP), False Negative (FN)์ ๋ค ๊ฐ์ง ๊ธฐ๋ณธ ์งํ๋ฅผ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ์์ธก ์ฑ๋ฅ์ ํ๊ฐํฉ๋๋ค. TP์ TN์ ๋ชจ๋ธ์ด ์ฌ๋ฐ๋ฅด๊ฒ ์์ธกํ ๊ฒฝ์ฐ, FP์ FN์ ์๋ชป ์์ธกํ ๊ฒฝ์ฐ๋ฅผ ๋ํ๋ ๋๋ค. ์ด๋ฌํ ์งํ๋ค์ ๋ชจ๋ธ์ ์ ํ๋๋ฟ๋ง ์๋๋ผ ๋ค๋ฅธ ์ค์ํ ์ฑ๋ฅ ์งํ๋ค(์: ์ ๋ฐ๋, ์ฌํ์จ)์ ๊ณ์ฐํ๋ ๋ฐ์๋ ์ฌ์ฉ๋ฉ๋๋ค.
๊ฒฐ๊ณผ ํด์ ์ ํ๋ 87.8%: ์ด๋ ์ ์ฒด ํ ์คํธ ๋ฐ์ดํฐ ์ค ์ฝ 87.8%๋ฅผ ๋ชจ๋ธ์ด ์ฌ๋ฐ๋ฅด๊ฒ ๋ถ๋ฅํ๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ์ด๋ ์๋นํ ๋์ ์ ํ๋์ด๋ฉฐ, ๋ชจ๋ธ์ด ๋๋ถ๋ถ์ ๋ฆฌ๋ทฐ๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ๊ฐ์ฑ ๋ถ์ํ์์ ๋ํ๋ ๋๋ค.
True Positives์ True Negatives: ๋์ TP์ TN์ ๋ชจ๋ธ์ด ๊ธ์ ์ ๋ฐ ๋ถ์ ์ ๋ฆฌ๋ทฐ๋ฅผ ๋์ฒด๋ก ์ ๋ถ๋ฅํ๊ณ ์์์ ๋ํ๋ ๋๋ค.
False Positives์ False Negatives: ๋น๊ต์ ๋ฎ์ FP์ ๋์ FN์ ๋ชจ๋ธ์ด ๋ถ์ ์ ๋ฆฌ๋ทฐ๋ฅผ ๊ธ์ ์ผ๋ก ์๋ชป ๋ถ๋ฅํ ๊ฐ๋ฅ์ฑ์ด ๋ฎ์ง๋ง, ๊ธ์ ์ ๋ฆฌ๋ทฐ๋ฅผ ๋ถ์ ์ผ๋ก ์๋ชป ๋ถ๋ฅํ๋ ๊ฒฝํฅ์ด ์์์ ๋ํ๋ ๋๋ค. ์ด๋ ๋ชจ๋ธ์ด ๊ธ์ ์ ํํ์ ๋ถ์ ์ ์ผ๋ก ์คํดํ๋ ๊ฒฝํฅ์ด ์์ ์ ์์์ ์๋ฏธํฉ๋๋ค.
์ฑ๋ฅ ํฅ์์ ์ํ ๊ณ ๋ ค ์ฌํญ ๋ฐ์ดํฐ ๋ถ๊ท ํ: ๋ฐ์ดํฐ์ ์ ๊ธ์ ๋๋ ๋ถ์ ๋ฆฌ๋ทฐ์ ๋ถ๊ท ํ์ด ์์ ๊ฒฝ์ฐ, ์ด๋ ๋ชจ๋ธ์ ํ์ต์ ์ํฅ์ ๋ฏธ์น ์ ์์ต๋๋ค. ๊ท ํ ์กํ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ๊ฑฐ๋, ๊ฐ์ค์น ์กฐ์ ๊ณผ ๊ฐ์ ๊ธฐ๋ฒ์ ํตํด ์ด๋ฅผ ๋ณด์ ํ ์ ์์ต๋๋ค.
Model Card for Model ID
Model Details
Model Description
- **Model type: Causal Language Model
- **Language(s) (NLP): Korean
- **Finetuned from model [optional]: Finetuned from 'KT-AI/midm-bitext-S-7B-inst-v1'
Uses
Direct Use
This model is primarily used for sentiment analysis on Korean text, particularly in classifying movie reviews as positive or negative.
Downstream Use [optional]
The model can be adapted for other types of Korean text classification tasks such as customer feedback analysis, social media sentiment analysis, etc.
Out-of-Scope Use
Bias, Risks, and Limitations
This model, while performing with high accuracy, may exhibit biases present in the training data, potentially leading to skewed results in certain scenarios. Further evaluation and monitoring are recommended to identify and mitigate these biases.
Recommendations
Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
How to Get Started with the Model
Use the code below to get started with the model.
[More Information Needed]
Training Details
Training Data
The model was fine-tuned on the NSMC (Naver Sentiment Movie Corpus) dataset, consisting of Korean movie reviews with binary sentiment labels.
Training Procedure
Text data were tokenized using a Korean-specific tokenizer. Standard preprocessing steps such as lowercasing and removal of special characters were applied.
Preprocessing [optional]
[More Information Needed]
Training Hyperparameters
- **Training regime:**Learning Rate: 1e-4 Batch Size: 8 Epochs: 3
Speeds, Sizes, Times [optional]
[More Information Needed]
Evaluation
Testing Data, Factors & Metrics
Testing Data
The model was evaluated on a separate test set extracted from the NSMC dataset, ensuring no overlap with the training data.
Factors
The evaluation focused on the model's ability to accurately classify sentiment in Korean movie reviews.
Metrics
Metrics used include Accuracy, Precision
Results
The model achieved an accuracy of 87.8%
Summary
๊ฒฐ๊ณผ ํด์ ์ ํ๋ 87.8%: ์ด๋ ์ ์ฒด ํ ์คํธ ๋ฐ์ดํฐ ์ค ์ฝ 87.8%๋ฅผ ๋ชจ๋ธ์ด ์ฌ๋ฐ๋ฅด๊ฒ ๋ถ๋ฅํ๋ค๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ์ด๋ ์๋นํ ๋์ ์ ํ๋์ด๋ฉฐ, ๋ชจ๋ธ์ด ๋๋ถ๋ถ์ ๋ฆฌ๋ทฐ๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ๊ฐ์ฑ ๋ถ์ํ์์ ๋ํ๋ ๋๋ค.
True Positives์ True Negatives: ๋์ TP์ TN์ ๋ชจ๋ธ์ด ๊ธ์ ์ ๋ฐ ๋ถ์ ์ ๋ฆฌ๋ทฐ๋ฅผ ๋์ฒด๋ก ์ ๋ถ๋ฅํ๊ณ ์์์ ๋ํ๋ ๋๋ค.
False Positives์ False Negatives: ๋น๊ต์ ๋ฎ์ FP์ ๋์ FN์ ๋ชจ๋ธ์ด ๋ถ์ ์ ๋ฆฌ๋ทฐ๋ฅผ ๊ธ์ ์ผ๋ก ์๋ชป ๋ถ๋ฅํ ๊ฐ๋ฅ์ฑ์ด ๋ฎ์ง๋ง, ๊ธ์ ์ ๋ฆฌ๋ทฐ๋ฅผ ๋ถ์ ์ผ๋ก ์๋ชป ๋ถ๋ฅํ๋ ๊ฒฝํฅ์ด ์์์ ๋ํ๋ ๋๋ค. ์ด๋ ๋ชจ๋ธ์ด ๊ธ์ ์ ํํ์ ๋ถ์ ์ ์ผ๋ก ์คํดํ๋ ๊ฒฝํฅ์ด ์์ ์ ์์์ ์๋ฏธํฉ๋๋ค.
์ฑ๋ฅ ํฅ์์ ์ํ ๊ณ ๋ ค ์ฌํญ ๋ฐ์ดํฐ ๋ถ๊ท ํ: ๋ฐ์ดํฐ์ ์ ๊ธ์ ๋๋ ๋ถ์ ๋ฆฌ๋ทฐ์ ๋ถ๊ท ํ์ด ์์ ๊ฒฝ์ฐ, ์ด๋ ๋ชจ๋ธ์ ํ์ต์ ์ํฅ์ ๋ฏธ์น ์ ์์ต๋๋ค. ๊ท ํ ์กํ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ๊ฑฐ๋, ๊ฐ์ค์น ์กฐ์ ๊ณผ ๊ฐ์ ๊ธฐ๋ฒ์ ํตํด ์ด๋ฅผ ๋ณด์ ํ ์ ์์ต๋๋ค.
Model Examination [optional]
[More Information Needed]
Environmental Impact
Carbon emissions can be estimated using the Machine Learning Impact calculator presented in Lacoste et al. (2019).
- Hardware Type: [More Information Needed]
- Hours used: [More Information Needed]
- Cloud Provider: [More Information Needed]
- Compute Region: [More Information Needed]
- Carbon Emitted: [More Information Needed]
Technical Specifications [optional]
Model Architecture and Objective
[More Information Needed]
Compute Infrastructure
[More Information Needed]
Hardware
[More Information Needed]
Software
[More Information Needed]
Citation [optional]
BibTeX:
[More Information Needed]
APA:
[More Information Needed]
Glossary [optional]
[More Information Needed]
More Information [optional]
[More Information Needed]
Model Card Authors [optional]
[More Information Needed]
Model Card Contact
[More Information Needed]
Training procedure
The following bitsandbytes
quantization config was used during training:
- quant_method: bitsandbytes
- load_in_8bit: False
- load_in_4bit: True
- llm_int8_threshold: 6.0
- llm_int8_skip_modules: None
- llm_int8_enable_fp32_cpu_offload: False
- llm_int8_has_fp16_weight: False
- bnb_4bit_quant_type: nf4
- bnb_4bit_use_double_quant: False
- bnb_4bit_compute_dtype: bfloat16
Framework versions
- PEFT 0.7.0
- Downloads last month
- 2
Model tree for cheonyumin/lora-midm-7b-food-order-understanding
Base model
KT-AI/midm-bitext-S-7B-inst-v1