π Model Card for Model ID
Gemma2 2b νκ΅μ΄ λ°©μΈ ν΅μκΈ° v0.2.0
π Model Description
Gemma2 2b νκ΅μ΄ λ°©μΈ ν΅μκΈ°λ νκ΅μ΄ μ¬ν¬λ¦¬λ₯Ό νμ€μ΄λ‘ λ²μνκ±°λ νμ€μ΄λ₯Ό νκ΅μ΄ μ¬ν¬λ¦¬λ‘ λ³ννλ νλ‘μ νΈμ μΌνμΌλ‘ κ°λ°λ λͺ¨λΈμ λλ€.
Gemma2 2b it λͺ¨λΈμ μ¬μ©νμ¬ κ°λ ₯ν μμ°μ΄ μ²λ¦¬ κΈ°λ₯μ μ 곡νλ©°, QLoRa κΈ°λ²μΌλ‘ νμΈνλνμ¬ μ μλμμ΅λλ€.
μν LLMμ μ¬μ©ν¨μΌλ‘μ¨, λΉμ© λλΉ ν¨κ³Όμ μΈ λ°©μμΌλ‘ μ¬ν¬λ¦¬ λ³ν μ±λ₯μ λ¬μ±ν μ μμ΅λλ€.
π μ¬μ©μ² | Uses
μ΄ λͺ¨λΈμ νκ΅μ΄ λ°©μΈμ νμ€ νκ΅μ΄λ‘ λ²μνκ±°λ κ·Έ λ°λλ‘ λ²μνλ λ° μ§μ μ¬μ©ν μ μμ΅λλ€. μμ± μΈμ λ° λ²μ λꡬλ₯Ό κ°λ°νλ κ΅μ‘μ, μΈμ΄νμ, κ°λ°μμκ² μ μ©ν μ μμ΅λλ€.
βοΈ μμ | Examples
μ λ ₯ λ¬Έμ₯ | λ°©μΈ: κ²λ μ μ΄λ¨Έλ λ λμ΄ λ¨Ήμ΄κ°κΈ° μ μ μ¬κΈ° μμΌ λ 건λ | νμ€μ΄: κ·Έλ¬λκΉ μ μ΄λ¨Έλ λ λμ΄ λ¨Ήμ΄κ°κΈ° μ μ μ¬κΈ° μμΌ λ κ±΄λ° |
---|---|---|
λ°©μΈ ν΅μκΈ° μΆλ ₯ | νμ€μ΄: κ·Έλ¬λκΉ μ μ΄λ¨Έλ λ λμ΄ λ¨Ήμ΄κ°κΈ° μ μ μ¬κΈ° μμΌ λ κ±΄λ° | λ°©μΈ: κ²λ μ μ΄λ© λ λμ΄ λ¨Ήμ΄κ°κΈ° μ μ μ¬κΈ° μμΌ λ 건λ |
μ λ ₯ λ¬Έμ₯ | λ°©μΈ: μμ΄ ν΄μ λ μ λ§ λ κ±° 보λ μΈ μμ΄μ°λ€ | νμ€μ΄: μ¬ νμ λμ΄μ΄ λ§ λ κ±° 보λ, μΆμ΄ λͺ¨μμ΄λ€ |
---|---|---|
λ°©μΈ ν΅μκΈ° μΆλ ₯ | νμ€μ΄: μ€ νμ λμ΄μ΄ λ§μ΄ λ κ±° 보λκΉ μΆμ΄ λͺ¨μμ λλ€ | λ°©μΈ: μ¬ ν΄μ λ μ λ§ λ κ±° 보λ μΈ μμ΄μ°λ€ |
β οΈ νκ³μ | Bias, Risks, and Limitations
μ΄ λͺ¨λΈμ νμ¬ μ μ£Ό λ°©μΈμ μ΄μ μ λ§μΆ νΉμ λ°μ΄ν° μΈνΈμ λ§μΆ° λ―ΈμΈ μ‘°μ λμκΈ° λλ¬Έμ λ€λ₯Έ λ°©μΈμ΄λ μΈμ΄μ λν μ±λ₯μ΄ μ νλ μ μμ΅λλ€.
ν₯ν λ²μ μμ λ€μν λ°©μΈμ λν μ§μμ μΆκ°ν μμ μ λλ€.(μΆ©μ², μ λΌ, κ²½μ, κ°μ)
π μ¬μ©λ² | How to Get Started with the Model
import transformers
import torch
model_id = "sjbaek/gemma2-2b-it-korean-dialect"
tokenizer = transformers.AutoTokenizer.from_pretrained(model_id, add_eos_token=True)
pipeline = transformers.pipeline(
"text-generation",
model=model_id,
tokenizer=tokenizer,
torch_dtype=torch.float16,
device_map="auto",
max_new_tokens = 512,
)
def dialect_to_standard(text, dialect_type):
return [
{
"role":"user",
"content": "Convert the following sentence or word which is {}'s dialect to standard Korean:\n\n{}".format(dialect_type, text)
}
]
def standard_to_dialect(text, dialect_type):
return [
{
"role":"user",
"content": "Convert the following sentence or word which is standard Korean to {}'s dialect :\n\n{}".format(dialect_type, text)
}
]
outputs = pipeline(
dialect_to_standard("μ°λ¦¬ λμλ μλ²μ μμμΌλ λ―ΈκΉ‘ νμΉ΄λΆλ λ΄λ €μλΉ λͺ» νλ", "μ μ£Όλ"),
do_sample=True,
temperature=0.1,
top_p=0.90,
add_special_tokens=True
)
print(outputs[0]["generated_text"][-1])
# {'role': 'assistant', 'content': 'μ°λ¦¬ λμλ μλ²μ μμμΌλ κ·€ νκ³ μλ€κ° λͺ» νλκΉ'}
outputs = pipeline(
standard_to_dialect("κ·Έλ¬λκΉ μ μ΄λ¨Έλ λ λμ΄ λ¨Ήμ΄κ°κΈ° μ μ μ¬κΈ° μμΌ λ 건λ°", "μ μ£Όλ"),
do_sample=True,
temperature=0.1,
top_p=0.90,
add_special_tokens=True
)
print(outputs[0]["generated_text"][-1])
# {'role': 'assistant', 'content': 'κ²λ μ μ΄λ© λ λμ΄ λ¨Ήμ΄κ°κΈ° μ μ μ¬κΈ° μμΌ λ 건λ'}
π μ¬μ© λ°μ΄ν°μ | Training Data
π ν₯ν κ³ν | TO DO
- μΆ©μ²λ λ°©μΈ λ³ν κΈ°λ₯ (v0.3.0)
- μ λΌλ λ°©μΈ λ³ν κΈ°λ₯ (v0.4.0)
- κ²½μλ λ°©μΈ λ³ν κΈ°λ₯ (v0.5.0)
- κ°μλ λ°©μΈ λ³ν κΈ°λ₯ (v1.0.0)
- Downloads last month
- 42