metadata
license: cc-by-nc-sa-4.0
skt/kogpt2-base-v2λ₯Ό AIHub μΌμλν λ°μ΄ν°μ
μΌλ‘ νμΈνλν λͺ¨λΈμ
λλ€.
νμ΅ μ½λ: https://github.com/HeegyuKim/open-domain-dialog
Streamlit Demo: https://heegyukim-open-domain-dialog-st-demo-1tzktp.streamlitapp.com/
μ¬μ©μμ
tokenizer = AutoTokenizer.from_pretrained("heegyu/kodialogpt")
model = AutoModelForCausalLM.from_pretrained("heegyu/kodialogpt")
generator = pipeline("text-generation", model=model, tokenizer=tokenizer)
generation_args = dict(
num_beams=4,
repetition_penalty=2.0,
no_repeat_ngram_size=4,
eos_token_id=375, # \n
max_new_tokens=64,
do_sample=True,
top_k=50,
early_stopping=True
)
generator(
["0 : **λ κ²μ μ’μνλ\n1 :",
"0 : μ΄μ κ°λ¨μμ μ΄μΈμ¬κ±΄ λ¬λ γ
γ
λ무 무μμ\n1 : ν μ? λ¬΄μ¨ μΌ μμμ΄?\n0 : μ¬μ§λ³΄λκΉ λ§ νΌν리λ μ¬λμκ³ κ²½μ°°λ€μ΄ λ μ μ μνκ³ λ리λ μλμλ€λλ°??\n1 :",
"0 : μκΈ°μΌ μ΄μ λ λνν
μ κ·Έλ¬μ΄?\n1 : λ μΌ μμμ΄?\n0 : μ΄λ»κ² λνν
λ§λ μμ΄ κ·Έλ΄ μ μμ΄? λ μ§μ§ μ€λ§νμ΄\n1 : "],
**generation_args
)
κ²°κ³Ό
- eos_token_idλ₯Ό '\n'μΌλ‘ ν΄μ€μ μ§€λ €μΌνλλ° generationλκ±° 보λ μ지리λ€μ... μ΄μ κ° λμ§ γ
[[{'generated_text': '0 : **λ κ²μ μ’μνλ\n1 : ν€ν€ λ κ²μ μ’μνλ₯\n'}],
[{'generated_text': '0 : μ΄μ κ°λ¨μμ μ΄μΈμ¬κ±΄ λ¬λ γ
γ
λ무 무μμ\n1 : ν μ? λ¬΄μ¨ μΌ μμμ΄?\n0 : μ¬μ§λ³΄λκΉ λ§ νΌν리λ μ¬λμκ³ κ²½μ°°λ€μ΄ λ μ μ μνκ³ λ리λ μλμλ€λλ°??\n1 : ν λ―Έμ³€λ€... μ§μ§ 무μμ κ² λ€\n0 : κ·ΈμΉ κ·Όλ° νΌν΄μκ° νκΈ°λ‘ μ°λ₯Έ κ² κ°μ\n'}],
[{'generated_text': '0 : μκΈ°μΌ μ΄μ λ λνν
μ κ·Έλ¬μ΄?\n1 : λ μΌ μμμ΄?\n0 : μ΄λ»κ² λνν
λ§λ μμ΄ κ·Έλ΄ μ μμ΄? λ μ§μ§ μ€λ§νμ΄\n1 : λ λ§νλλ°?\n0 : λ΄κ° λνν
λλΌκ³ νμμ\n'}]]
νμ΅μ μ¬μ©ν νμ΄νΌνλΌλ―Έν°