Update README.md
Browse files
README.md
CHANGED
@@ -72,3 +72,17 @@ outputs = model.generate(**inputs,
|
|
72 |
use_cache=False)
|
73 |
print(tokenizer.decode(outputs[0]))
|
74 |
- μ€μ¬μΉ΄ λ·°ν°μ΅ βμ³μ½μ€λ©βμμλ νκ΅μμ λ©μ΄ν¬μ
λΈλλμΈ βλ°μ΄μ€ν 보βμ νμ
μ€ν μ΄λ₯Ό μ΄μ΄ κ³ κ°λ€μ΄ κ²½νν΄λ³΄κ³ μ νλ©° μΈκΈ°λ₯Ό λκ³ μκ³ , λν μ£Όλ³μλ νκ΅ λΈλλλ€μ΄ λ§μ΄ λ°°μΉλμ΄ μμ΄ Kλ·°ν°κ° μΌλ³Έμμ νλμ μΉ΄ν
κ³ λ¦¬λ‘ μ리μ‘κ³ μλ€κ³ λ§μλ릴 μ μμ΅λλ€.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
72 |
use_cache=False)
|
73 |
print(tokenizer.decode(outputs[0]))
|
74 |
- μ€μ¬μΉ΄ λ·°ν°μ΅ βμ³μ½μ€λ©βμμλ νκ΅μμ λ©μ΄ν¬μ
λΈλλμΈ βλ°μ΄μ€ν 보βμ νμ
μ€ν μ΄λ₯Ό μ΄μ΄ κ³ κ°λ€μ΄ κ²½νν΄λ³΄κ³ μ νλ©° μΈκΈ°λ₯Ό λκ³ μκ³ , λν μ£Όλ³μλ νκ΅ λΈλλλ€μ΄ λ§μ΄ λ°°μΉλμ΄ μμ΄ Kλ·°ν°κ° μΌλ³Έμμ νλμ μΉ΄ν
κ³ λ¦¬λ‘ μ리μ‘κ³ μλ€κ³ λ§μλ릴 μ μμ΅λλ€.
|
75 |
+
|
76 |
+
# example
|
77 |
+
prompt_template = "λ€μ κΈμ μμ½νμΈμ.:{}\nμμ½:"
|
78 |
+
passage = "μ μ μμ 보μ₯μ΄μ¬νκ° 14μΌ(νμ§μκ°) μ΄μ€λΌμμ μμ²μΌλ‘ κΈ΄κΈνμλ₯Ό μμ§νκ³ μ΄λμ κ΅°μ¬ κ³΅κ²©μ λν΄ λ
Όμνλ€. μ΄λκ³Ό μ΄μ€λΌμμ μ΄ μ리μμ μΉμ΄ν μ€μ μ λ²μκ³ , νμκ΅λ€μ νμ λ°©μ§λ₯Ό μν΄ λΉμ¬κ΅λ€μ μμ λ₯Ό μ΄κ΅¬νλ€. κ°λμΈ λ±μ λ°λ₯΄λ©΄ μ΄λ μ보리 νμμμ μ΄λκ³Ό μ΄μ€λΌμ λμ¬λ μλ‘λ₯Ό 겨λ₯ν΄ μ€λ ννμ μνμ΄λΌκ³ κ°νκ² λΉλνλ€. μλ―Έλ₯΄ μ¬μμ΄λ μ΄λΌλ°λ μ£Όμ μ μ΄λ λμ¬λ μ΄λ² 곡격과 κ΄λ ¨ν΄ βκ΅μ λ²μ λ°λ₯Έ μμκΆμ νμ¬ν μλ°μ μμλ μν©βμ΄λΌλ©΄μ βμ΄λμ μ€λμ§μ κΈ΄μ₯μ κ³ μ‘°μν€κ±°λ μ μμ μΆκ΅¬νμ§ μλλ€λ μΌκ΄λ μ
μ₯μ κ°μ§κ³ μλ€βκ³ λ§νλ€. μ΄λ² 곡격μ μ§λ 1μΌ μ΄μ€λΌμμ΄ μ£Όμ리μ μ΄λ μμ¬κ΄μ 곡격ν λ° λν λμμ΄μλ€λ μ μ κ°μ‘°ν κ²μ΄λ€. μ΄λΌλ°λ λμ¬λ βμ΄μ€λΌμ μ κΆμ μΆκ°μ μΈ κ΅°μ¬μ λλ°μ λν΄ κ²½κ³ νκ³ μ νλ€βλ©° βμ΄λμ κ΅λ―Όκ³Ό κ΅κ°μ보, μ£ΌκΆ, μν λ₯Ό λ°©μ΄νκΈ° μν λ¨νΈν κ²°μλ₯Ό κ°μ§κ³ μμμ λ¨μΈνλ€βκ³ λ§νλ€. κΈΈλΌλ μλ₯΄λ¨ μ£Όμ μ μ΄μ€λΌμ λμ¬λ βμ΄λμ κ΅°λλ νλ§μ€μ ν€μ¦λ³ΌλΌ, νν°, νλͺ
μλΉλ, κ·Έ μΈ μΌλ§μ μΈ μ§νλμ€νΈ(μ΄μ¬λ μ±μ μ£Όμμ)λ₯Ό ν¬ν¨νλ€βλ©° βμ΄μ€λΌμμ 방곡μμ€ν
μ΄ μ°μν κ²μΌλ‘ μ¦λͺ
λλ€κ³ ν΄μ μ΄λμ μνΉν κ³΅κ²©μ΄ λ°λλ κ²μ μλλ€. μ΄λμ λλ λ리μ λ€μ μ¨μ§ λ§μμΌ νλ€βκ³ λ§νλ€. κ·Έλ¬λ©΄μ βμ보리λ νλμ λμμΌ νλ€βλ©° βμ΄λμ ν
λ¬ νμλ₯Ό λΉλνκ³ μ€λ
λ°± λ©μ»€λμ¦(ν΅νμ λ±μ μλ°νμ λ μ μ¬λ₯Ό λΆννλ κ²)μ μλν΄ μ΄λ νλͺ
μλΉλλ₯Ό ν
λ¬λ¨μ²΄λ‘ μ§μ ν΄μΌ νλ€βκ³ μ보리 μ μ¬λ₯Ό μ΄κ΅¬νλ€. κ΅μ μ¬νλ μ€λμ§μμ νμ μ μ°λ €νλ©΄μ μμ λ₯Ό μμ²νλ€. μν λμ° κ΅¬ν
νμ€ μ μ μ¬λ¬΄μ΄μ₯μ μ΄λ βμ€λ μ£Όλ―Όλ€μ νκ΄΄μ μΈ μ λ©΄μ μ μ€μ μνμ μ§λ©΄νκ³ μλ€βλ©° βμ§κΈμ μ§μ νκ³ κΈ΄μ₯μ μννλ©΄μ μ΅λν μμ ν΄μΌ νλ μκΈ°βλΌκ³ λ§νλ€. λ‘λ²νΈ μ°λ μ£Όμ μ λ―Έκ΅ μ°¨μλμ¬λ βμ보리λ λͺ
λ°±ν μ΄λμ 곡격 νμλ₯Ό λΉλνκ³ μ΄λ λ° μ΄λμ ννΈλμ λ리μλ€μκ² κ³΅κ²©μ λ©μΆ°μΌ νλ€κ³ μ΄κ΅¬ν΄μΌ νλ€βκ³ λ§νλ€. λ°λ©΄ μ΄λ, μ리μ, λ¬μμ, μ€κ΅ λμ¬λ μ΄μ€λΌμμ λ―Έμ¬μΌΒ·λλ‘ μ격μ λμ΄ λ―Έκ΅ λ± λλ§Ήκ΅μ λΉννλ€. λ μ΄μ€λΌμμ΄ μ리μ μ£Όμ¬ μ΄λ μμ¬κ΄μ 곡격ν κ²μ λν΄μλ λ―Έκ΅ λ±μ΄ λΉννμ§ μλλ€κ³ λ μ§μ νλ€. μ΄λ μ보리λ μ΄λμ 곡격μ κ·ννλ 곡λμ±λͺ
μ λ°ννκ±°λ μ μ¬λ₯Ό κ°νλ λ± μ‘°μΉ μμ΄ μ’
λ£λλ€."
|
79 |
+
prompt = prompt_template.format(passage)
|
80 |
+
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
|
81 |
+
outputs = model.generate(**inputs,
|
82 |
+
max_new_tokens=512,
|
83 |
+
temperature=1,
|
84 |
+
top_p=0.95,
|
85 |
+
do_sample=True,
|
86 |
+
use_cache=False)
|
87 |
+
print(tokenizer.decode(outputs[0]))
|
88 |
+
- 14μΌ(νμ§μκ°) μ μ μμ 보μ₯μ΄μ¬νκ° μ΄μ€λΌμμ μμ²μΌλ‘ κΈ΄κΈνμλ₯Ό μμ§νμ¬ μ΄λκ³Ό μ΄μ€λΌμ λμ¬κ° μλ‘λ₯Ό 겨λ₯ν΄ μ€λ ννμ μνμ΄λΌκ³ κ°νκ² λΉλνλ λ
Όμλ₯Ό λ²μμΌλ, κ΅μ μ¬νλ μ€λμ§μμ νμ μ μ°λ €νλ©° λΉμ¬κ΅λ€μ μμ λ₯Ό μ΄κ΅¬νμμ§λ§ κ²°κ΅ μ‘°μΉ μμ΄ μ’
λ£λμμ΅λλ€.
|