File size: 1,428 Bytes
1ce9016 9812bd8 1ce9016 8a63d69 1ce9016 23dfd9c 1ce9016 54abea9 1ce9016 54abea9 1ce9016 54abea9 1ce9016 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 |
---
language: ko
tags:
- bart
license: mit
---
# Korean News Summarization Model
## Demo
https://huggingface.co/spaces/gogamza/kobart-summarization
## How to use
```python
import torch
from transformers import PreTrainedTokenizerFast
from transformers import BartForConditionalGeneration
tokenizer = PreTrainedTokenizerFast.from_pretrained('gogamza/kobart-summarization')
model = BartForConditionalGeneration.from_pretrained('gogamza/kobart-summarization')
text = "๊ณผ๊ฑฐ๋ฅผ ๋ ์ฌ๋ ค๋ณด์. ๋ฐฉ์ก์ ๋ณด๋ ์ฐ๋ฆฌ์ ๋ชจ์ต์. ๋
๋ณด์ ์ธ ๋งค์ฒด๋ TV์๋ค. ์จ ๊ฐ์กฑ์ด ๋๋ฌ์์ TV๋ฅผ ๋ดค๋ค. ๊ฐํน ๊ฐ์กฑ๋ค๋ผ๋ฆฌ ๋ด์ค์ ๋๋ผ๋ง, ์๋ฅ ํ๋ก๊ทธ๋จ์ ๋๋ฌ์ธ๊ณ ๋ฆฌ๋ชจ์ปจ ์ํ์ ์ด ๋ฒ์ด์ง๊ธฐ๋ ํ๋ค. ๊ฐ์ ์ ํธํ๋ ํ๋ก๊ทธ๋จ์ โ๋ณธ๋ฐฉโ์ผ๋ก ๋ณด๊ธฐ ์ํ ์ธ์์ด์๋ค. TV๊ฐ ํ ๋์ธ์ง ๋ ๋์ธ์ง ์ฌ๋ถ๋ ๊ทธ๋์ ์ค์ํ๋ค. ์ง๊ธ์ ์ด๋ค๊ฐ. โ์๋ฐฉ๊ทน์ฅโ์ด๋ผ๋ ๋ง์ ์๋ง์ด ๋๋ค. TV๊ฐ ์๋ ์ง๋ ๋ง๋ค. ๋ฏธ๋์ด์ ํ ํ์ ๋๋ฆด ์ ์๋ ๋ฐฉ๋ฒ์ ๋์ด๋ฌ๋ค. ๊ฐ์์ ๋ฐฉ์์ ๊ฐ์์ ํด๋ํฐ์ผ๋ก, ๋
ธํธ๋ถ์ผ๋ก, ํ๋ธ๋ฆฟ์ผ๋ก ์ฝํ
์ธ ๋ฅผ ์ฆ๊ธด๋ค."
raw_input_ids = tokenizer.encode(text)
input_ids = [tokenizer.bos_token_id] + raw_input_ids + [tokenizer.eos_token_id]
summary_ids = model.generate(torch.tensor([input_ids]))
tokenizer.decode(summary_ids.squeeze().tolist(), skip_special_tokens=True)
```
|