띄어쓰기 special token 처리한 모델 다시 구현했다.
Browse files- README.md +3 -4
- pytorch_model.bin +1 -1
- special_tokens_map.json +1 -0
- tokenizer.json +9 -0
README.md
CHANGED
@@ -31,11 +31,10 @@ generator(
|
|
31 |
)
|
32 |
```
|
33 |
결과
|
34 |
-
- eos_token_id를 '\n'으로 해줘서 짤려야하는데 generation된거 보니 안짤리네요... 이유가 뭘지 ㅠ
|
35 |
```
|
36 |
-
[[{'generated_text': '0 : **는 게임 좋아하니\n1 :
|
37 |
-
[{'generated_text': '0 : 어제 강남에서 살인사건 났대 ㅜㅜ 너무 무서워\n1 : 헐 왜? 무슨 일 있었어?\n0 : 사진보니까 막 피흘리는 사람있고 경찰들이 떠서 제압하고 난리도 아니었다던데??\n1 :
|
38 |
-
[{'generated_text': '0 : 자기야 어제는 나한테 왜 그랬어?\n1 : 뭔 일 있었어?\n0 : 어떻게 나한테 말도 없이 그럴 수 있어? 나 진짜 실망했어\n1 : 뭘
|
39 |
```
|
40 |
|
41 |
학습에 사용한 하이퍼파라미터
|
|
|
31 |
)
|
32 |
```
|
33 |
결과
|
|
|
34 |
```
|
35 |
+
[[{'generated_text': '0 : **는 게임 좋아하니\n1 : 나는 게임을 잘 안 해 키키 '}],
|
36 |
+
[{'generated_text': '0 : 어제 강남에서 살인사건 났대 ㅜㅜ 너무 무서워\n1 : 헐 왜? 무슨 일 있었어?\n0 : 사진보니까 막 피흘리는 사람있고 경찰들이 떠서 제압하고 난리도 아니었다던데??\n1 : 아이고... 진짜 무섭다... '}],
|
37 |
+
[{'generated_text': '0 : 자기야 어제는 나한테 왜 그랬어?\n1 : 뭔 일 있었어?\n0 : 어떻게 나한테 말도 없이 그럴 수 있어? 나 진짜 실망했어\n1 : 뭘 잘못 했길래 그래? '}]]
|
38 |
```
|
39 |
|
40 |
학습에 사용한 하이퍼파라미터
|
pytorch_model.bin
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
size 513290985
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:7ab9da80b4258a475e83a3f38a37d0f7f21af61324ee540839366fd7187cf0ee
|
3 |
size 513290985
|
special_tokens_map.json
CHANGED
@@ -2,5 +2,6 @@
|
|
2 |
"bos_token": "<s>",
|
3 |
"eos_token": "</s>",
|
4 |
"pad_token": "<pad>",
|
|
|
5 |
"unk_token": "<|endoftext|>"
|
6 |
}
|
|
|
2 |
"bos_token": "<s>",
|
3 |
"eos_token": "</s>",
|
4 |
"pad_token": "<pad>",
|
5 |
+
"sep_token": "\n",
|
6 |
"unk_token": "<|endoftext|>"
|
7 |
}
|
tokenizer.json
CHANGED
@@ -3378,6 +3378,15 @@
|
|
3378 |
"normalized": false,
|
3379 |
"special": true
|
3380 |
},
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3381 |
{
|
3382 |
"id": 51200,
|
3383 |
"content": "<|endoftext|>",
|
|
|
3378 |
"normalized": false,
|
3379 |
"special": true
|
3380 |
},
|
3381 |
+
{
|
3382 |
+
"id": 375,
|
3383 |
+
"content": "\n",
|
3384 |
+
"single_word": false,
|
3385 |
+
"lstrip": false,
|
3386 |
+
"rstrip": false,
|
3387 |
+
"normalized": false,
|
3388 |
+
"special": true
|
3389 |
+
},
|
3390 |
{
|
3391 |
"id": 51200,
|
3392 |
"content": "<|endoftext|>",
|