heegyu commited on
Commit
35d783e
·
1 Parent(s): 61473f2

띄어쓰기 special token 처리한 모델 다시 구현했다.

Browse files
Files changed (4) hide show
  1. README.md +3 -4
  2. pytorch_model.bin +1 -1
  3. special_tokens_map.json +1 -0
  4. tokenizer.json +9 -0
README.md CHANGED
@@ -31,11 +31,10 @@ generator(
31
  )
32
  ```
33
  결과
34
- - eos_token_id를 '\n'으로 해줘서 짤려야하는데 generation된거 보니 안짤리네요... 이유가 뭘지 ㅠ
35
  ```
36
- [[{'generated_text': '0 : **는 게임 좋아하니\n1 : 키키 게임 좋아하냥\n'}],
37
- [{'generated_text': '0 : 어제 강남에서 살인사건 났대 ㅜㅜ 너무 무서워\n1 : 헐 왜? 무슨 일 있었어?\n0 : 사진보니까 막 피흘리는 사람있고 경찰들이 떠서 제압하고 난리도 아니었다던데??\n1 : 미쳤다... 진짜 무서웠겠다\n0 : 그치 근데 피해자가 흉기로 찌른 것 같아\n'}],
38
- [{'generated_text': '0 : 자기야 어제는 나한테 왜 그랬어?\n1 : 뭔 일 있었어?\n0 : 어떻게 나한테 말도 없이 그럴 수 있어? 나 진짜 실망했어\n1 : 뭘 말했는데?\n0 : 내가 너한테 뭐라고 했잖아\n'}]]
39
  ```
40
 
41
  학습에 사용한 하이퍼파라미터
 
31
  )
32
  ```
33
  결과
 
34
  ```
35
+ [[{'generated_text': '0 : **는 게임 좋아하니\n1 : 나는 게임을 안 해 키키 '}],
36
+ [{'generated_text': '0 : 어제 강남에서 살인사건 났대 ㅜㅜ 너무 무서워\n1 : 헐 왜? 무슨 일 있었어?\n0 : 사진보니까 막 피흘리는 사람있고 경찰들이 떠서 제압하고 난리도 아니었다던데??\n1 : 아이고... 진짜 무섭다... '}],
37
+ [{'generated_text': '0 : 자기야 어제는 나한테 왜 그랬어?\n1 : 뭔 일 있었어?\n0 : 어떻게 나한테 말도 없이 그럴 수 있어? 나 진짜 실망했어\n1 : 뭘 잘못 했길래 그래? '}]]
38
  ```
39
 
40
  학습에 사용한 하이퍼파라미터
pytorch_model.bin CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:3246fa466b5fcb130bf94d5d3ba98415d7120266544536edc0c49aa71a2e9c39
3
  size 513290985
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:7ab9da80b4258a475e83a3f38a37d0f7f21af61324ee540839366fd7187cf0ee
3
  size 513290985
special_tokens_map.json CHANGED
@@ -2,5 +2,6 @@
2
  "bos_token": "<s>",
3
  "eos_token": "</s>",
4
  "pad_token": "<pad>",
 
5
  "unk_token": "<|endoftext|>"
6
  }
 
2
  "bos_token": "<s>",
3
  "eos_token": "</s>",
4
  "pad_token": "<pad>",
5
+ "sep_token": "\n",
6
  "unk_token": "<|endoftext|>"
7
  }
tokenizer.json CHANGED
@@ -3378,6 +3378,15 @@
3378
  "normalized": false,
3379
  "special": true
3380
  },
 
 
 
 
 
 
 
 
 
3381
  {
3382
  "id": 51200,
3383
  "content": "<|endoftext|>",
 
3378
  "normalized": false,
3379
  "special": true
3380
  },
3381
+ {
3382
+ "id": 375,
3383
+ "content": "\n",
3384
+ "single_word": false,
3385
+ "lstrip": false,
3386
+ "rstrip": false,
3387
+ "normalized": false,
3388
+ "special": true
3389
+ },
3390
  {
3391
  "id": 51200,
3392
  "content": "<|endoftext|>",