cyrilzhang commited on
Commit
fc51d71
·
1 Parent(s): 940f730

Upload tokenizer

Browse files
Files changed (3) hide show
  1. special_tokens_map.json +4 -0
  2. tokenizer.json +1883 -0
  3. tokenizer_config.json +5 -0
special_tokens_map.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "eos_token": "<|eos|>",
3
+ "pad_token": "<|pad|>"
4
+ }
tokenizer.json ADDED
@@ -0,0 +1,1883 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "version": "1.0",
3
+ "truncation": null,
4
+ "padding": null,
5
+ "added_tokens": [
6
+ {
7
+ "id": 0,
8
+ "content": "<|pad|>",
9
+ "single_word": false,
10
+ "lstrip": false,
11
+ "rstrip": false,
12
+ "normalized": false,
13
+ "special": true
14
+ },
15
+ {
16
+ "id": 1,
17
+ "content": "<|eos|>",
18
+ "single_word": false,
19
+ "lstrip": false,
20
+ "rstrip": false,
21
+ "normalized": false,
22
+ "special": true
23
+ }
24
+ ],
25
+ "normalizer": null,
26
+ "pre_tokenizer": {
27
+ "type": "Sequence",
28
+ "pretokenizers": [
29
+ {
30
+ "type": "ByteLevel",
31
+ "add_prefix_space": true,
32
+ "trim_offsets": true,
33
+ "use_regex": true
34
+ },
35
+ {
36
+ "type": "Digits",
37
+ "individual_digits": true
38
+ }
39
+ ]
40
+ },
41
+ "post_processor": null,
42
+ "decoder": {
43
+ "type": "ByteLevel",
44
+ "add_prefix_space": true,
45
+ "trim_offsets": true,
46
+ "use_regex": true
47
+ },
48
+ "model": {
49
+ "type": "BPE",
50
+ "dropout": null,
51
+ "unk_token": null,
52
+ "continuing_subword_prefix": "##",
53
+ "end_of_word_suffix": null,
54
+ "fuse_unk": false,
55
+ "byte_fallback": false,
56
+ "vocab": {
57
+ "<|pad|>": 0,
58
+ "<|eos|>": 1,
59
+ "!": 2,
60
+ "\"": 3,
61
+ "#": 4,
62
+ "$": 5,
63
+ "%": 6,
64
+ "&": 7,
65
+ "'": 8,
66
+ "(": 9,
67
+ ")": 10,
68
+ "*": 11,
69
+ "+": 12,
70
+ ",": 13,
71
+ "-": 14,
72
+ ".": 15,
73
+ "/": 16,
74
+ "0": 17,
75
+ "1": 18,
76
+ "2": 19,
77
+ "3": 20,
78
+ "4": 21,
79
+ "5": 22,
80
+ "6": 23,
81
+ "7": 24,
82
+ "8": 25,
83
+ "9": 26,
84
+ ":": 27,
85
+ ";": 28,
86
+ "<": 29,
87
+ "=": 30,
88
+ ">": 31,
89
+ "?": 32,
90
+ "@": 33,
91
+ "A": 34,
92
+ "B": 35,
93
+ "C": 36,
94
+ "D": 37,
95
+ "E": 38,
96
+ "F": 39,
97
+ "G": 40,
98
+ "H": 41,
99
+ "I": 42,
100
+ "J": 43,
101
+ "K": 44,
102
+ "L": 45,
103
+ "M": 46,
104
+ "N": 47,
105
+ "O": 48,
106
+ "P": 49,
107
+ "Q": 50,
108
+ "R": 51,
109
+ "S": 52,
110
+ "T": 53,
111
+ "U": 54,
112
+ "V": 55,
113
+ "W": 56,
114
+ "X": 57,
115
+ "Y": 58,
116
+ "Z": 59,
117
+ "[": 60,
118
+ "\\": 61,
119
+ "]": 62,
120
+ "_": 63,
121
+ "`": 64,
122
+ "a": 65,
123
+ "b": 66,
124
+ "c": 67,
125
+ "d": 68,
126
+ "e": 69,
127
+ "f": 70,
128
+ "g": 71,
129
+ "h": 72,
130
+ "i": 73,
131
+ "j": 74,
132
+ "k": 75,
133
+ "l": 76,
134
+ "m": 77,
135
+ "n": 78,
136
+ "o": 79,
137
+ "p": 80,
138
+ "q": 81,
139
+ "r": 82,
140
+ "s": 83,
141
+ "t": 84,
142
+ "u": 85,
143
+ "v": 86,
144
+ "w": 87,
145
+ "x": 88,
146
+ "y": 89,
147
+ "z": 90,
148
+ "|": 91,
149
+ "~": 92,
150
+ "ĉ": 93,
151
+ "Ċ": 94,
152
+ "Ġ": 95,
153
+ "##u": 96,
154
+ "##d": 97,
155
+ "##g": 98,
156
+ "##i": 99,
157
+ "##e": 100,
158
+ "##o": 101,
159
+ "##m": 102,
160
+ "##s": 103,
161
+ "##r": 104,
162
+ "##p": 105,
163
+ "##a": 106,
164
+ "##t": 107,
165
+ "##l": 108,
166
+ "##y": 109,
167
+ "##B": 110,
168
+ "##h": 111,
169
+ "##c": 112,
170
+ "##w": 113,
171
+ "##n": 114,
172
+ "##C": 115,
173
+ "##S": 116,
174
+ "##v": 117,
175
+ "##I": 118,
176
+ "##W": 119,
177
+ "##D": 120,
178
+ "##k": 121,
179
+ "##K": 122,
180
+ "##b": 123,
181
+ "##M": 124,
182
+ "##q": 125,
183
+ "##f": 126,
184
+ "##T": 127,
185
+ "##P": 128,
186
+ "##G": 129,
187
+ "##Y": 130,
188
+ "##O": 131,
189
+ "##A": 132,
190
+ "##L": 133,
191
+ "##F": 134,
192
+ "##N": 135,
193
+ "##z": 136,
194
+ "##J": 137,
195
+ "##E": 138,
196
+ "##R": 139,
197
+ "##x": 140,
198
+ "##\"": 141,
199
+ "##*": 142,
200
+ "##.": 143,
201
+ "##j": 144,
202
+ "##`": 145,
203
+ "##Z": 146,
204
+ "##U": 147,
205
+ "##H": 148,
206
+ "##!": 149,
207
+ "##:": 150,
208
+ "##Q": 151,
209
+ "##)": 152,
210
+ "##V": 153,
211
+ "##'": 154,
212
+ "##$": 155,
213
+ "##_": 156,
214
+ "##?": 157,
215
+ "##,": 158,
216
+ "##X": 159,
217
+ "##(": 160,
218
+ "##/": 161,
219
+ "##-": 162,
220
+ "##~": 163,
221
+ "##[": 164,
222
+ "##\\": 165,
223
+ "##;": 166,
224
+ "##@": 167,
225
+ "##<": 168,
226
+ "###": 169,
227
+ "##&": 170,
228
+ "##Ċ": 171,
229
+ "##Ġ": 172,
230
+ "##ĉ": 173,
231
+ "##=": 174,
232
+ "##%": 175,
233
+ "##+": 176,
234
+ "##|": 177,
235
+ "Ġt": 178,
236
+ "##he": 179,
237
+ "Ġa": 180,
238
+ "Ġs": 181,
239
+ "Ġw": 182,
240
+ "##nd": 183,
241
+ "Ġthe": 184,
242
+ "##ed": 185,
243
+ "Ġb": 186,
244
+ "Ġto": 187,
245
+ "Ġand": 188,
246
+ "Ġh": 189,
247
+ "Ġf": 190,
248
+ "ĠT": 191,
249
+ "##in": 192,
250
+ "Ġwa": 193,
251
+ "##re": 194,
252
+ "##it": 195,
253
+ "##ou": 196,
254
+ "Ġl": 197,
255
+ "Ġd": 198,
256
+ "Ġc": 199,
257
+ "Ġp": 200,
258
+ "##ay": 201,
259
+ "Ġm": 202,
260
+ "##er": 203,
261
+ "Ġwas": 204,
262
+ "ĠThe": 205,
263
+ "##om": 206,
264
+ "Ġhe": 207,
265
+ "##is": 208,
266
+ "Ġn": 209,
267
+ "##ar": 210,
268
+ "##im": 211,
269
+ "##on": 212,
270
+ "Ġsa": 213,
271
+ "##id": 214,
272
+ "##ll": 215,
273
+ "Ġha": 216,
274
+ "Ġg": 217,
275
+ "##at": 218,
276
+ "ĠS": 219,
277
+ "##ing": 220,
278
+ "##ot": 221,
279
+ "##en": 222,
280
+ "##an": 223,
281
+ "##le": 224,
282
+ "##or": 225,
283
+ "##ir": 226,
284
+ "##am": 227,
285
+ "##et": 228,
286
+ "ĠH": 229,
287
+ "Ġit": 230,
288
+ "Ġth": 231,
289
+ "##ig": 232,
290
+ "ĠThey": 233,
291
+ "Ġin": 234,
292
+ "##il": 235,
293
+ "Ġ\"": 236,
294
+ "Ġpl": 237,
295
+ "ĠHe": 238,
296
+ "##ow": 239,
297
+ "##ver": 240,
298
+ "##ri": 241,
299
+ "##ut": 242,
300
+ "Ġbe": 243,
301
+ "Ġu": 244,
302
+ "Ġplay": 245,
303
+ "Ġsaid": 246,
304
+ "##ith": 247,
305
+ "Ġday": 248,
306
+ "Ġwith": 249,
307
+ "##pp": 250,
308
+ "Ġo": 251,
309
+ "Ġy": 252,
310
+ "##oo": 253,
311
+ "##ked": 254,
312
+ "Ġr": 255,
313
+ "Ġher": 256,
314
+ "##ce": 257,
315
+ "ĠI": 258,
316
+ "ĠShe": 259,
317
+ "ĠTim": 260,
318
+ "##ld": 261,
319
+ "Ġhis": 262,
320
+ "Ġst": 263,
321
+ "##ke": 264,
322
+ "Ġe": 265,
323
+ "Ġbig": 266,
324
+ "##nt": 267,
325
+ "##ck": 268,
326
+ "##very": 269,
327
+ "Ġyou": 270,
328
+ "##st": 271,
329
+ "##ne": 272,
330
+ "##ve": 273,
331
+ "ĠO": 274,
332
+ "##end": 275,
333
+ "Ġon": 276,
334
+ "Ġhapp": 277,
335
+ "##un": 278,
336
+ "ĠL": 279,
337
+ "##riend": 280,
338
+ "Ġfriend": 281,
339
+ "##all": 282,
340
+ "##ily": 283,
341
+ "Ġthey": 284,
342
+ "Ġwe": 285,
343
+ "Ġhad": 286,
344
+ "Ġnot": 287,
345
+ "Ġli": 288,
346
+ "Ġup": 289,
347
+ "##her": 290,
348
+ "Ġwant": 291,
349
+ "Ġof": 292,
350
+ "##ad": 293,
351
+ "##itt": 294,
352
+ "ĠB": 295,
353
+ "##se": 296,
354
+ "Ġdo": 297,
355
+ "Ġhappy": 298,
356
+ "ĠM": 299,
357
+ "Ġvery": 300,
358
+ "##ent": 301,
359
+ "'s": 302,
360
+ "Ġsaw": 303,
361
+ "Ġthat": 304,
362
+ "##es": 305,
363
+ "##ould": 306,
364
+ "Ġmom": 307,
365
+ "Ġfor": 308,
366
+ "Ġsh": 309,
367
+ "##ittle": 310,
368
+ "Ġlittle": 311,
369
+ "Ġso": 312,
370
+ "Ġshe": 313,
371
+ ".\"": 314,
372
+ "##ime": 315,
373
+ "##ch": 316,
374
+ "Ġnam": 317,
375
+ "Ġne": 318,
376
+ "Ġtime": 319,
377
+ "Ġk": 320,
378
+ "##ound": 321,
379
+ "Ġthere": 322,
380
+ "ĠLily": 323,
381
+ "Ġnamed": 324,
382
+ "Ġbo": 325,
383
+ "Ġsm": 326,
384
+ "Ġwere": 327,
385
+ "ĠTom": 328,
386
+ "!\"": 329,
387
+ "Ġwanted": 330,
388
+ "Ġbut": 331,
389
+ "##out": 332,
390
+ "Ġfriends": 333,
391
+ "##ved": 334,
392
+ "The": 335,
393
+ "##ht": 336,
394
+ "##ird": 337,
395
+ "Ġbird": 338,
396
+ "##el": 339,
397
+ "##al": 340,
398
+ "Ġan": 341,
399
+ "##ake": 342,
400
+ "Ġtoo": 343,
401
+ "ĠIt": 344,
402
+ "##ome": 345,
403
+ "##ug": 346,
404
+ "##nce": 347,
405
+ "##ide": 348,
406
+ "Ġwent": 349,
407
+ "Ġhel": 350,
408
+ "Ġwh": 351,
409
+ "ĠOnce": 352,
410
+ "Ġis": 353,
411
+ "Ġall": 354,
412
+ "Ġhelp": 355,
413
+ "##ue": 356,
414
+ "ĠA": 357,
415
+ "Ġlo": 358,
416
+ "Ġloo": 359,
417
+ "##ter": 360,
418
+ "Ġupon": 361,
419
+ "##ry": 362,
420
+ "##ore": 363,
421
+ "Ġfun": 364,
422
+ "##ind": 365,
423
+ "##get": 366,
424
+ "Ġtoy": 367,
425
+ "ĠOne": 368,
426
+ "##ill": 369,
427
+ "##ame": 370,
428
+ "Ġas": 371,
429
+ "Ġat": 372,
430
+ "##ra": 373,
431
+ "Ġj": 374,
432
+ "Ġdid": 375,
433
+ "##gether": 376,
434
+ "Ġre": 377,
435
+ "##ur": 378,
436
+ "Ġtogether": 379,
437
+ "Ġse": 380,
438
+ "##ack": 381,
439
+ "Ġcat": 382,
440
+ "Ġtre": 383,
441
+ "##ly": 384,
442
+ "##ood": 385,
443
+ "##ic": 386,
444
+ "##ted": 387,
445
+ "Ġdog": 388,
446
+ "Ġcould": 389,
447
+ "Ġcan": 390,
448
+ "Ġtheir": 391,
449
+ "##ard": 392,
450
+ "?\"": 393,
451
+ "##ark": 394,
452
+ "##ec": 395,
453
+ "Ġgir": 396,
454
+ "Ġplayed": 397,
455
+ "Ġball": 398,
456
+ "Ġhim": 399,
457
+ "Ġgirl": 400,
458
+ "##way": 401,
459
+ "Ġro": 402,
460
+ "##hed": 403,
461
+ "Ġgo": 404,
462
+ "##my": 405,
463
+ "Ġare": 406,
464
+ "'t": 407,
465
+ "Ġle": 408,
466
+ "Ġout": 409,
467
+ "Ġfr": 410,
468
+ "##ain": 411,
469
+ "Ġthem": 412,
470
+ "##um": 413,
471
+ "##hen": 414,
472
+ "##ax": 415,
473
+ "Ġsad": 416,
474
+ "Ġboy": 417,
475
+ "##ul": 418,
476
+ "Ġtree": 419,
477
+ "##other": 420,
478
+ "Ġhave": 421,
479
+ "Ġman": 422,
480
+ "Ġloved": 423,
481
+ "Ġcl": 424,
482
+ "Ġlooked": 425,
483
+ "##oug": 426,
484
+ "Ġfound": 427,
485
+ "Ġsp": 428,
486
+ "Ġstar": 429,
487
+ "ĠSue": 430,
488
+ "##one": 431,
489
+ "Ġsc": 432,
490
+ "##hing": 433,
491
+ "Ġback": 434,
492
+ "ĠMax": 435,
493
+ "##own": 436,
494
+ "##are": 437,
495
+ "Ġlike": 438,
496
+ "##ful": 439,
497
+ "##side": 440,
498
+ "Ġbec": 441,
499
+ "One": 442,
500
+ "Ġme": 443,
501
+ "Ġpark": 444,
502
+ "##ong": 445,
503
+ "Ġcar": 446,
504
+ "##ight": 447,
505
+ "##op": 448,
506
+ "Ġliked": 449,
507
+ "##elt": 450,
508
+ "Ġwould": 451,
509
+ "Ġmake": 452,
510
+ "Ġla": 453,
511
+ "Ġfa": 454,
512
+ "##round": 455,
513
+ "Ġfelt": 456,
514
+ "##ell": 457,
515
+ "ĠW": 458,
516
+ "Ġsee": 459,
517
+ "ĠBut": 460,
518
+ "ĠBen": 461,
519
+ "ĠSam": 462,
520
+ "##omet": 463,
521
+ "Ġasked": 464,
522
+ "Ġnew": 465,
523
+ "##ag": 466,
524
+ "Ġno": 467,
525
+ "##ouse": 468,
526
+ "##ice": 469,
527
+ "Ġstarted": 470,
528
+ "##ared": 471,
529
+ "Ġcame": 472,
530
+ "Ġother": 473,
531
+ "Ġal": 474,
532
+ "##ought": 475,
533
+ "##iled": 476,
534
+ "##ss": 477,
535
+ "Ġag": 478,
536
+ "Ġsomet": 479,
537
+ "Ġgood": 480,
538
+ "Ġsmall": 481,
539
+ "Ġbr": 482,
540
+ "Ġsay": 483,
541
+ "##ried": 484,
542
+ "Ġsmiled": 485,
543
+ "##ade": 486,
544
+ "##ings": 487,
545
+ "##ob": 488,
546
+ "##pot": 489,
547
+ "Ġwor": 490,
548
+ "Ġfind": 491,
549
+ "##ia": 492,
550
+ "Ġex": 493,
551
+ "##ty": 494,
552
+ "Ġaway": 495,
553
+ "Ġput": 496,
554
+ "Ġco": 497,
555
+ "Ġmade": 498,
556
+ "Ġwhat": 499,
557
+ "Ġfrom": 500,
558
+ "Ġsomething": 501,
559
+ "Ġthought": 502,
560
+ "##ened": 503,
561
+ "Ġhome": 504,
562
+ "Ġplaying": 505,
563
+ "Ġevery": 506,
564
+ "##ook": 507,
565
+ "Ġwal": 508,
566
+ "##uc": 509,
567
+ "Ġmu": 510,
568
+ "##ach": 511,
569
+ "ĠJ": 512,
570
+ "##arn": 513,
571
+ "ĠSpot": 514,
572
+ "Ġran": 515,
573
+ "ĠF": 516,
574
+ "##ile": 517,
575
+ "##ie": 518,
576
+ "##ave": 519,
577
+ "Ġagain": 520,
578
+ "Ġlaug": 521,
579
+ "Ġsome": 522,
580
+ "##now": 523,
581
+ "Ġhouse": 524,
582
+ "##dd": 525,
583
+ "Ġdown": 526,
584
+ "Ġfl": 527,
585
+ "Ġtook": 528,
586
+ "Ġscared": 529,
587
+ "##king": 530,
588
+ "##ny": 531,
589
+ "ĠY": 532,
590
+ "Ġpr": 533,
591
+ "Ġtoys": 534,
592
+ "Ġlearn": 535,
593
+ "##ure": 536,
594
+ "Ġbox": 537,
595
+ "##if": 538,
596
+ "Ġwill": 539,
597
+ "ĠYou": 540,
598
+ "##ret": 541,
599
+ "##ick": 542,
600
+ "##ab": 543,
601
+ "##ep": 544,
602
+ "Ġthings": 545,
603
+ "Ġmy": 546,
604
+ "Ġaround": 547,
605
+ "Ġyour": 548,
606
+ "Ġbl": 549,
607
+ "##oud": 550,
608
+ "Ġlived": 551,
609
+ "##uck": 552,
610
+ "##ish": 553,
611
+ ",\"": 554,
612
+ "Ġfe": 555,
613
+ "Ġsun": 556,
614
+ "Ġthen": 557,
615
+ "##as": 558,
616
+ "Ġsw": 559,
617
+ "Ġwhen": 560,
618
+ "Ġch": 561,
619
+ "##us": 562,
620
+ "##pped": 563,
621
+ "ĠMia": 564,
622
+ "Ġab": 565,
623
+ "##ank": 566,
624
+ "Ġget": 567,
625
+ "##ucy": 568,
626
+ "##ump": 569,
627
+ "Ġlot": 570,
628
+ "Th": 571,
629
+ "##ist": 572,
630
+ "##oth": 573,
631
+ "Ġtried": 574,
632
+ "##ap": 575,
633
+ "Tim": 576,
634
+ "Ġsays": 577,
635
+ "Ġknow": 578,
636
+ "Ġgot": 579,
637
+ "Ġkne": 580,
638
+ "##ited": 581,
639
+ "Ġwho": 582,
640
+ "##ust": 583,
641
+ "Ġmany": 584,
642
+ "##nder": 585,
643
+ "Ġint": 586,
644
+ "Ġabout": 587,
645
+ "Ġpret": 588,
646
+ "Ġany": 589,
647
+ "Ġred": 590,
648
+ "Ġdec": 591,
649
+ "ĠD": 592,
650
+ "##ive": 593,
651
+ "Ġknew": 594,
652
+ "##ace": 595,
653
+ "Ġmore": 596,
654
+ "##ous": 597,
655
+ "##ise": 598,
656
+ "Ġpic": 599,
657
+ "Ġcare": 600,
658
+ "##ally": 601,
659
+ "##au": 602,
660
+ "ĠLucy": 603,
661
+ "Ġlearned": 604,
662
+ "Ġhug": 605,
663
+ "##qu": 606,
664
+ "Ġwater": 607,
665
+ "##fter": 608,
666
+ "Ġpo": 609,
667
+ "Ġbecame": 610,
668
+ "Ġbest": 611,
669
+ "Ġv": 612,
670
+ "##ause": 613,
671
+ "Ġgre": 614,
672
+ "Ġop": 615,
673
+ "##ways": 616,
674
+ "##urp": 617,
675
+ "Ġlaughed": 618,
676
+ "Ġoutside": 619,
677
+ "Ġexc": 620,
678
+ "Ġlook": 621,
679
+ "Ġalways": 622,
680
+ "ĠBob": 623,
681
+ "Ġshow": 624,
682
+ "Ġdecid": 625,
683
+ "Ġroom": 626,
684
+ "Ġbecause": 627,
685
+ "##ant": 628,
686
+ "ĠSo": 629,
687
+ "##fe": 630,
688
+ "Ġho": 631,
689
+ "Ġdecided": 632,
690
+ "Ġeat": 633,
691
+ "Ġinto": 634,
692
+ "##ite": 635,
693
+ "Ġjump": 636,
694
+ "ĠAnd": 637,
695
+ "Ġboth": 638,
696
+ "Ġpe": 639,
697
+ "##ers": 640,
698
+ "ĠMom": 641,
699
+ "They": 642,
700
+ "Ġdad": 643,
701
+ "Ġke": 644,
702
+ "##udd": 645,
703
+ "Ġone": 646,
704
+ "Lily": 647,
705
+ "Ġfast": 648,
706
+ "Ġnice": 649,
707
+ "ĠE": 650,
708
+ "Ġthis": 651,
709
+ "##nn": 652,
710
+ "Ġexcited": 653,
711
+ "Ġfeel": 654,
712
+ "Ġrun": 655,
713
+ "Ġlong": 656,
714
+ "Yes": 657,
715
+ "##our": 658,
716
+ "Ġtold": 659,
717
+ "Ġsk": 660,
718
+ "Ġam": 661,
719
+ "##urpr": 662,
720
+ "Ġinside": 663,
721
+ "##ull": 664,
722
+ "Ġtr": 665,
723
+ "Ġsurpr": 666,
724
+ "Ġmo": 667,
725
+ "Ġpretty": 668,
726
+ "##iny": 669,
727
+ "##ink": 670,
728
+ "Ġsor": 671,
729
+ "Wh": 672,
730
+ "Ġtake": 673,
731
+ "##og": 674,
732
+ "Ġeach": 675,
733
+ "Ġgave": 676,
734
+ "Ġsl": 677,
735
+ "Ġmuch": 678,
736
+ "##lew": 679,
737
+ "Ġrock": 680,
738
+ "##nna": 681,
739
+ "Ġgra": 682,
740
+ "Ġstr": 683,
741
+ "Ġhow": 684,
742
+ "##imal": 685,
743
+ "Ġanimal": 686,
744
+ "##ara": 687,
745
+ "##ged": 688,
746
+ "Ġneed": 689,
747
+ "Ġthan": 690,
748
+ "##etter": 691,
749
+ "But": 692,
750
+ "Ġtow": 693,
751
+ "##ven": 694,
752
+ "Ġor": 695,
753
+ "ĠC": 696,
754
+ "Ġunder": 697,
755
+ "Tom": 698,
756
+ "Ġsorry": 699,
757
+ "Ġold": 700,
758
+ "##ge": 701,
759
+ "##ised": 702,
760
+ "##ro": 703,
761
+ "##urt": 704,
762
+ "Ġfish": 705,
763
+ "Ġcle": 706,
764
+ "Ġwalked": 707,
765
+ "Ġclo": 708,
766
+ "Ġbear": 709,
767
+ "##ft": 710,
768
+ "##ase": 711,
769
+ "##ast": 712,
770
+ "##and": 713,
771
+ "Ġhand": 714,
772
+ "##ess": 715,
773
+ "##urn": 716,
774
+ "Ġkind": 717,
775
+ "ĠWe": 718,
776
+ "ĠHis": 719,
777
+ "Ġte": 720,
778
+ "Ġhappened": 721,
779
+ "Ġflow": 722,
780
+ "##here": 723,
781
+ "Ġfood": 724,
782
+ "Ġlist": 725,
783
+ "Ġjust": 726,
784
+ "Ġanimals": 727,
785
+ "Ġhig": 728,
786
+ "Ġdidn": 729,
787
+ "Ġnear": 730,
788
+ "Ġide": 731,
789
+ "Ġwat": 732,
790
+ "Ġsky": 733,
791
+ "Ġtry": 734,
792
+ "##ine": 735,
793
+ "##ched": 736,
794
+ "Ġfi": 737,
795
+ "##rom": 738,
796
+ "##pl": 739,
797
+ "##ving": 740,
798
+ "ĠAmy": 741,
799
+ "Ġus": 742,
800
+ "Ġidea": 743,
801
+ "Ġbetter": 744,
802
+ "Ġbug": 745,
803
+ "##gry": 746,
804
+ "Ġits": 747,
805
+ "Ġheard": 748,
806
+ "Ġtw": 749,
807
+ "##pec": 750,
808
+ "Ġlet": 751,
809
+ "##ate": 752,
810
+ "##ff": 753,
811
+ "##able": 754,
812
+ "Ġshare": 755,
813
+ "Ġcareful": 756,
814
+ "Ġen": 757,
815
+ "Thank": 758,
816
+ "Ġfly": 759,
817
+ "Ġif": 760,
818
+ "Ġstor": 761,
819
+ "##more": 762,
820
+ "Ġanymore": 763,
821
+ "Ġflew": 764,
822
+ "##ial": 765,
823
+ "ĠAnna": 766,
824
+ "Mom": 767,
825
+ "ĠTh": 768,
826
+ "Ġlots": 769,
827
+ "Ġspec": 770,
828
+ "Ġspecial": 771,
829
+ "##ion": 772,
830
+ "Ġcom": 773,
831
+ "Ġnever": 774,
832
+ "Ġby": 775,
833
+ "##lf": 776,
834
+ "Ġdan": 777,
835
+ "##ream": 778,
836
+ "Ġwind": 779,
837
+ "Ġbu": 780,
838
+ "Ġfo": 781,
839
+ "Ġdon": 782,
840
+ "Ġclean": 783,
841
+ "Ġtal": 784,
842
+ "##ort": 785,
843
+ "Ġgr": 786,
844
+ "##rm": 787,
845
+ "Ġlove": 788,
846
+ "Ġend": 789,
847
+ "##ople": 790,
848
+ "ĠThen": 791,
849
+ "##ber": 792,
850
+ "Ġeven": 793,
851
+ "Ġmag": 794,
852
+ "Ġshiny": 795,
853
+ "Ġhard": 796,
854
+ "Ġfore": 797,
855
+ "ĠSara": 798,
856
+ "Ġcake": 799,
857
+ "Ġover": 800,
858
+ "##udden": 801,
859
+ "##ak": 802,
860
+ "Ġbook": 803,
861
+ "Ġcol": 804,
862
+ "Ġturn": 805,
863
+ "Ġfam": 806,
864
+ "Ġsafe": 807,
865
+ "Ġbad": 808,
866
+ "Ġafter": 809,
867
+ "Ġpeople": 810,
868
+ "##ady": 811,
869
+ "Ġproud": 812,
870
+ "##pected": 813,
871
+ "Ġsurprised": 814,
872
+ "ĠEvery": 815,
873
+ "Ġhigh": 816,
874
+ "##uddenly": 817,
875
+ "Let": 818,
876
+ "Ġhurt": 819,
877
+ "Ġcu": 820,
878
+ "##imb": 821,
879
+ "Ġpicked": 822,
880
+ "Ġground": 823,
881
+ "Ġcome": 824,
882
+ "##arden": 825,
883
+ "Ġune": 826,
884
+ "Ġgarden": 827,
885
+ "Ġdoor": 828,
886
+ "##xpected": 829,
887
+ "Ġunexpected": 830,
888
+ "Ġopened": 831,
889
+ "Ġclimb": 832,
890
+ "Ġloud": 833,
891
+ "##bb": 834,
892
+ "You": 835,
893
+ "Ġche": 836,
894
+ "Ġgl": 837,
895
+ "'m": 838,
896
+ "As": 839,
897
+ "Ġim": 840,
898
+ "##ild": 841,
899
+ "Ġgive": 842,
900
+ "##ail": 843,
901
+ "Ġway": 844,
902
+ "Ġcolor": 845,
903
+ "Ġblue": 846,
904
+ "Ġthanked": 847,
905
+ "Ġstill": 848,
906
+ "Ġever": 849,
907
+ "ĠFrom": 850,
908
+ "Ġhugged": 851,
909
+ "Ġfar": 852,
910
+ "##ip": 853,
911
+ "Ġcall": 854,
912
+ "ĠHer": 855,
913
+ "Ġmagic": 856,
914
+ "##age": 857,
915
+ "Ġoff": 858,
916
+ "##ummy": 859,
917
+ "ĠK": 860,
918
+ "##iz": 861,
919
+ "##ough": 862,
920
+ "##xt": 863,
921
+ "Ġjumped": 864,
922
+ "ĠWhen": 865,
923
+ "Ġshould": 866,
924
+ "Ġpar": 867,
925
+ "Ġfamily": 868,
926
+ "##ool": 869,
927
+ "Ġkid": 870,
928
+ "Ġsmile": 871,
929
+ "##uff": 872,
930
+ "##hes": 873,
931
+ "Ġplace": 874,
932
+ "##kay": 875,
933
+ "ĠIn": 876,
934
+ "Ġwalk": 877,
935
+ "##ct": 878,
936
+ "Ġgreat": 879,
937
+ "Ġnow": 880,
938
+ "##em": 881,
939
+ "Ġstrong": 882,
940
+ "##les": 883,
941
+ "Ġqu": 884,
942
+ "Ġstay": 885,
943
+ "Ġunt": 886,
944
+ "Ġsto": 887,
945
+ "No": 888,
946
+ "Ġforest": 889,
947
+ "##aut": 890,
948
+ "##itty": 891,
949
+ "##ture": 892,
950
+ "ĠP": 893,
951
+ "##ane": 894,
952
+ "Ġfrog": 895,
953
+ "Ġbra": 896,
954
+ "Ġbro": 897,
955
+ "##oon": 898,
956
+ "Ġuntil": 899,
957
+ "Ġbeaut": 900,
958
+ "Ġsqu": 901,
959
+ "Ġstick": 902,
960
+ "##dy": 903,
961
+ "Ġboat": 904,
962
+ "Ġnext": 905,
963
+ "##lease": 906,
964
+ "##ning": 907,
965
+ "Ġhappily": 908,
966
+ "Ġlisten": 909,
967
+ "Ġkids": 910,
968
+ "##aking": 911,
969
+ "Ġtra": 912,
970
+ "##ies": 913,
971
+ "ĠN": 914,
972
+ "Ġhelped": 915,
973
+ "##iful": 916,
974
+ "Ġapp": 917,
975
+ "Ġbeautiful": 918,
976
+ "Ġshowed": 919,
977
+ "Ġdra": 920,
978
+ "Ġimp": 921,
979
+ "##unny": 922,
980
+ "Ġstory": 923,
981
+ "Ġclos": 924,
982
+ "##oy": 925,
983
+ "Ġtown": 926,
984
+ "Ġwhile": 927,
985
+ "##rel": 928,
986
+ "##be": 929,
987
+ "Ġrain": 930,
988
+ "Ġpicture": 931,
989
+ "##ress": 932,
990
+ "##pt": 933,
991
+ "Ġun": 934,
992
+ "Ġbeing": 935,
993
+ "Ġeveryone": 936,
994
+ "Ġrem": 937,
995
+ "##ary": 938,
996
+ "Ġmor": 939,
997
+ "Ġhat": 940,
998
+ "##ree": 941,
999
+ "##th": 942,
1000
+ "Ġmet": 943,
1001
+ "Ġcalled": 944,
1002
+ "Ġstopped": 945,
1003
+ "Ġgame": 946,
1004
+ "It": 947,
1005
+ "Ġad": 948,
1006
+ "Can": 949,
1007
+ "He": 950,
1008
+ "##uffy": 951,
1009
+ "Ġangry": 952,
1010
+ "##ger": 953,
1011
+ "Ġopen": 954,
1012
+ "Ġtruck": 955,
1013
+ "Ġsoft": 956,
1014
+ "Ġyummy": 957,
1015
+ "Ġkeep": 958,
1016
+ "Ġwo": 959,
1017
+ "Ġlost": 960,
1018
+ "Ġcry": 961,
1019
+ "Ġbed": 962,
1020
+ "When": 963,
1021
+ "ĠSally": 964,
1022
+ "ĠLet": 965,
1023
+ "Ġwarm": 966,
1024
+ "Ġate": 967,
1025
+ "Ġmouse": 968,
1026
+ "ĠKitty": 969,
1027
+ "Ġbrave": 970,
1028
+ "ĠWh": 971,
1029
+ "##vent": 972,
1030
+ "##ished": 973,
1031
+ "##by": 974,
1032
+ "Ġwatch": 975,
1033
+ "Ġde": 976,
1034
+ "Ġdoll": 977,
1035
+ "##so": 978,
1036
+ "##fore": 979,
1037
+ "Ġleave": 980,
1038
+ "Ġfell": 981,
1039
+ "Ġcouldn": 982,
1040
+ "Ġalso": 983,
1041
+ "Ġgreen": 984,
1042
+ "##dded": 985,
1043
+ "Ġsn": 986,
1044
+ "Ġface": 987,
1045
+ "Ġflowers": 988,
1046
+ "Ġtwo": 989,
1047
+ "ĠR": 990,
1048
+ "##iss": 991,
1049
+ "##gan": 992,
1050
+ "##bit": 993,
1051
+ "##ble": 994,
1052
+ "Ġnoise": 995,
1053
+ "##abbit": 996,
1054
+ "##irst": 997,
1055
+ "What": 998,
1056
+ "##owl": 999
1057
+ },
1058
+ "merges": [
1059
+ "Ġ ##t",
1060
+ "##h ##e",
1061
+ "Ġ ##a",
1062
+ "Ġ ##s",
1063
+ "Ġ ##w",
1064
+ "##n ##d",
1065
+ "Ġt ##he",
1066
+ "##e ##d",
1067
+ "Ġ ##b",
1068
+ "Ġt ##o",
1069
+ "Ġa ##nd",
1070
+ "Ġ ##h",
1071
+ "Ġ ##f",
1072
+ "Ġ ##T",
1073
+ "##i ##n",
1074
+ "Ġw ##a",
1075
+ "##r ##e",
1076
+ "##i ##t",
1077
+ "##o ##u",
1078
+ "Ġ ##l",
1079
+ "Ġ ##d",
1080
+ "Ġ ##c",
1081
+ "Ġ ##p",
1082
+ "##a ##y",
1083
+ "Ġ ##m",
1084
+ "##e ##r",
1085
+ "Ġwa ##s",
1086
+ "ĠT ##he",
1087
+ "##o ##m",
1088
+ "Ġ ##he",
1089
+ "##i ##s",
1090
+ "Ġ ##n",
1091
+ "##a ##r",
1092
+ "##i ##m",
1093
+ "##o ##n",
1094
+ "Ġs ##a",
1095
+ "##i ##d",
1096
+ "##l ##l",
1097
+ "Ġh ##a",
1098
+ "Ġ ##g",
1099
+ "##a ##t",
1100
+ "Ġ ##S",
1101
+ "##in ##g",
1102
+ "##o ##t",
1103
+ "##e ##n",
1104
+ "##a ##n",
1105
+ "##l ##e",
1106
+ "##o ##r",
1107
+ "##i ##r",
1108
+ "##a ##m",
1109
+ "##e ##t",
1110
+ "Ġ ##H",
1111
+ "Ġ ##it",
1112
+ "Ġt ##h",
1113
+ "##i ##g",
1114
+ "ĠThe ##y",
1115
+ "Ġ ##in",
1116
+ "##i ##l",
1117
+ "Ġ ##\"",
1118
+ "Ġp ##l",
1119
+ "ĠH ##e",
1120
+ "##o ##w",
1121
+ "##v ##er",
1122
+ "##r ##i",
1123
+ "##u ##t",
1124
+ "Ġb ##e",
1125
+ "Ġ ##u",
1126
+ "Ġpl ##ay",
1127
+ "Ġsa ##id",
1128
+ "##it ##h",
1129
+ "Ġd ##ay",
1130
+ "Ġw ##ith",
1131
+ "##p ##p",
1132
+ "Ġ ##o",
1133
+ "Ġ ##y",
1134
+ "##o ##o",
1135
+ "##k ##ed",
1136
+ "Ġ ##r",
1137
+ "Ġhe ##r",
1138
+ "##c ##e",
1139
+ "Ġ ##I",
1140
+ "ĠS ##he",
1141
+ "ĠT ##im",
1142
+ "##l ##d",
1143
+ "Ġh ##is",
1144
+ "Ġs ##t",
1145
+ "##k ##e",
1146
+ "Ġ ##e",
1147
+ "Ġb ##ig",
1148
+ "##n ##t",
1149
+ "##c ##k",
1150
+ "##ver ##y",
1151
+ "Ġy ##ou",
1152
+ "##s ##t",
1153
+ "##n ##e",
1154
+ "##v ##e",
1155
+ "Ġ ##O",
1156
+ "##e ##nd",
1157
+ "Ġ ##on",
1158
+ "Ġha ##pp",
1159
+ "##u ##n",
1160
+ "Ġ ##L",
1161
+ "##ri ##end",
1162
+ "Ġf ##riend",
1163
+ "##a ##ll",
1164
+ "##il ##y",
1165
+ "Ġthe ##y",
1166
+ "Ġw ##e",
1167
+ "Ġha ##d",
1168
+ "Ġn ##ot",
1169
+ "Ġl ##i",
1170
+ "Ġu ##p",
1171
+ "##he ##r",
1172
+ "Ġwa ##nt",
1173
+ "Ġo ##f",
1174
+ "##a ##d",
1175
+ "##it ##t",
1176
+ "Ġ ##B",
1177
+ "##s ##e",
1178
+ "Ġd ##o",
1179
+ "Ġhapp ##y",
1180
+ "Ġ ##M",
1181
+ "Ġ ##very",
1182
+ "##en ##t",
1183
+ "' ##s",
1184
+ "Ġsa ##w",
1185
+ "Ġth ##at",
1186
+ "##e ##s",
1187
+ "##ou ##ld",
1188
+ "Ġm ##om",
1189
+ "Ġf ##or",
1190
+ "Ġs ##h",
1191
+ "##itt ##le",
1192
+ "Ġl ##ittle",
1193
+ "Ġs ##o",
1194
+ "Ġs ##he",
1195
+ ". ##\"",
1196
+ "##im ##e",
1197
+ "##c ##h",
1198
+ "Ġn ##am",
1199
+ "Ġn ##e",
1200
+ "Ġt ##ime",
1201
+ "Ġ ##k",
1202
+ "##ou ##nd",
1203
+ "Ġthe ##re",
1204
+ "ĠL ##ily",
1205
+ "Ġnam ##ed",
1206
+ "Ġb ##o",
1207
+ "Ġs ##m",
1208
+ "Ġwe ##re",
1209
+ "ĠT ##om",
1210
+ "! ##\"",
1211
+ "Ġwant ##ed",
1212
+ "Ġb ##ut",
1213
+ "##ou ##t",
1214
+ "Ġfriend ##s",
1215
+ "##v ##ed",
1216
+ "T ##he",
1217
+ "##h ##t",
1218
+ "##ir ##d",
1219
+ "Ġb ##ird",
1220
+ "##e ##l",
1221
+ "##a ##l",
1222
+ "Ġa ##n",
1223
+ "##a ##ke",
1224
+ "Ġto ##o",
1225
+ "ĠI ##t",
1226
+ "##om ##e",
1227
+ "##u ##g",
1228
+ "##n ##ce",
1229
+ "##id ##e",
1230
+ "Ġw ##ent",
1231
+ "Ġhe ##l",
1232
+ "Ġw ##h",
1233
+ "ĠO ##nce",
1234
+ "Ġ ##is",
1235
+ "Ġa ##ll",
1236
+ "Ġhel ##p",
1237
+ "##u ##e",
1238
+ "Ġ ##A",
1239
+ "Ġl ##o",
1240
+ "Ġl ##oo",
1241
+ "##t ##er",
1242
+ "Ġup ##on",
1243
+ "##r ##y",
1244
+ "##o ##re",
1245
+ "Ġf ##un",
1246
+ "##i ##nd",
1247
+ "##g ##et",
1248
+ "Ġto ##y",
1249
+ "ĠO ##ne",
1250
+ "##i ##ll",
1251
+ "##am ##e",
1252
+ "Ġa ##s",
1253
+ "Ġa ##t",
1254
+ "##r ##a",
1255
+ "Ġ ##j",
1256
+ "Ġd ##id",
1257
+ "##get ##her",
1258
+ "Ġ ##re",
1259
+ "##u ##r",
1260
+ "Ġto ##gether",
1261
+ "Ġs ##e",
1262
+ "##a ##ck",
1263
+ "Ġc ##at",
1264
+ "Ġt ##re",
1265
+ "##l ##y",
1266
+ "##oo ##d",
1267
+ "##i ##c",
1268
+ "##t ##ed",
1269
+ "Ġdo ##g",
1270
+ "Ġc ##ould",
1271
+ "Ġc ##an",
1272
+ "Ġthe ##ir",
1273
+ "##ar ##d",
1274
+ "? ##\"",
1275
+ "##ar ##k",
1276
+ "##e ##c",
1277
+ "Ġg ##ir",
1278
+ "Ġplay ##ed",
1279
+ "Ġb ##all",
1280
+ "Ġh ##im",
1281
+ "Ġgir ##l",
1282
+ "##w ##ay",
1283
+ "Ġr ##o",
1284
+ "##he ##d",
1285
+ "Ġg ##o",
1286
+ "##m ##y",
1287
+ "Ġa ##re",
1288
+ "' ##t",
1289
+ "Ġl ##e",
1290
+ "Ġ ##out",
1291
+ "Ġf ##r",
1292
+ "##a ##in",
1293
+ "Ġthe ##m",
1294
+ "##u ##m",
1295
+ "##he ##n",
1296
+ "##a ##x",
1297
+ "Ġsa ##d",
1298
+ "Ġbo ##y",
1299
+ "##u ##l",
1300
+ "Ġtre ##e",
1301
+ "##ot ##her",
1302
+ "Ġha ##ve",
1303
+ "Ġm ##an",
1304
+ "Ġlo ##ved",
1305
+ "Ġc ##l",
1306
+ "Ġloo ##ked",
1307
+ "##ou ##g",
1308
+ "Ġf ##ound",
1309
+ "Ġs ##p",
1310
+ "Ġst ##ar",
1311
+ "ĠS ##ue",
1312
+ "##on ##e",
1313
+ "Ġs ##c",
1314
+ "##h ##ing",
1315
+ "Ġb ##ack",
1316
+ "ĠM ##ax",
1317
+ "##ow ##n",
1318
+ "##a ##re",
1319
+ "Ġli ##ke",
1320
+ "##f ##ul",
1321
+ "##s ##ide",
1322
+ "Ġbe ##c",
1323
+ "O ##ne",
1324
+ "Ġm ##e",
1325
+ "Ġp ##ark",
1326
+ "##on ##g",
1327
+ "Ġc ##ar",
1328
+ "##ig ##ht",
1329
+ "##o ##p",
1330
+ "Ġli ##ked",
1331
+ "##el ##t",
1332
+ "Ġw ##ould",
1333
+ "Ġm ##ake",
1334
+ "Ġl ##a",
1335
+ "Ġf ##a",
1336
+ "##r ##ound",
1337
+ "Ġf ##elt",
1338
+ "##e ##ll",
1339
+ "Ġ ##W",
1340
+ "Ġse ##e",
1341
+ "ĠB ##ut",
1342
+ "ĠB ##en",
1343
+ "ĠS ##am",
1344
+ "##om ##et",
1345
+ "Ġas ##ked",
1346
+ "Ġne ##w",
1347
+ "##a ##g",
1348
+ "Ġn ##o",
1349
+ "##ou ##se",
1350
+ "##i ##ce",
1351
+ "Ġstar ##ted",
1352
+ "##ar ##ed",
1353
+ "Ġc ##ame",
1354
+ "Ġ ##other",
1355
+ "Ġa ##l",
1356
+ "##oug ##ht",
1357
+ "##il ##ed",
1358
+ "##s ##s",
1359
+ "Ġa ##g",
1360
+ "Ġs ##omet",
1361
+ "Ġg ##ood",
1362
+ "Ġsm ##all",
1363
+ "Ġb ##r",
1364
+ "Ġs ##ay",
1365
+ "##ri ##ed",
1366
+ "Ġsm ##iled",
1367
+ "##ad ##e",
1368
+ "##ing ##s",
1369
+ "##o ##b",
1370
+ "##p ##ot",
1371
+ "Ġw ##or",
1372
+ "Ġf ##ind",
1373
+ "##i ##a",
1374
+ "Ġe ##x",
1375
+ "##t ##y",
1376
+ "Ġa ##way",
1377
+ "Ġp ##ut",
1378
+ "Ġc ##o",
1379
+ "Ġm ##ade",
1380
+ "Ġwh ##at",
1381
+ "Ġfr ##om",
1382
+ "Ġsomet ##hing",
1383
+ "Ġth ##ought",
1384
+ "##en ##ed",
1385
+ "Ġh ##ome",
1386
+ "Ġplay ##ing",
1387
+ "Ġe ##very",
1388
+ "##oo ##k",
1389
+ "Ġwa ##l",
1390
+ "##u ##c",
1391
+ "Ġm ##u",
1392
+ "##a ##ch",
1393
+ "Ġ ##J",
1394
+ "##ar ##n",
1395
+ "ĠS ##pot",
1396
+ "Ġr ##an",
1397
+ "Ġ ##F",
1398
+ "##i ##le",
1399
+ "##i ##e",
1400
+ "##a ##ve",
1401
+ "Ġag ##ain",
1402
+ "Ġla ##ug",
1403
+ "Ġs ##ome",
1404
+ "##n ##ow",
1405
+ "Ġh ##ouse",
1406
+ "##d ##d",
1407
+ "Ġd ##own",
1408
+ "Ġf ##l",
1409
+ "Ġtoo ##k",
1410
+ "Ġsc ##ared",
1411
+ "##k ##ing",
1412
+ "##n ##y",
1413
+ "Ġ ##Y",
1414
+ "Ġp ##r",
1415
+ "Ġtoy ##s",
1416
+ "Ġle ##arn",
1417
+ "##u ##re",
1418
+ "Ġbo ##x",
1419
+ "##i ##f",
1420
+ "Ġw ##ill",
1421
+ "ĠY ##ou",
1422
+ "##re ##t",
1423
+ "##i ##ck",
1424
+ "##a ##b",
1425
+ "##e ##p",
1426
+ "Ġth ##ings",
1427
+ "Ġm ##y",
1428
+ "Ġa ##round",
1429
+ "Ġyou ##r",
1430
+ "Ġb ##l",
1431
+ "##ou ##d",
1432
+ "Ġli ##ved",
1433
+ "##u ##ck",
1434
+ "##is ##h",
1435
+ ", ##\"",
1436
+ "Ġf ##e",
1437
+ "Ġs ##un",
1438
+ "Ġthe ##n",
1439
+ "##a ##s",
1440
+ "Ġs ##w",
1441
+ "Ġw ##hen",
1442
+ "Ġc ##h",
1443
+ "##u ##s",
1444
+ "##pp ##ed",
1445
+ "ĠM ##ia",
1446
+ "Ġa ##b",
1447
+ "##an ##k",
1448
+ "Ġg ##et",
1449
+ "##uc ##y",
1450
+ "##um ##p",
1451
+ "Ġl ##ot",
1452
+ "T ##h",
1453
+ "##is ##t",
1454
+ "##ot ##h",
1455
+ "Ġt ##ried",
1456
+ "##a ##p",
1457
+ "T ##im",
1458
+ "Ġsay ##s",
1459
+ "Ġk ##now",
1460
+ "Ġg ##ot",
1461
+ "Ġk ##ne",
1462
+ "##it ##ed",
1463
+ "Ġwh ##o",
1464
+ "##u ##st",
1465
+ "Ġman ##y",
1466
+ "##nd ##er",
1467
+ "Ġin ##t",
1468
+ "Ġab ##out",
1469
+ "Ġp ##ret",
1470
+ "Ġan ##y",
1471
+ "Ġr ##ed",
1472
+ "Ġd ##ec",
1473
+ "Ġ ##D",
1474
+ "##i ##ve",
1475
+ "Ġkne ##w",
1476
+ "##a ##ce",
1477
+ "Ġm ##ore",
1478
+ "##ou ##s",
1479
+ "##is ##e",
1480
+ "Ġp ##ic",
1481
+ "Ġc ##are",
1482
+ "##all ##y",
1483
+ "##a ##u",
1484
+ "ĠL ##ucy",
1485
+ "Ġlearn ##ed",
1486
+ "Ġh ##ug",
1487
+ "##q ##u",
1488
+ "Ġwa ##ter",
1489
+ "##f ##ter",
1490
+ "Ġp ##o",
1491
+ "Ġbec ##ame",
1492
+ "Ġbe ##st",
1493
+ "Ġ ##v",
1494
+ "##au ##se",
1495
+ "Ġg ##re",
1496
+ "Ġo ##p",
1497
+ "##way ##s",
1498
+ "##ur ##p",
1499
+ "Ġlaug ##hed",
1500
+ "Ġout ##side",
1501
+ "Ġex ##c",
1502
+ "Ġloo ##k",
1503
+ "Ġal ##ways",
1504
+ "ĠB ##ob",
1505
+ "Ġsh ##ow",
1506
+ "Ġdec ##id",
1507
+ "Ġro ##om",
1508
+ "Ġbec ##ause",
1509
+ "##an ##t",
1510
+ "ĠS ##o",
1511
+ "##f ##e",
1512
+ "Ġh ##o",
1513
+ "Ġdecid ##ed",
1514
+ "Ġe ##at",
1515
+ "Ġint ##o",
1516
+ "##it ##e",
1517
+ "Ġj ##ump",
1518
+ "ĠA ##nd",
1519
+ "Ġb ##oth",
1520
+ "Ġp ##e",
1521
+ "##er ##s",
1522
+ "ĠM ##om",
1523
+ "The ##y",
1524
+ "Ġd ##ad",
1525
+ "Ġ ##ke",
1526
+ "##u ##dd",
1527
+ "Ġon ##e",
1528
+ "L ##ily",
1529
+ "Ġfa ##st",
1530
+ "Ġn ##ice",
1531
+ "Ġ ##E",
1532
+ "Ġth ##is",
1533
+ "##n ##n",
1534
+ "Ġexc ##ited",
1535
+ "Ġfe ##el",
1536
+ "Ġr ##un",
1537
+ "Ġl ##ong",
1538
+ "Y ##es",
1539
+ "##ou ##r",
1540
+ "Ġto ##ld",
1541
+ "Ġs ##k",
1542
+ "Ġa ##m",
1543
+ "##urp ##r",
1544
+ "Ġin ##side",
1545
+ "##u ##ll",
1546
+ "Ġt ##r",
1547
+ "Ġs ##urpr",
1548
+ "Ġm ##o",
1549
+ "Ġpret ##ty",
1550
+ "##in ##y",
1551
+ "##in ##k",
1552
+ "Ġs ##or",
1553
+ "W ##h",
1554
+ "Ġt ##ake",
1555
+ "##o ##g",
1556
+ "Ġe ##ach",
1557
+ "Ġg ##ave",
1558
+ "Ġs ##l",
1559
+ "Ġmu ##ch",
1560
+ "##le ##w",
1561
+ "Ġro ##ck",
1562
+ "##nn ##a",
1563
+ "Ġg ##ra",
1564
+ "Ġst ##r",
1565
+ "Ġh ##ow",
1566
+ "##im ##al",
1567
+ "Ġan ##imal",
1568
+ "##ar ##a",
1569
+ "##g ##ed",
1570
+ "Ġne ##ed",
1571
+ "Ġth ##an",
1572
+ "##et ##ter",
1573
+ "B ##ut",
1574
+ "Ġto ##w",
1575
+ "##v ##en",
1576
+ "Ġ ##or",
1577
+ "Ġ ##C",
1578
+ "Ġu ##nder",
1579
+ "T ##om",
1580
+ "Ġsor ##ry",
1581
+ "Ġo ##ld",
1582
+ "##g ##e",
1583
+ "##is ##ed",
1584
+ "##r ##o",
1585
+ "##ur ##t",
1586
+ "Ġf ##ish",
1587
+ "Ġc ##le",
1588
+ "Ġwal ##ked",
1589
+ "Ġcl ##o",
1590
+ "Ġbe ##ar",
1591
+ "##f ##t",
1592
+ "##a ##se",
1593
+ "##a ##st",
1594
+ "##a ##nd",
1595
+ "Ġha ##nd",
1596
+ "##es ##s",
1597
+ "##ur ##n",
1598
+ "Ġk ##ind",
1599
+ "ĠW ##e",
1600
+ "ĠH ##is",
1601
+ "Ġt ##e",
1602
+ "Ġhapp ##ened",
1603
+ "Ġfl ##ow",
1604
+ "##he ##re",
1605
+ "Ġf ##ood",
1606
+ "Ġl ##ist",
1607
+ "Ġj ##ust",
1608
+ "Ġanimal ##s",
1609
+ "Ġh ##ig",
1610
+ "Ġdid ##n",
1611
+ "Ġne ##ar",
1612
+ "Ġ ##ide",
1613
+ "Ġwa ##t",
1614
+ "Ġsk ##y",
1615
+ "Ġt ##ry",
1616
+ "##in ##e",
1617
+ "##c ##hed",
1618
+ "Ġf ##i",
1619
+ "##r ##om",
1620
+ "##p ##l",
1621
+ "##v ##ing",
1622
+ "ĠA ##my",
1623
+ "Ġu ##s",
1624
+ "Ġide ##a",
1625
+ "Ġb ##etter",
1626
+ "Ġb ##ug",
1627
+ "##g ##ry",
1628
+ "Ġit ##s",
1629
+ "Ġhe ##ard",
1630
+ "Ġt ##w",
1631
+ "##p ##ec",
1632
+ "Ġl ##et",
1633
+ "##at ##e",
1634
+ "##f ##f",
1635
+ "##ab ##le",
1636
+ "Ġsh ##are",
1637
+ "Ġcare ##ful",
1638
+ "Ġ ##en",
1639
+ "Th ##ank",
1640
+ "Ġf ##ly",
1641
+ "Ġ ##if",
1642
+ "Ġst ##or",
1643
+ "##m ##ore",
1644
+ "Ġany ##more",
1645
+ "Ġf ##lew",
1646
+ "##i ##al",
1647
+ "ĠA ##nna",
1648
+ "M ##om",
1649
+ "ĠT ##h",
1650
+ "Ġlot ##s",
1651
+ "Ġsp ##ec",
1652
+ "Ġspec ##ial",
1653
+ "##i ##on",
1654
+ "Ġc ##om",
1655
+ "Ġne ##ver",
1656
+ "Ġb ##y",
1657
+ "##l ##f",
1658
+ "Ġd ##an",
1659
+ "##re ##am",
1660
+ "Ġw ##ind",
1661
+ "Ġb ##u",
1662
+ "Ġf ##o",
1663
+ "Ġd ##on",
1664
+ "Ġcle ##an",
1665
+ "Ġt ##al",
1666
+ "##or ##t",
1667
+ "Ġg ##r",
1668
+ "##r ##m",
1669
+ "Ġlo ##ve",
1670
+ "Ġe ##nd",
1671
+ "##op ##le",
1672
+ "ĠThe ##n",
1673
+ "##b ##er",
1674
+ "Ġe ##ven",
1675
+ "Ġm ##ag",
1676
+ "Ġsh ##iny",
1677
+ "Ġh ##ard",
1678
+ "Ġf ##ore",
1679
+ "ĠS ##ara",
1680
+ "Ġc ##ake",
1681
+ "Ġo ##ver",
1682
+ "##udd ##en",
1683
+ "##a ##k",
1684
+ "Ġb ##ook",
1685
+ "Ġco ##l",
1686
+ "Ġt ##urn",
1687
+ "Ġf ##am",
1688
+ "Ġsa ##fe",
1689
+ "Ġb ##ad",
1690
+ "Ġa ##fter",
1691
+ "Ġpe ##ople",
1692
+ "##ad ##y",
1693
+ "Ġpr ##oud",
1694
+ "##pec ##ted",
1695
+ "Ġsurpr ##ised",
1696
+ "ĠE ##very",
1697
+ "Ġhig ##h",
1698
+ "##udden ##ly",
1699
+ "L ##et",
1700
+ "Ġh ##urt",
1701
+ "Ġc ##u",
1702
+ "##im ##b",
1703
+ "Ġpic ##ked",
1704
+ "Ġg ##round",
1705
+ "Ġc ##ome",
1706
+ "##ard ##en",
1707
+ "Ġu ##ne",
1708
+ "Ġg ##arden",
1709
+ "Ġdo ##or",
1710
+ "##x ##pected",
1711
+ "Ġune ##xpected",
1712
+ "Ġop ##ened",
1713
+ "Ġcl ##imb",
1714
+ "Ġl ##oud",
1715
+ "##b ##b",
1716
+ "Y ##ou",
1717
+ "Ġc ##he",
1718
+ "Ġg ##l",
1719
+ "' ##m",
1720
+ "A ##s",
1721
+ "Ġ ##im",
1722
+ "##il ##d",
1723
+ "Ġg ##ive",
1724
+ "##a ##il",
1725
+ "Ġwa ##y",
1726
+ "Ġcol ##or",
1727
+ "Ġbl ##ue",
1728
+ "Ġthan ##ked",
1729
+ "Ġst ##ill",
1730
+ "Ġe ##ver",
1731
+ "ĠF ##rom",
1732
+ "Ġhug ##ged",
1733
+ "Ġf ##ar",
1734
+ "##i ##p",
1735
+ "Ġc ##all",
1736
+ "ĠH ##er",
1737
+ "Ġmag ##ic",
1738
+ "##ag ##e",
1739
+ "Ġof ##f",
1740
+ "##um ##my",
1741
+ "Ġ ##K",
1742
+ "##i ##z",
1743
+ "##oug ##h",
1744
+ "##x ##t",
1745
+ "Ġjump ##ed",
1746
+ "ĠW ##hen",
1747
+ "Ġsh ##ould",
1748
+ "Ġp ##ar",
1749
+ "Ġfam ##ily",
1750
+ "##oo ##l",
1751
+ "Ġk ##id",
1752
+ "Ġsm ##ile",
1753
+ "##u ##ff",
1754
+ "##he ##s",
1755
+ "Ġpl ##ace",
1756
+ "##k ##ay",
1757
+ "ĠI ##n",
1758
+ "Ġwal ##k",
1759
+ "##c ##t",
1760
+ "Ġgre ##at",
1761
+ "Ġn ##ow",
1762
+ "##e ##m",
1763
+ "Ġstr ##ong",
1764
+ "##le ##s",
1765
+ "Ġ ##qu",
1766
+ "Ġst ##ay",
1767
+ "Ġu ##nt",
1768
+ "Ġst ##o",
1769
+ "N ##o",
1770
+ "Ġfore ##st",
1771
+ "##a ##ut",
1772
+ "##itt ##y",
1773
+ "##t ##ure",
1774
+ "Ġ ##P",
1775
+ "##an ##e",
1776
+ "Ġfr ##og",
1777
+ "Ġb ##ra",
1778
+ "Ġbr ##o",
1779
+ "##o ##on",
1780
+ "Ġunt ##il",
1781
+ "Ġbe ##aut",
1782
+ "Ġs ##qu",
1783
+ "Ġst ##ick",
1784
+ "##d ##y",
1785
+ "Ġbo ##at",
1786
+ "Ġne ##xt",
1787
+ "##le ##ase",
1788
+ "##n ##ing",
1789
+ "Ġhapp ##ily",
1790
+ "Ġlist ##en",
1791
+ "Ġkid ##s",
1792
+ "##a ##king",
1793
+ "Ġt ##ra",
1794
+ "##i ##es",
1795
+ "Ġ ##N",
1796
+ "Ġhelp ##ed",
1797
+ "##i ##ful",
1798
+ "Ġa ##pp",
1799
+ "Ġbeaut ##iful",
1800
+ "Ġshow ##ed",
1801
+ "Ġd ##ra",
1802
+ "Ġim ##p",
1803
+ "##un ##ny",
1804
+ "Ġstor ##y",
1805
+ "Ġclo ##s",
1806
+ "##o ##y",
1807
+ "Ġtow ##n",
1808
+ "Ġwh ##ile",
1809
+ "##re ##l",
1810
+ "##b ##e",
1811
+ "Ġr ##ain",
1812
+ "Ġpic ##ture",
1813
+ "##re ##ss",
1814
+ "##p ##t",
1815
+ "Ġu ##n",
1816
+ "Ġbe ##ing",
1817
+ "Ġevery ##one",
1818
+ "Ġre ##m",
1819
+ "##ar ##y",
1820
+ "Ġm ##or",
1821
+ "Ġha ##t",
1822
+ "##re ##e",
1823
+ "##t ##h",
1824
+ "Ġm ##et",
1825
+ "Ġcall ##ed",
1826
+ "Ġsto ##pped",
1827
+ "Ġg ##ame",
1828
+ "I ##t",
1829
+ "Ġa ##d",
1830
+ "C ##an",
1831
+ "H ##e",
1832
+ "##uff ##y",
1833
+ "Ġan ##gry",
1834
+ "##g ##er",
1835
+ "Ġop ##en",
1836
+ "Ġtr ##uck",
1837
+ "Ġso ##ft",
1838
+ "Ġy ##ummy",
1839
+ "Ġke ##ep",
1840
+ "Ġw ##o",
1841
+ "Ġlo ##st",
1842
+ "Ġc ##ry",
1843
+ "Ġb ##ed",
1844
+ "W ##hen",
1845
+ "ĠS ##ally",
1846
+ "ĠL ##et",
1847
+ "Ġwa ##rm",
1848
+ "Ġat ##e",
1849
+ "Ġm ##ouse",
1850
+ "ĠK ##itty",
1851
+ "Ġbra ##ve",
1852
+ "ĠW ##h",
1853
+ "##v ##ent",
1854
+ "##is ##hed",
1855
+ "##b ##y",
1856
+ "Ġwat ##ch",
1857
+ "Ġd ##e",
1858
+ "Ġdo ##ll",
1859
+ "##s ##o",
1860
+ "##f ##ore",
1861
+ "Ġle ##ave",
1862
+ "Ġf ##ell",
1863
+ "Ġcould ##n",
1864
+ "Ġal ##so",
1865
+ "Ġgre ##en",
1866
+ "##dd ##ed",
1867
+ "Ġs ##n",
1868
+ "Ġfa ##ce",
1869
+ "Ġflow ##ers",
1870
+ "Ġtw ##o",
1871
+ "Ġ ##R",
1872
+ "##is ##s",
1873
+ "##g ##an",
1874
+ "##b ##it",
1875
+ "##b ##le",
1876
+ "Ġno ##ise",
1877
+ "##ab ##bit",
1878
+ "##ir ##st",
1879
+ "Wh ##at",
1880
+ "##ow ##l"
1881
+ ]
1882
+ }
1883
+ }
tokenizer_config.json ADDED
@@ -0,0 +1,5 @@
 
 
 
 
 
 
1
+ {
2
+ "clean_up_tokenization_spaces": false,
3
+ "model_max_length": 1000000000000000019884624838656,
4
+ "tokenizer_class": "PreTrainedTokenizerFast"
5
+ }