|
{ |
|
"additional_special_tokens": [ |
|
"<|endoftext|>", |
|
"<|startoftranscript|>", |
|
"<|¡|>", |
|
"<|¢|>", |
|
"<|£|>", |
|
"<|¤|>", |
|
"<|¥|>", |
|
"<|¦|>", |
|
"<|§|>", |
|
"<|¨|>", |
|
"<|©|>", |
|
"<|ª|>", |
|
"<|«|>", |
|
"<|¬|>", |
|
"<|®|>", |
|
"<|¯|>", |
|
"<|°|>", |
|
"<|±|>", |
|
"<|²|>", |
|
"<|³|>", |
|
"<|´|>", |
|
"<|µ|>", |
|
"<|¶|>", |
|
"<|·|>", |
|
"<|¸|>", |
|
"<|¹|>", |
|
"<|º|>", |
|
"<|»|>", |
|
"<|¼|>", |
|
"<|½|>", |
|
"<|¾|>", |
|
"<|¿|>", |
|
"<|À|>", |
|
"<|Á|>", |
|
"<|Â|>", |
|
"<|Ã|>", |
|
"<|Ä|>", |
|
"<|Å|>", |
|
"<|Æ|>", |
|
"<|Ç|>", |
|
"<|È|>", |
|
"<|É|>", |
|
"<|Ê|>", |
|
"<|Ë|>", |
|
"<|Ì|>", |
|
"<|Í|>", |
|
"<|Î|>", |
|
"<|Ï|>", |
|
"<|Ð|>", |
|
"<|Ñ|>", |
|
"<|Ò|>", |
|
"<|Ó|>", |
|
"<|Ô|>", |
|
"<|Õ|>", |
|
"<|Ö|>", |
|
"<|×|>", |
|
"<|Ø|>", |
|
"<|Ù|>", |
|
"<|Ú|>", |
|
"<|Û|>", |
|
"<|Ü|>", |
|
"<|Ý|>", |
|
"<|Þ|>", |
|
"<|ß|>", |
|
"<|à|>", |
|
"<|á|>", |
|
"<|â|>", |
|
"<|ã|>", |
|
"<|ä|>", |
|
"<|å|>", |
|
"<|æ|>", |
|
"<|ç|>", |
|
"<|è|>", |
|
"<|é|>", |
|
"<|ê|>", |
|
"<|ë|>", |
|
"<|ì|>", |
|
"<|í|>", |
|
"<|î|>", |
|
"<|ï|>", |
|
"<|ð|>", |
|
"<|ñ|>", |
|
"<|ò|>", |
|
"<|ó|>", |
|
"<|ô|>", |
|
"<|õ|>", |
|
"<|ö|>", |
|
"<|÷|>", |
|
"<|ø|>", |
|
"<|ù|>", |
|
"<|ú|>", |
|
"<|û|>", |
|
"<|ü|>", |
|
"<|ý|>", |
|
"<|þ|>", |
|
"<|ÿ|>", |
|
"<|Ā|>", |
|
"<|ā|>", |
|
"<|Ă|>", |
|
"<|ă|>", |
|
"<|Ą|>", |
|
"<|ą|>", |
|
"<|Ć|>", |
|
"<|ć|>", |
|
"<|Ĉ|>", |
|
"<|ĉ|>", |
|
"<|Ċ|>", |
|
"<|ċ|>", |
|
"<|Č|>", |
|
"<|č|>", |
|
"<|Ď|>", |
|
"<|ď|>", |
|
"<|Đ|>", |
|
"<|đ|>", |
|
"<|Ē|>", |
|
"<|ē|>", |
|
"<|Ĕ|>", |
|
"<|ĕ|>", |
|
"<|Ė|>", |
|
"<|ė|>", |
|
"<|Ę|>", |
|
"<|ę|>", |
|
"<|Ě|>", |
|
"<|ě|>", |
|
"<|Ĝ|>", |
|
"<|ĝ|>", |
|
"<|Ğ|>", |
|
"<|ğ|>", |
|
"<|Ġ|>", |
|
"<|ġ|>", |
|
"<|Ģ|>", |
|
"<|ģ|>", |
|
"<|Ĥ|>", |
|
"<|ĥ|>", |
|
"<|Ħ|>", |
|
"<|ħ|>", |
|
"<|Ĩ|>", |
|
"<|ĩ|>", |
|
"<|Ī|>", |
|
"<|ī|>", |
|
"<|Ĭ|>", |
|
"<|ĭ|>", |
|
"<|Į|>", |
|
"<|į|>", |
|
"<|İ|>", |
|
"<|ı|>", |
|
"<|IJ|>", |
|
"<|ij|>", |
|
"<|Ĵ|>", |
|
"<|ĵ|>", |
|
"<|Ķ|>", |
|
"<|ķ|>", |
|
"<|ĸ|>", |
|
"<|Ĺ|>", |
|
"<|ĺ|>", |
|
"<|Ļ|>", |
|
"<|ļ|>", |
|
"<|Ľ|>", |
|
"<|ľ|>", |
|
"<|Ŀ|>", |
|
"<|ŀ|>", |
|
"<|Ł|>", |
|
"<|ł|>", |
|
"<|Ń|>", |
|
"<|Ûķ|>", |
|
"<|ÛĮ|>", |
|
"<|ا|>", |
|
"<|ĠØ|>", |
|
"<|ÙĪ|>", |
|
"<|ÙĨ|>", |
|
"<|ر|>", |
|
"<|Ú©|>", |
|
"<|ĠÙ|>", |
|
"<|ت|>", |
|
"<|اÙĨ|>", |
|
"<|Ûİ|>", |
|
"<|د|>", |
|
"<|Ùħ|>", |
|
"<|Ġب|>", |
|
"<|ÛĨ|>", |
|
"<|س|>", |
|
"<|translate|>", |
|
"<|transcribe|>", |
|
"<|startoflm|>", |
|
"<|startofprev|>", |
|
"<|nocaptions|>", |
|
"<|notimestamps|>" |
|
], |
|
"bos_token": { |
|
"content": "<|endoftext|>", |
|
"lstrip": false, |
|
"normalized": true, |
|
"rstrip": false, |
|
"single_word": false |
|
}, |
|
"cls_token": "[CLS]", |
|
"eos_token": { |
|
"content": "<|endoftext|>", |
|
"lstrip": false, |
|
"normalized": true, |
|
"rstrip": false, |
|
"single_word": false |
|
}, |
|
"mask_token": "[MASK]", |
|
"pad_token": "<|endoftext|>", |
|
"sep_token": "[SEP]", |
|
"unk_token": { |
|
"content": "<|endoftext|>", |
|
"lstrip": false, |
|
"normalized": true, |
|
"rstrip": false, |
|
"single_word": false |
|
} |
|
} |
|
|