add tokenizer

Files changed (2) hide show

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json CHANGED Viewed

@@ -33,7 +33,7 @@
     "rstrip": false,
     "single_word": false
   },
-  "name_or_path": "tokenizer/vocab.txt",
   "never_split": null,
   "pad_token": {
     "__type": "AddedToken",
@@ -51,6 +51,7 @@
     "rstrip": false,
     "single_word": false
   },
   "strip_accents": null,
   "tokenize_chinese_chars": true,
   "tokenizer_class": "MPNetTokenizer",

     "rstrip": false,
     "single_word": false
   },
+  "name_or_path": "onlydj96/mpnet_pretrain_10",
   "never_split": null,
   "pad_token": {
     "__type": "AddedToken",
     "rstrip": false,
     "single_word": false
   },
+  "special_tokens_map_file": "/root/.cache/huggingface/transformers/4aa599e6ac8f0263a04a4569ddadb35dafe43bfb10448da4035dd12101ec111a.1b83d0d7f4d455d37c683966d465a99be7f33983cf93b19ad8d2d23d044ea57a",
   "strip_accents": null,
   "tokenize_chinese_chars": true,
   "tokenizer_class": "MPNetTokenizer",