Upload tokenizer

Files changed (4) hide show

source.spm CHANGED Viewed

Binary files a/source.spm and b/source.spm differ

target.spm CHANGED Viewed

Binary files a/target.spm and b/target.spm differ

tokenizer_config.json CHANGED Viewed

@@ -16,7 +16,7 @@
       "single_word": false,
       "special": true
     },
-    "59993": {
       "content": "<pad>",
       "lstrip": false,
       "normalized": false,
@@ -31,9 +31,9 @@
   "pad_token": "<pad>",
   "return_tensors": "pt",
   "separate_vocabs": false,
-  "source_lang": "eng",
   "sp_model_kwargs": {},
-  "target_lang": "tur",
   "tokenizer_class": "MarianTokenizer",
   "unk_token": "<unk>"
 }

       "single_word": false,
       "special": true
     },
+    "62388": {
       "content": "<pad>",
       "lstrip": false,
       "normalized": false,
   "pad_token": "<pad>",
   "return_tensors": "pt",
   "separate_vocabs": false,
+  "source_lang": "tr",
   "sp_model_kwargs": {},
+  "target_lang": "en",
   "tokenizer_class": "MarianTokenizer",
   "unk_token": "<unk>"
 }

vocab.json CHANGED Viewed

The diff for this file is too large to render. See raw diff