julep-ai-archive
/

samantha-1-tokenizer

Model card Files Files and versions Community

diwank commited on Jul 28, 2023

Commit

e644401

·

1 Parent(s): 860185b

Upload tokenizer

Files changed (2) hide show

special_tokens_map.json +3 -3
tokenizer_config.json +6 -4

special_tokens_map.json CHANGED Viewed

@@ -60,14 +60,14 @@
   "bos_token": {
     "content": "<s>",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "eos_token": {
     "content": "</s>",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
@@ -75,7 +75,7 @@
   "unk_token": {
     "content": "<unk>",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   }

   "bos_token": {
     "content": "<s>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "eos_token": {
     "content": "</s>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "unk_token": {
     "content": "<unk>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   }

tokenizer_config.json CHANGED Viewed

@@ -1,9 +1,11 @@
 {
   "bos_token": {
     "__type": "AddedToken",
     "content": "<s>",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
@@ -12,12 +14,12 @@
     "__type": "AddedToken",
     "content": "</s>",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "legacy": false,
-  "model_max_length": 1000000000000000019884624838656,
   "pad_token": null,
   "sp_model_kwargs": {},
   "tokenizer_class": "LlamaTokenizer",
@@ -25,7 +27,7 @@
     "__type": "AddedToken",
     "content": "<unk>",
     "lstrip": false,
-    "normalized": false,
     "rstrip": false,
     "single_word": false
   }

 {
+  "add_bos_token": true,
+  "add_eos_token": false,
   "bos_token": {
     "__type": "AddedToken",
     "content": "<s>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
     "__type": "AddedToken",
     "content": "</s>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "legacy": false,
+  "model_max_length": 2048,
   "pad_token": null,
   "sp_model_kwargs": {},
   "tokenizer_class": "LlamaTokenizer",
     "__type": "AddedToken",
     "content": "<unk>",
     "lstrip": false,
+    "normalized": true,
     "rstrip": false,
     "single_word": false
   }