kkuramitsu
/

chico-0.03b

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

kkuramitsu commited on Nov 5, 2024

Commit

55ce49b

·

verified ·

1 Parent(s): 796a64d

Update tokenizer_config.json

Files changed (1) hide show

tokenizer_config.json +6 -6

tokenizer_config.json CHANGED Viewed

@@ -41,7 +41,7 @@
       "special": true
     },
     "5": {
-      "content": "<CLS|LLM-jp>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -49,7 +49,7 @@
       "special": true
     },
     "6": {
-      "content": "<SEP|LLM-jp>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -66,18 +66,18 @@
     }
   },
   "additional_special_tokens": [
-    "</s|LLM-jp>"
   ],
   "bos_token": "<s|LLM-jp>",
   "clean_up_tokenization_spaces": false,
-  "cls_token": "<CLS|LLM-jp>",
   "eod_token": "<EOD|LLM-jp>",
   "eos_token": "<EOD|LLM-jp>",
   "extra_ids": 0,
   "mask_token": "<mask|LLM-jp>",
   "model_max_length": 1000000000000000019884624838656,
-  "pad_token": "<pad|LLM-jp>",
-  "sep_token": "<SEP|LLM-jp>",
   "sp_model_kwargs": {},
   "tokenizer_class": "PreTrainedTokenizerFast",
   "unk_token": "<unk|LLM-jp>"

       "special": true
     },
     "5": {
+      "content": "<|im_start|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": true
     },
     "6": {
+      "content": "<|im_end|>",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
     }
   },
   "additional_special_tokens": [
+    "<EOD|LLM-jp>"
   ],
   "bos_token": "<s|LLM-jp>",
+  "chat_template": "{% for message in messages %}{{'<|im_start|>' + message['role'] + '\n' + message['content'] + '<|im_end|>' + '\n'}}{% endfor %}",
   "clean_up_tokenization_spaces": false,
   "eod_token": "<EOD|LLM-jp>",
   "eos_token": "<EOD|LLM-jp>",
   "extra_ids": 0,
+  "legacy": false,
   "mask_token": "<mask|LLM-jp>",
   "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "<EOD|LLM-jp>",
   "sp_model_kwargs": {},
   "tokenizer_class": "PreTrainedTokenizerFast",
   "unk_token": "<unk|LLM-jp>"