codesage
/

codesage-small

Inference Endpoints

Model card Files Files and versions Community

codesage commited on Jun 26, 2024

Commit

a4a3da0

·

verified ·

1 Parent(s): 9eb00ca

Upload tokenizer_config.json

Files changed (1) hide show

tokenizer_config.json +32 -0

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,32 @@

+{
+  "add_prefix_space": false,
+  "additional_special_tokens": [
+    "<|endoftext|>",
+    "<fim_prefix>",
+    "<fim_middle>",
+    "<fim_suffix>",
+    "<fim_pad>",
+    "<filename>",
+    "<gh_stars>",
+    "<issue_start>",
+    "<issue_comment>",
+    "<issue_closed>",
+    "<jupyter_start>",
+    "<jupyter_text>",
+    "<jupyter_code>",
+    "<jupyter_output>",
+    "<empty_output>",
+    "<commit_before>",
+    "<commit_msg>",
+    "<commit_after>",
+    "<reponame>"
+  ],
+  "bos_token": "<|endoftext|>",
+  "clean_up_tokenization_spaces": true,
+  "eos_token": "<|endoftext|>",
+  "add_eos_token": true,
+  "model_max_length": 1000000000000000019884624838656,
+  "tokenizer_class": "CodeSageTokenizer",
+  "unk_token": "<|endoftext|>",
+  "vocab_size": 49152
+}