go-bruins-ruby-bf16-function-calling-v1 / tokenizer_config.json

Upload tokenizer

a3ace84 about 1 year ago

2.42 kB

	{
	"added_tokens_decoder": {
	"0": {
	"content": "<unk>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"1": {
	"content": "<s>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"2": {
	"content": "</s>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"32000": {
	"content": "<\|user\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"32001": {
	"content": "<\|system\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	},
	"32002": {
	"content": "<\|assistant\|>",
	"lstrip": false,
	"normalized": false,
	"rstrip": false,
	"single_word": false,
	"special": true
	}
	},
	"additional_special_tokens": [
	"<\|user\|>",
	"<\|system\|>",
	"<\|assistant\|>"
	],
	"bos_token": "<s>",
	"chat_template": "{% for message in messages %}{% if message['role'] == 'function_metadata' %}GPT4 Correct User: You have access to the following functions. Use them if required:\n\n{{ message['content'] }}\n\n{% elif message['role'] == 'user' and loop.index0 == 1 %}{{ message['content'] }}{{ eos_token }}GPT4 Correct Assistant:\n\n{% elif message['role'] == 'assistant' %}{{ message['content'] }}{{ eos_token }}GPT4 Correct User: {% elif message['role'] == 'function_call' %}Function call: {{ message['content'] }}{{ eos_token }}GPT4 Correct User: {% elif message['role'] == 'function_response' %}Here is the response to the function call. If helpful, use it to respond to my question/request:\n\n{{ message['content'] }}{{ eos_token }}GPT4 Correct Assistant:\n\n{% elif message['role'] == 'user' and loop.index0 != 1 %}{{ message['content'] }}{{ eos_token }}GPT4 Correct Assistant:\n\n{% endif %}{% endfor %}",
	"clean_up_tokenization_spaces": false,
	"eos_token": "</s>",
	"legacy": true,
	"model_max_length": 2048,
	"pad_token": "<\|pad\|>",
	"padding_side": "right",
	"sp_model_kwargs": {},
	"spaces_between_special_tokens": false,
	"tokenizer_class": "LlamaTokenizer",
	"unk_token": "<unk>",
	"use_default_system_prompt": true
	}