Spaces:

Dovakiins
/

qwerrwe

Build error

App Files Files Community

qwerrwe / src /axolotl /prompt_strategies /sharegpt.py

winglian

use fastchat conversations template (#578)

e7d3e2d unverified about 1 year ago

raw

history blame

2.96 kB

	"""Module containing the SimpleShareGPTPromptTokenizingStrategy class"""
	from typing import Any, Dict, Optional

	from fastchat.conversation import Conversation, SeparatorStyle, register_conv_template

	from axolotl.prompt_tokenizers import ShareGPTPromptTokenizingStrategy
	from axolotl.prompters import ShareGPTPrompterV2

	register_conv_template(
	Conversation(
	name="chatml",
	system_template="<\|im_start\|>system\n{system_message}",
	system_message="You are a helpful assistant.",
	roles=["<\|im_start\|>user", "<\|im_start\|>assistant"],
	sep_style=SeparatorStyle.CHATML,
	sep="<\|im_end\|>\n",
	)
	)


	def load(tokenizer, cfg, ds_cfg: Optional[Dict[str, Any]] = None):
	conversation = (
	ds_cfg["conversation"] if ds_cfg and "conversation" in ds_cfg else None
	)
	field_human = ds_cfg["field_human"] if ds_cfg and "field_human" in ds_cfg else None
	field_model = ds_cfg["field_model"] if ds_cfg and "field_model" in ds_cfg else None
	return SimpleShareGPTPromptTokenizingStrategy(
	ShareGPTPrompterV2(
	conversation=conversation,
	role_key_model=field_model,
	role_key_human=field_human,
	),
	tokenizer,
	cfg.train_on_inputs,
	cfg.sequence_len,
	)


	def load_role(tokenizer, cfg):
	return SimpleRoleShareGPTPromptTokenizingStrategy(
	ShareGPTPrompterV2(),
	tokenizer,
	cfg.train_on_inputs,
	cfg.sequence_len,
	)


	def load_guanaco(tokenizer, cfg):
	return GuanacoShareGPTPromptTokenizingStrategy(
	ShareGPTPrompterV2(),
	tokenizer,
	cfg.train_on_inputs,
	cfg.sequence_len,
	)


	class SimpleShareGPTPromptTokenizingStrategy(ShareGPTPromptTokenizingStrategy):
	"""
	basic sharegpt strategy to grab conversations from the sample row
	"""

	def get_conversation_thread(self, prompt):
	return prompt["conversations"]


	class SimpleRoleShareGPTPromptTokenizingStrategy(ShareGPTPromptTokenizingStrategy):
	"""
	basic sharegpt strategy to grab conversations from the sample row, but uses role instead of from
	"""

	def get_conversation_thread(self, prompt):
	conversations = prompt["conversations"]
	# remap role: prompter/assistant, text: ... => from: human/gpt, value: ...
	turns = [{"from": t["role"], "value": t["value"]} for t in conversations]
	return turns


	class GuanacoShareGPTPromptTokenizingStrategy(ShareGPTPromptTokenizingStrategy):
	"""
	sharegpt strategy that remaps oasst data to sharegpt format
	"""

	def get_conversation_thread(self, prompt):
	conversations = prompt["conversations"]
	# remap role: prompter/assistant, text: ... => from: human/gpt, value: ...
	role_map = {"prompter": "human", "assistant": "gpt"}
	turns = [
	{"from": role_map[t["role"]], "value": t["text"]} for t in conversations
	]
	return turns