nlpulse
/

llama2-7b-chat-english_quotes

Text Generation

Model card Files Files and versions Community

egon-nlpulse commited on Jul 24, 2023

Commit

99bad3a

•

1 Parent(s): 482a654

ajustes

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -61,7 +61,7 @@ from peft import PeftConfig, PeftModel
 model_path = "nlpulse/llama2-7b-chat-english_quotes"
 # tokenizer
-tokenizer = AutoTokenizer.from_pretrained(model_path)
 tokenizer.pad_token = tokenizer.eos_token
 # quantization config
@@ -74,8 +74,8 @@ quant_config = BitsAndBytesConfig(
 # model adapter PEFT LoRA
 config = PeftConfig.from_pretrained(model_path)
-model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, quantization_config=quant_config, device_map={"":0},
-        use_auth_token=True)
 model = PeftModel.from_pretrained(model, model_path)
 # inference

 model_path = "nlpulse/llama2-7b-chat-english_quotes"
 # tokenizer
+tokenizer = AutoTokenizer.from_pretrained(model_path, use_auth_token=True)
 tokenizer.pad_token = tokenizer.eos_token
 # quantization config
 # model adapter PEFT LoRA
 config = PeftConfig.from_pretrained(model_path)
+model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path,
+        quantization_config=quant_config, device_map={"":0}, use_auth_token=True)
 model = PeftModel.from_pretrained(model, model_path)
 # inference