Artix

Runtime error

Vitrous commited on Feb 15, 2024

Commit

6ef9b66

verified ·

1 Parent(s): d2c9447

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -50,7 +50,7 @@ def load_model_norm():
     # For example: revision="main"
     model = AutoModelForCausalLM.from_pretrained(model_name_or_path,device_map="auto", trust_remote_code=True,revision="gptq-4bit-128g-actorder_True")
     # Switch to CPU inference
-    model.cpu()
     tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True)
     return model, tokenizer

     # For example: revision="main"
     model = AutoModelForCausalLM.from_pretrained(model_name_or_path,device_map="auto", trust_remote_code=True,revision="gptq-4bit-128g-actorder_True")
     # Switch to CPU inference
+    model.to("cuda")
     tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True)
     return model, tokenizer