Spaces:

sdung
/

phi-2

Sleeping

sdung commited on Apr 9, 2024

Commit

05401d5

verified ·

1 Parent(s): a9afb03

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,6 +6,7 @@ from transformers import (
     AutoModelForCausalLM,
     TextIteratorStreamer,
     pipeline,
 )
 from threading import Thread
@@ -21,13 +22,19 @@ from threading import Thread
 model_name_or_path = "TheBloke/phi-2-GPTQ"
 # To use a different branch, change revision
 # For example: revision="gptq-4bit-32g-actorder_True"
 model = AutoModelForCausalLM.from_pretrained(model_name_or_path,
                                              device_map="cpu",
                                              trust_remote_code=True,
-                                             revision="main")
 tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True)
 # Text generation pipeline
 phi2 = pipeline(
     "text-generation",

     AutoModelForCausalLM,
     TextIteratorStreamer,
     pipeline,
+    AutoConfig,
 )
 from threading import Thread
 model_name_or_path = "TheBloke/phi-2-GPTQ"
 # To use a different branch, change revision
 # For example: revision="gptq-4bit-32g-actorder_True"
+config = AutoConfig.from_pretrained(model_name_or_path)
+config.quantization_config["disable_exllama"] = True
 model = AutoModelForCausalLM.from_pretrained(model_name_or_path,
                                              device_map="cpu",
                                              trust_remote_code=True,
+                                             revision="main",
+                                             config=config)
 tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, use_fast=True)
 # Text generation pipeline
 phi2 = pipeline(
     "text-generation",