Spaces:

zetavg
/

LLaMA-LoRA-Tuner-UI-Demo

Runtime error

zetavg commited on Apr 8, 2023

Commit

49b832f

•

1 Parent(s): d047590

cache loaded_base_model_with_lora

Files changed (2) hide show

llama_lora/globals.py CHANGED Viewed

@@ -27,6 +27,8 @@ class Global:
     # Model related
     model_has_been_used = False
     # GPU Info
     gpu_cc = None  # GPU compute capability

     # Model related
     model_has_been_used = False
+    loaded_base_model_with_lora = None
+    loaded_base_model_with_lora_name = None
     # GPU Info
     gpu_cc = None  # GPU compute capability

llama_lora/models.py CHANGED Viewed

@@ -34,6 +34,9 @@ def get_base_model():
 def get_model_with_lora(lora_weights: str = "tloen/alpaca-lora-7b"):
     Global.model_has_been_used = True
     if device == "cuda":
         model = PeftModel.from_pretrained(
             get_base_model(),
@@ -65,6 +68,9 @@ def get_model_with_lora(lora_weights: str = "tloen/alpaca-lora-7b"):
     model.eval()
     if torch.__version__ >= "2" and sys.platform != "win32":
         model = torch.compile(model)
     return model
@@ -121,6 +127,11 @@ def unload_models():
     del Global.loaded_tokenizer
     Global.loaded_tokenizer = None
     clear_cache()
     Global.model_has_been_used = False

 def get_model_with_lora(lora_weights: str = "tloen/alpaca-lora-7b"):
     Global.model_has_been_used = True
+    if Global.loaded_base_model_with_lora and Global.loaded_base_model_with_lora_name == lora_weights:
+        return Global.loaded_base_model_with_lora
     if device == "cuda":
         model = PeftModel.from_pretrained(
             get_base_model(),
     model.eval()
     if torch.__version__ >= "2" and sys.platform != "win32":
         model = torch.compile(model)
+    Global.loaded_base_model_with_lora = model
+    Global.loaded_base_model_with_lora_name = lora_weights
     return model
     del Global.loaded_tokenizer
     Global.loaded_tokenizer = None
+    del Global.loaded_base_model_with_lora
+    Global.loaded_base_model_with_lora = None
+    Global.loaded_base_model_with_lora_name = None
     clear_cache()
     Global.model_has_been_used = False