Spaces:

ShishuTripathi
/

Preferred-Term-Extraction

Runtime error

ShishuTripathi commited on Aug 19, 2023

Commit

5808e38

•

1 Parent(s): c4d3822

Update app.py

Added bits & bites config

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,10 +2,16 @@ import torch
 import gradio as gr
 from peft import PeftModel, PeftConfig
-from transformers import AutoModelForCausalLM, AutoTokenizer ,pipeline
 config = PeftConfig.from_pretrained("ShishuTripathi/entity_coder")
-model = AutoModelForCausalLM.from_pretrained("ybelkada/falcon-7b-sharded-bf16", trust_remote_code=True)
 model = PeftModel.from_pretrained(model, "ShishuTripathi/entity_coder")
 tokenizer = AutoTokenizer.from_pretrained("ShishuTripathi/entity_coder")
 generator = pipeline('text-generation' , model = model, tokenizer =tokenizer, max_length = 50)

 import gradio as gr
 from peft import PeftModel, PeftConfig
+from transformers import AutoModelForCausalLM, AutoTokenizer ,pipeline, BitsAndBytesConfig
+bnb_config = BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_quant_type="nf4",
+    bnb_4bit_compute_dtype=torch.float16,
+)
 config = PeftConfig.from_pretrained("ShishuTripathi/entity_coder")
+model = AutoModelForCausalLM.from_pretrained("ybelkada/falcon-7b-sharded-bf16", quantization_config=bnb_config,trust_remote_code=True)
 model = PeftModel.from_pretrained(model, "ShishuTripathi/entity_coder")
 tokenizer = AutoTokenizer.from_pretrained("ShishuTripathi/entity_coder")
 generator = pipeline('text-generation' , model = model, tokenizer =tokenizer, max_length = 50)