Spaces:

schroneko
/

meta-llama-Llama-Guard-3-8B-INT8

Running

schroneko commited on Dec 16, 2024

Commit

e369c4b

verified ·

1 Parent(s): 3c1404f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,7 +9,6 @@ if not huggingface_token:
     raise ValueError("HUGGINGFACE_TOKEN environment variable is not set")
 model_id = "meta-llama/Llama-Guard-3-8B-INT8"
-device = "cuda" if torch.cuda.is_available() else "cpu"
 dtype = torch.bfloat16
 quantization_config = BitsAndBytesConfig(load_in_8bit=True)
@@ -38,6 +37,7 @@ def parse_llama_guard_output(result):
 @spaces.GPU
 def moderate(user_input, assistant_response):
     tokenizer = AutoTokenizer.from_pretrained(model_id, token=huggingface_token)
     model = AutoModelForCausalLM.from_pretrained(
         model_id,

     raise ValueError("HUGGINGFACE_TOKEN environment variable is not set")
 model_id = "meta-llama/Llama-Guard-3-8B-INT8"
 dtype = torch.bfloat16
 quantization_config = BitsAndBytesConfig(load_in_8bit=True)
 @spaces.GPU
 def moderate(user_input, assistant_response):
+    device = "cuda" if torch.cuda.is_available() else "cpu"
     tokenizer = AutoTokenizer.from_pretrained(model_id, token=huggingface_token)
     model = AutoModelForCausalLM.from_pretrained(
         model_id,