Spaces:

ibm-granite
/

granite-guardian-3.1-8b

Running on Zero

Martín Santillán Cooper commited on Oct 7

Commit

93e42f8

•

1 Parent(s): 6617373

fix: send to device

Files changed (1) hide show

model.py CHANGED Viewed

@@ -1,8 +1,6 @@
-import logging.handlers
 import torch
 from torch.nn.functional import softmax
 from transformers import AutoTokenizer, AutoModelForCausalLM, AutoModel
-import jinja2
 import os
 from time import time
 from logger import logger
@@ -27,7 +25,7 @@ def generate_text(prompt):
         add_generation_prompt=True,
         return_tensors="pt")#.to(device)
     if use_conda:
-        tokenized_chat.to(device)
     with torch.no_grad():
         logits = model(tokenized_chat).logits
         gen_outputs = model.generate(tokenized_chat, max_new_tokens=128)

 import torch
 from torch.nn.functional import softmax
 from transformers import AutoTokenizer, AutoModelForCausalLM, AutoModel
 import os
 from time import time
 from logger import logger
         add_generation_prompt=True,
         return_tensors="pt")#.to(device)
     if use_conda:
+        tokenized_chat = tokenized_chat.to(device)
     with torch.no_grad():
         logits = model(tokenized_chat).logits
         gen_outputs = model.generate(tokenized_chat, max_new_tokens=128)