fietje-2b

Running on Zero

BramVanroy commited on Apr 30

Commit

c3793fb

•

1 Parent(s): 8626fb3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -18,7 +18,6 @@ MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "8192"))
 model_id = "BramVanroy/fietje-2b-chat"
 avatar_url = "https://huggingface.co/spaces/BramVanroy/fietje-2b/resolve/main/img/fietje-2b-avatar.png"
 model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto", load_in_8bit=True)
-model = model.to("cuda" if torch.cuda.is_available() else "cpu")
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 tokenizer.pad_token_id = tokenizer.eos_token_id

 model_id = "BramVanroy/fietje-2b-chat"
 avatar_url = "https://huggingface.co/spaces/BramVanroy/fietje-2b/resolve/main/img/fietje-2b-avatar.png"
 model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto", load_in_8bit=True)
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 tokenizer.pad_token_id = tokenizer.eos_token_id