ibm-granite
/

granite-3.0-3b-a800m-base

Text Generation

Model card Files Files and versions Community

fix device

#1

by ariG23498 HF staff - opened Oct 15

base: refs/heads/main

←

from: refs/pr/1

Discussion Files changed

Files changed (1) hide show

README.md +3 -5

README.md CHANGED Viewed

@@ -239,19 +239,17 @@ Then, copy the code snippet below to run the example.
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
-device = "auto"
 model_path = "ibm-granite/granite-3.0-3b-a800m-base"
 tokenizer = AutoTokenizer.from_pretrained(model_path)
 # drop device_map if running on CPU
-model = AutoModelForCausalLM.from_pretrained(model_path, device_map=device)
 model.eval()
 # change input text as desired
 input_text = "Where is the MIT-IBM Watson AI Lab located?"
 # tokenize the text
-input_tokens = tokenizer(input_text, return_tensors="pt").to(device)
 # generate output tokens
-output = model.generate(**input_tokens,
-                        max_length=4000)
 # decode output tokens into text
 output = tokenizer.batch_decode(output)
 # print output

 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer
 model_path = "ibm-granite/granite-3.0-3b-a800m-base"
 tokenizer = AutoTokenizer.from_pretrained(model_path)
 # drop device_map if running on CPU
+model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto")
 model.eval()
 # change input text as desired
 input_text = "Where is the MIT-IBM Watson AI Lab located?"
 # tokenize the text
+input_tokens = tokenizer(input_text, return_tensors="pt").to(model.device)
 # generate output tokens
+output = model.generate(**input_tokens, max_length=4000)
 # decode output tokens into text
 output = tokenizer.batch_decode(output)
 # print output