THUDM
/

LongWriter-glm4-9b

Text Generation

feature-extraction

Model card Files Files and versions Community

bys0318 commited on Aug 17, 2024

Commit

6884326

·

verified ·

1 Parent(s): 6eff855

Modify to original glm-4-9b code

Files changed (1) hide show

README.md +2 -12

README.md CHANGED Viewed

@@ -28,20 +28,10 @@ tokenizer = AutoTokenizer.from_pretrained("THUDM/LongWriter-glm4-9b", trust_remo
 model = AutoModelForCausalLM.from_pretrained("THUDM/LongWriter-glm4-9b", torch_dtype=torch.bfloat16, trust_remote_code=True, device_map="auto")
 model = model.eval()
 query = "Write a 10000-word China travel guide"
-prompt = f"[INST]{query}[/INST]"
-input = tokenizer(prompt, truncation=False, return_tensors="pt").to(device)
-context_length = input.input_ids.shape[-1]
-output = model.generate(
-    **input,
-    max_new_tokens=32768,
-    num_beams=1,
-    do_sample=True,
-    temperature=0.5,
-)[0]
-response = tokenizer.decode(output[context_length:], skip_special_tokens=True)
 print(response)
 ```
-Environment: `transformers==4.43.0`
 License: [glm-4-9b License](https://huggingface.co/THUDM/glm-4-9b-chat/blob/main/LICENSE)

 model = AutoModelForCausalLM.from_pretrained("THUDM/LongWriter-glm4-9b", torch_dtype=torch.bfloat16, trust_remote_code=True, device_map="auto")
 model = model.eval()
 query = "Write a 10000-word China travel guide"
+response, history = model.chat(tokenizer, query, history=[], max_new_tokens=32768, temperature=0.5)
 print(response)
 ```
+Environment: Same environment requirement as [glm-4-9b-chat](https://huggingface.co/THUDM/glm-4-9b-chat) (`transforemrs>=4.44.0`).
 License: [glm-4-9b License](https://huggingface.co/THUDM/glm-4-9b-chat/blob/main/LICENSE)