Spaces:

Millakisan
/

UPE_TelegramTest

Runtime error

Millakisan commited on May 12, 2024

Commit

9c911bc

verified ·

1 Parent(s): c8e45e5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,7 +1,30 @@
-from transformers import pipeline
-import gradio as gr
-pipe = pipeline("translation", model="Helsinki-NLP/opus-mt-en-es")
-demo = gr.Interface.from_pipeline(pipe)
-demo.launch()

+#
+import logging
+from hf_olmo import OLMoForCausalLM, OLMoTokenizerFast
+# Enable logging
+logging.basicConfig(
+    format="%(asctime)s - %(name)s - %(lineno)s - %(funcName)s - %(levelname)s - %(message)s",
+    level=logging.INFO
+)
+# set higher logging level for httpx to avoid all GET and POST requests being logged
+logging.getLogger("httpx").setLevel(logging.WARNING)
+logger = logging.getLogger(__name__)
+MODEL = "allenai/OLMo-7B-Instruct"
+olmo = OLMoForCausalLM.from_pretrained(MODEL)
+tokenizer = OLMoTokenizerFast.from_pretrained(MODEL)
+chat = [
+    {"role": "user",
+     "content": "What is language modeling?"},
+]
+prompt = tokenizer.apply_chat_template(chat, tokenize=False, add_generation_prompt=True)
+inputs = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt")
+# optional verifying cuda
+# inputs = {k: v.to('cuda') for k,v in inputs.items()}
+# olmo = olmo.to('cuda')
+response = olmo.generate(input_ids=inputs.to(olmo.device), max_new_tokens=100, do_sample=True, top_k=50, top_p=0.95)
+print(tokenizer.batch_decode(response, skip_special_tokens=True)[0])