Spaces:

jordyvl
/

ask_my_thesis

Paused

jordyvl commited on Apr 18

Commit

0b94be0

•

1 Parent(s): 1af211c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -14,6 +14,9 @@ from PIL import Image
 import gradio as gr
 def messages_to_prompt(messages):
     prompt = ""
@@ -50,8 +53,8 @@ def load_RAG_pipeline():
         )
     llm = HuggingFaceLLM(
-        model_name="HuggingFaceH4/zephyr-7b-alpha",
-        tokenizer_name="HuggingFaceH4/zephyr-7b-alpha",
         query_wrapper_prompt=PromptTemplate("<|system|>\n</s>\n<|user|>\n{query_str}</s>\n<|assistant|>\n"),
         context_window=3900,
         max_new_tokens=256,

 import gradio as gr
+CHEAPMODE=True
+LLM = "HuggingFaceH4/zephyr-7b-alpha" if not CHEAPMODE else "microsoft/phi-2"
 def messages_to_prompt(messages):
     prompt = ""
         )
     llm = HuggingFaceLLM(
+        model_name=LLM,
+        tokenizer_name=LLM,
         query_wrapper_prompt=PromptTemplate("<|system|>\n</s>\n<|user|>\n{query_str}</s>\n<|assistant|>\n"),
         context_window=3900,
         max_new_tokens=256,