Spaces:

jordyvl
/

ask_my_thesis

Paused

jordyvl commited on Apr 19

Commit

31eef4a

•

1 Parent(s): d4e3df1

not starting

Files changed (2) hide show

README.md CHANGED Viewed

@@ -10,7 +10,10 @@ pinned: false
 preload_from_hub:
   - "BAAI/bge-small-en-v1.5"
   - "HuggingFaceH4/zephyr-7b-alpha"
-  - "microsoft/phi-2"
 ---
   - "meta-llama/Meta-Llama-3-8B"

 preload_from_hub:
   - "BAAI/bge-small-en-v1.5"
   - "HuggingFaceH4/zephyr-7b-alpha"
 ---
+  - "microsoft/phi-2"
   - "meta-llama/Meta-Llama-3-8B"
+Follow-up with langchain: https://medium.com/pythoneers/offline-rag-with-llamaindex-and-tiny-and-small-llms-ab2acac936b0
+https://github.com/jeremy-k3/notebooks/blob/main/RAG_with_LlamaIndex_tiny_small_LLMS.ipynb
+https://www.kaggle.com/code/iamleonie/advanced-rag-with-gemma-weaviate-and-llamaindex#Step-6:-Explore-a-Naive-RAG-Query-Engine

app.py CHANGED Viewed

@@ -20,9 +20,10 @@ CHEAPMODE = torch.cuda.is_available()
 # LLM = "HuggingFaceH4/zephyr-7b-alpha" if not CHEAPMODE else "microsoft/phi-2"
 config = {
-    "LLM": "meta-llama/Meta-Llama-3-8B",
     # "LLM": "microsoft/phi-2",
-    # "LLM": "HuggingFaceH4/zephyr-7b-alpha",
     "embeddings": "BAAI/bge-small-en-v1.5",
     "similarity_top_k": 2,
     "context_window": 2048,

 # LLM = "HuggingFaceH4/zephyr-7b-alpha" if not CHEAPMODE else "microsoft/phi-2"
 config = {
+    # "LLM": "meta-llama/Meta-Llama-3-8B",
+    # "LLM": "google/gemma-2b",
     # "LLM": "microsoft/phi-2",
+    "LLM": "HuggingFaceH4/zephyr-7b-alpha",
     "embeddings": "BAAI/bge-small-en-v1.5",
     "similarity_top_k": 2,
     "context_window": 2048,