Spaces:

alexkueck
/

LIRAG

Paused

alexkueck commited on Nov 27, 2023

Commit

8de518d

•

1 Parent(s): 956c5d3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -65,14 +65,12 @@ YOUTUBE_DIR = "/youtube"
 ###############################################
 #URLs zu Dokumenten oder andere Inhalte, die einbezogen werden sollen
-#PDF_URL       = "https://arxiv.org/pdf/2303.08774.pdf"
 WEB_URL       = "https://openai.com/research/gpt-4"
 YOUTUBE_URL_1 = "https://www.youtube.com/watch?v=--khbXchTeE"
 YOUTUBE_URL_2 = "https://www.youtube.com/watch?v=hdhZwyf24mE"
 #YOUTUBE_URL_3 = "https://www.youtube.com/watch?v=vw-KWfKwvTQ"
-#URL zu PDF dokumenten, die online verfügbar sind...
-PDF_URL = "..."
 ################################################
@@ -142,11 +140,11 @@ def document_loading_splitting():
     #andere loader...
     # Load PDF
-    #loader = PyPDFLoader(PDF_URL1)
-    #docs.extend(loader.load())
     # Load Web
-    #loader = WebBaseLoader(WEB_URL)
-    #docs.extend(loader.load())
     # Load YouTube
     #loader = GenericLoader(YoutubeAudioLoader([YOUTUBE_URL_1,YOUTUBE_URL_2], PATH_WORK + YOUTUBE_DIR), OpenAIWhisperParser())
     #docs.extend(loader.load())

 ###############################################
 #URLs zu Dokumenten oder andere Inhalte, die einbezogen werden sollen
+PDF_URL       = "https://arxiv.org/pdf/2303.08774.pdf"
 WEB_URL       = "https://openai.com/research/gpt-4"
 YOUTUBE_URL_1 = "https://www.youtube.com/watch?v=--khbXchTeE"
 YOUTUBE_URL_2 = "https://www.youtube.com/watch?v=hdhZwyf24mE"
 #YOUTUBE_URL_3 = "https://www.youtube.com/watch?v=vw-KWfKwvTQ"
 ################################################
     #andere loader...
     # Load PDF
+    loader = PyPDFLoader(PDF_URL1)
+    docs.extend(loader.load())
     # Load Web
+    loader = WebBaseLoader(WEB_URL)
+    docs.extend(loader.load())
     # Load YouTube
     #loader = GenericLoader(YoutubeAudioLoader([YOUTUBE_URL_1,YOUTUBE_URL_2], PATH_WORK + YOUTUBE_DIR), OpenAIWhisperParser())
     #docs.extend(loader.load())