Spaces:

raghuv-aditya
/

Course-Finder-AI-Large

Sleeping

raghuv-aditya commited on Nov 10, 2024

Commit

11eb809

verified ·

1 Parent(s): d683b77

Update scraper.py

Files changed (1) hide show

scraper.py CHANGED Viewed

@@ -64,14 +64,19 @@ def scrape_courses_json(base_url, num_pages=5):
     data = []
     for page_num in range(1, num_pages + 1):
         page_url = f"{base_url}{page_num}"
         course_links = get_course_links(page_url)
         for link in course_links:
             try:
                 course_data = parse_course_page(link)
                 data.append(course_data)
                 time.sleep(1)  # Be courteous to the server
             except Exception as e:
                 print(f"Failed to scrape {link}: {e}")
     return data

     data = []
     for page_num in range(1, num_pages + 1):
         page_url = f"{base_url}{page_num}"
+        print(f"Scraping page {page_num}: {page_url}")
         course_links = get_course_links(page_url)
+        print(f"Found {len(course_links)} courses on page {page_num}")
         for link in course_links:
             try:
+                print(f"Scraping course: {link}")
                 course_data = parse_course_page(link)
                 data.append(course_data)
                 time.sleep(1)  # Be courteous to the server
             except Exception as e:
                 print(f"Failed to scrape {link}: {e}")
+    print("Scraping completed.")
     return data