Spaces:

raannakasturi
/

ReXploreIDFetchingAPI

Running

raannakasturi commited on Jan 4

Commit

8a1664b

verified ·

1 Parent(s): a88fd16

Update arvix.py

Files changed (1) hide show

arvix.py CHANGED Viewed

@@ -50,7 +50,7 @@ def extract_data(category):
         if not utils.check_data_in_file(paper_id, 'arxiv.txt'):
             utils.write_data_to_file(paper_id, 'arxiv.txt')
             all_ids.add(paper_id)
-        if len(all_ids) >= 4:
             break
     return list(all_ids)
@@ -86,11 +86,11 @@ def extract_arxiv_data():
                 if paper_id not in used_ids:
                     category_ids.add(paper_id)
                     used_ids.add(paper_id)
-                if len(category_ids) == 4:
                     break
-            if len(category_ids) == 4:
                 break
-        while len(category_ids) < 4:
             category_ids.add(random.choice(list(used_ids)))
         data[category] = {"ids": list(category_ids), "count": len(category_ids)}
     if not utils.upload_datafile('arxiv.txt'):

         if not utils.check_data_in_file(paper_id, 'arxiv.txt'):
             utils.write_data_to_file(paper_id, 'arxiv.txt')
             all_ids.add(paper_id)
+        if len(all_ids) >= 2:
             break
     return list(all_ids)
                 if paper_id not in used_ids:
                     category_ids.add(paper_id)
                     used_ids.add(paper_id)
+                if len(category_ids) == 2:
                     break
+            if len(category_ids) == 2:
                 break
+        while len(category_ids) < 2:
             category_ids.add(random.choice(list(used_ids)))
         data[category] = {"ids": list(category_ids), "count": len(category_ids)}
     if not utils.upload_datafile('arxiv.txt'):