QDrantRAG9

Sleeping

dinhquangson commited on Jun 27

Commit

5979d39

•

1 Parent(s): ea5868d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -284,27 +284,29 @@ async def convert_upload_file(file: UploadFile = File(...)):
     images = convert_from_path(file_savePath)
     text=""
     # Extract text from images
     for image in images:
         ocr_text = pytesseract.image_to_string(image,lang='vie')
         text=text+ocr_text+'\n'
     client = OctoAI()
     completion = client.text_gen.create_chat_completion(
-        model="mixtral-8x22b-finetuned",
         messages=[
             ChatMessage(role="system", content="You are a helpful assistant."),
-            ChatMessage(role="user", content=text),
         ],
-        max_tokens=65536,
         presence_penalty=0,
         temperature=0.1,
         top_p=0.9,
         response_format=ChatCompletionResponseFormat(
             type="json_object",
-            max_tokens=65536,
             schema=Law.model_json_schema(),
         ),
     )

     images = convert_from_path(file_savePath)
     text=""
+    first_page = ""
     # Extract text from images
     for image in images:
         ocr_text = pytesseract.image_to_string(image,lang='vie')
+        if first_page=="":
+            first_page = ocr_text
         text=text+ocr_text+'\n'
     client = OctoAI()
     completion = client.text_gen.create_chat_completion(
+        model="meta-llama-3-8b-instruct",
         messages=[
             ChatMessage(role="system", content="You are a helpful assistant."),
+            ChatMessage(role="user", content=first_page),
         ],
+        max_tokens=8192,
         presence_penalty=0,
         temperature=0.1,
         top_p=0.9,
         response_format=ChatCompletionResponseFormat(
             type="json_object",
             schema=Law.model_json_schema(),
         ),
     )