Spaces:

KhangPTT373
/

KhangPTT373pdf_qa

Runtime error

App Files Files Community

KhangPTT373 commited on Nov 15, 2024

Commit

683c41b

verified ·

1 Parent(s): 5c0bbda

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +44 -0
.gitignore +3 -0
README.MD +38 -0
README.md +3 -9
__pycache__/config.cpython-311.pyc +0 -0
__pycache__/utils.cpython-311.pyc +0 -0
bge_model_ctranslate2/config.json +7 -0
bge_model_ctranslate2/model.bin +3 -0
bge_model_ctranslate2/vocabulary.json +0 -0
chroma_service.py +89 -0
data/data/301f209e-0482-4481-b8d1-f7e72292463f/data_level0.bin +3 -0
data/data/301f209e-0482-4481-b8d1-f7e72292463f/header.bin +3 -0
data/data/301f209e-0482-4481-b8d1-f7e72292463f/index_metadata.pickle +3 -0
data/data/301f209e-0482-4481-b8d1-f7e72292463f/length.bin +3 -0
data/data/301f209e-0482-4481-b8d1-f7e72292463f/link_lists.bin +3 -0
data/data/35323312-d0b8-43cb-8e9e-d36d78781612/data_level0.bin +3 -0
data/data/35323312-d0b8-43cb-8e9e-d36d78781612/header.bin +3 -0
data/data/35323312-d0b8-43cb-8e9e-d36d78781612/index_metadata.pickle +3 -0
data/data/35323312-d0b8-43cb-8e9e-d36d78781612/length.bin +3 -0
data/data/35323312-d0b8-43cb-8e9e-d36d78781612/link_lists.bin +3 -0
data/data/6083e0ad-9de1-41aa-99b2-96721b0c344d/data_level0.bin +3 -0
data/data/6083e0ad-9de1-41aa-99b2-96721b0c344d/header.bin +3 -0
data/data/6083e0ad-9de1-41aa-99b2-96721b0c344d/index_metadata.pickle +3 -0
data/data/6083e0ad-9de1-41aa-99b2-96721b0c344d/length.bin +3 -0
data/data/6083e0ad-9de1-41aa-99b2-96721b0c344d/link_lists.bin +3 -0
data/data/6216d5be-f9de-43b9-b3b1-d131ad3f5560/data_level0.bin +3 -0
data/data/6216d5be-f9de-43b9-b3b1-d131ad3f5560/header.bin +3 -0
data/data/6216d5be-f9de-43b9-b3b1-d131ad3f5560/length.bin +3 -0
data/data/6216d5be-f9de-43b9-b3b1-d131ad3f5560/link_lists.bin +0 -0
data/data/chroma.sqlite3 +3 -0
data/data/d7b3a1db-45de-4619-8ec9-81f7ee57d558/data_level0.bin +3 -0
data/data/d7b3a1db-45de-4619-8ec9-81f7ee57d558/header.bin +3 -0
data/data/d7b3a1db-45de-4619-8ec9-81f7ee57d558/index_metadata.pickle +3 -0
data/data/d7b3a1db-45de-4619-8ec9-81f7ee57d558/length.bin +3 -0
data/data/d7b3a1db-45de-4619-8ec9-81f7ee57d558/link_lists.bin +3 -0
gradio_demo.py +114 -0
logs/__pycache__/logger_config.cpython-311.pyc +0 -0
logs/chat_inference.log +0 -0
logs/chroma.log +0 -0
logs/encoder_inference.log +0 -0
logs/init_profile.log +0 -0
logs/logger_config.py +34 -0
logs/offline_flow.log +0 -0
logs/system.log +3 -0
pdf/15_9_F1_F1A_F1B_EOWR_directional_drilling_MWD_Mudlogging.pdf +3 -0
pdf/A Stratigraphic Reconstruction of Bulk Volatile Chemistry from Fluid Inclusions_FI090048b-1.pdf +3 -0
pdf/BIOSTRAT_REPORT_1.pdf +0 -0
pdf/BIOSTRAT_REPORT_2.pdf +3 -0
pdf/DRILLING_REPORT_1.pdf +3 -0
pdf/FWR_completion.pdf +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,47 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+data/data/chroma.sqlite3 filter=lfs diff=lfs merge=lfs -text
+logs/system.log filter=lfs diff=lfs merge=lfs -text
+pdf/15_9_F1_F1A_F1B_EOWR_directional_drilling_MWD_Mudlogging.pdf filter=lfs diff=lfs merge=lfs -text
+pdf/A[[:space:]]Stratigraphic[[:space:]]Reconstruction[[:space:]]of[[:space:]]Bulk[[:space:]]Volatile[[:space:]]Chemistry[[:space:]]from[[:space:]]Fluid[[:space:]]Inclusions_FI090048b-1.pdf filter=lfs diff=lfs merge=lfs -text
+pdf/BIOSTRAT_REPORT_2.pdf filter=lfs diff=lfs merge=lfs -text
+pdf/DRILLING_REPORT_1.pdf filter=lfs diff=lfs merge=lfs -text
+pdf/FWR_completion.pdf filter=lfs diff=lfs merge=lfs -text
+pdf/MWD_REPORT_2.pdf filter=lfs diff=lfs merge=lfs -text
+pdf/PETROPHYSICAL_REPORT_1[[:space:]](3).pdf filter=lfs diff=lfs merge=lfs -text
+pdf/PETROPHYSICAL_REPORT_1.pdf filter=lfs diff=lfs merge=lfs -text
+pdf/PETROPHYSICAL_REPORT_4.pdf filter=lfs diff=lfs merge=lfs -text
+pdf/RXT10010NS_Statoil_Volve_Seismic_QC_Report_v03.pdf filter=lfs diff=lfs merge=lfs -text
+pdf/Rock[[:space:]]Mechanical[[:space:]]Testing[[:space:]]Triaxial[[:space:]]tests[[:space:]]on[[:space:]]sandstone[[:space:]]Well[[:space:]]15-9-19[[:space:]]A.pdf filter=lfs diff=lfs merge=lfs -text
+pdf/Well[[:space:]]Test[[:space:]]Report_nr-20.pdf filter=lfs diff=lfs merge=lfs -text
+pictures/RXT10010NS_Statoil_Volve_Seismic_QC_Report_v03/pictures_page_066.png filter=lfs diff=lfs merge=lfs -text
+pictures/RXT10010NS_Statoil_Volve_Seismic_QC_Report_v03/pictures_page_071.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_006.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_008.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_015.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_018.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_025.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_026.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_030.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_031.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_032.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_033.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_034.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_035.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_040.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_042.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_043.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_045.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_046.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_047.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_048.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_049.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_051.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_052.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_055.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_064.png filter=lfs diff=lfs merge=lfs -text
+pictures/Well[[:space:]]Test[[:space:]]Report_nr-20/pictures_page_068.png filter=lfs diff=lfs merge=lfs -text
+tables/Well[[:space:]]Test[[:space:]]Report_nr-20/tables_page_077.png filter=lfs diff=lfs merge=lfs -text
+tables/Well[[:space:]]Test[[:space:]]Report_nr-20/tables_page_088.png filter=lfs diff=lfs merge=lfs -text
+tables/Well[[:space:]]Test[[:space:]]Report_nr-20/tables_page_089.png filter=lfs diff=lfs merge=lfs -text

.gitignore ADDED Viewed

	@@ -0,0 +1,3 @@

+venv
+pdf_parsing_service.py
+config.py

README.MD ADDED Viewed

	@@ -0,0 +1,38 @@

+# Folder structure
+```
+ORAL_PDF_QA/
+├── __pycache__/
+├── bge_model_ctranslate2/
+├── data/
+├── parsed/
+├── logs/
+├── pdf/
+├── pictures/
+├── tables/
+├── venv/
+├── .gitignore
+├── chroma_service.py
+├── config.py
+├── gradio_demo.py
+├── pdf_parsing_service.py
+├── questions.txt
+├── README.MD
+├── requirements.txt
+└── utils.py
+```
+# Download
+```
+pip install -r requirements.txt
+```
+Download `bge_model_ctranslate2` embedding model<br>
+Download `parsed` folder at https://drive.google.com/drive/folders/174I-pX1f7_mGG28Wwd9JPOgnOS5O16BA?usp=sharing<br>
+Download `tables` folder (extracted tables) from https://drive.google.com/drive/folders/12r0F_Ce25kecUSzp_HvjHjhrV6LbyYyx?usp=sharing<br>
+Download `pictures` folder (extracted pictures) from https://drive.google.com/drive/folders/1EvTLNNrBvQr-_lIzZSRL8ayrevKTmtJK?usp=sharing<br>
+# Usage
+```
+python chroma_service.py
+```
+```
+pyrhon gradio_demo.py
+```

README.md CHANGED Viewed

@@ -1,12 +1,6 @@
 ---
-title: KhangPTT373pdf Qa
-emoji: 💻
-colorFrom: purple
-colorTo: blue
 sdk: gradio
-sdk_version: 5.5.0
-app_file: app.py
-pinned: false
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: KhangPTT373pdf_qa
+app_file: gradio_demo.py
 sdk: gradio
+sdk_version: 4.44.1
 ---

__pycache__/config.cpython-311.pyc ADDED Viewed

Binary file (3.29 kB). View file

__pycache__/utils.cpython-311.pyc ADDED Viewed

Binary file (10.9 kB). View file

bge_model_ctranslate2/config.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "bos_token": "<s>",
+  "eos_token": "</s>",
+  "layer_norm_epsilon": 1e-12,
+  "multi_query_attention": false,
+  "unk_token": "[UNK]"
+}

bge_model_ctranslate2/model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:65735518664364784cdd7cb919e054777253fe7a7c76924f0a20ef539e5adac8
+size 437937363

bge_model_ctranslate2/vocabulary.json ADDED Viewed

The diff for this file is too large to render. See raw diff

chroma_service.py ADDED Viewed

	@@ -0,0 +1,89 @@

+import ctranslate2
+from transformers import AutoTokenizer
+import torch
+import numpy as np
+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+import os
+import argparse
+import time
+model_name = "BAAI/bge-base-en-v1.5"
+model_save_path = "bge_model_ctranslate2"
+# model_path = "bge_model_ctranslate2_base"
+device = "cpu"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+if device == "cuda":
+    translator = ctranslate2.Encoder(
+        model_save_path, device=device, compute_type="float16"
+    )  # or "cuda" for GPU
+else:
+    translator = ctranslate2.Encoder(model_save_path, device=device)
+def generate_embeddings(text):
+    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)
+    input_ids = inputs["input_ids"].tolist()[0]
+    output = translator.forward_batch([input_ids])
+    pooler_output = output.pooler_output
+    if device == "cuda":
+        embeddings = (
+            torch.as_tensor(pooler_output, device=device).detach().cpu().tolist()[0]
+        )
+    else:
+        pooler_output = np.array(pooler_output)
+        embeddings = torch.as_tensor(pooler_output, device=device).detach().tolist()[0]
+    return embeddings
+app = FastAPI()
+class EmbeddingRequest(BaseModel):
+    input: str
+    model: str
+class EmbeddingResponse(BaseModel):
+    object: str = "list"
+    data: list
+    model: str
+    usage: dict
+@app.post("/v1/embeddings", response_model=EmbeddingResponse)
+async def embeddings(request: EmbeddingRequest):
+    input_text = request.input
+    if not input_text:
+        raise HTTPException(status_code=400, detail="No input text provided")
+    # Generate embeddings
+    embeddings = generate_embeddings(input_text)
+    # Construct the response in OpenAI format
+    response = {
+        "object": "list",
+        "data": [{"object": "embedding", "embedding": embeddings, "index": 0}],
+        "model": request.model,
+        "usage": {
+            "prompt_tokens": len(input_text.split()),
+            "total_tokens": len(input_text.split()),
+        },
+    }
+    return response
+@app.get("/ping")
+async def ping():
+    return {"status": "pong"}
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--port", type=int, default=5001)
+    args = parser.parse_args()
+    import uvicorn
+    uvicorn.run(app, host="0.0.0.0", port=args.port)

data/data/301f209e-0482-4481-b8d1-f7e72292463f/data_level0.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:26817d41f4fd0210de3aeaba692bcfd3787a3124105ea7113200931776d30dd5
+size 6424000

data/data/301f209e-0482-4481-b8d1-f7e72292463f/header.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4dbb8ddc12ddf7fc70d7be8c485e0491a87e2adf54fa9e493e6770a9954bc6dc
+size 100

data/data/301f209e-0482-4481-b8d1-f7e72292463f/index_metadata.pickle ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b2f3900b00f3593016e97e0c793302cdfb9e13bd94aaaeff039584b4c7f1fd0
+size 122222

data/data/301f209e-0482-4481-b8d1-f7e72292463f/length.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7f0f5ce310175e722a727cc950d4773f53e6ab072f4ce1ea08dc7aa69836db27
+size 8000

data/data/301f209e-0482-4481-b8d1-f7e72292463f/link_lists.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1d50fda141c21845865f5aeb5b07c4ca527224d3a1d1fcba07ce4393423ae560
+size 16976

data/data/35323312-d0b8-43cb-8e9e-d36d78781612/data_level0.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:519ea8e24bfcbd36dfd739d83f3ee09c345b4969bfffcb327c560af291a41d5f
+size 6424000

data/data/35323312-d0b8-43cb-8e9e-d36d78781612/header.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4dbb8ddc12ddf7fc70d7be8c485e0491a87e2adf54fa9e493e6770a9954bc6dc
+size 100

data/data/35323312-d0b8-43cb-8e9e-d36d78781612/index_metadata.pickle ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:868497c1c9d41f896adfade8c43754af78644b6de8480998e0e23f50475c2336
+size 122222

data/data/35323312-d0b8-43cb-8e9e-d36d78781612/length.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6d6605bc81d2a30f2b7eee27c0a3801bc4f8d6f5a7a76f611d6c22868c5e5834
+size 8000

data/data/35323312-d0b8-43cb-8e9e-d36d78781612/link_lists.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4f0b3a52596b1e577d95ca9bbf963fce9773ea21c6613c18311d0f6a062406cf
+size 16976

data/data/6083e0ad-9de1-41aa-99b2-96721b0c344d/data_level0.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c14b42bfd5993080f6b80bd122a7220ab962e51aa422c5d2e285561babaa18b
+size 9636000

data/data/6083e0ad-9de1-41aa-99b2-96721b0c344d/header.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ffb22cb3659faa58b51aec196bbec777d66e55abd3210e961a19a510b1b1dadd
+size 100

data/data/6083e0ad-9de1-41aa-99b2-96721b0c344d/index_metadata.pickle ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7aa573492580955ef74bf849395a08ee817986a6ec47219c18ff9bfbaf87c08a
+size 184237

data/data/6083e0ad-9de1-41aa-99b2-96721b0c344d/length.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:12e000f3d0061b967d71b98e3f88f45629235f908798763c35831e6c73f97c5c
+size 12000

data/data/6083e0ad-9de1-41aa-99b2-96721b0c344d/link_lists.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f84cdd076847d328913012544c9921839b0bb43b9cb2b9fafd48e8c5b8b31f9a
+size 25736

data/data/6216d5be-f9de-43b9-b3b1-d131ad3f5560/data_level0.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a13e72541800c513c73dccea69f79e39cf4baef4fa23f7e117c0d6b0f5f99670
+size 3212000

data/data/6216d5be-f9de-43b9-b3b1-d131ad3f5560/header.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0ec6df10978b056a10062ed99efeef2702fa4a1301fad702b53dd2517103c746
+size 100

data/data/6216d5be-f9de-43b9-b3b1-d131ad3f5560/length.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c5e608af7d28f2213eed5a595d14fe2577707e0b332c3a30c90e700a7e39f76a
+size 4000

data/data/6216d5be-f9de-43b9-b3b1-d131ad3f5560/link_lists.bin ADDED Viewed

File without changes

data/data/chroma.sqlite3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:294650f066c7050c555464def4c16c544d593f1d7a53f79d20d6956487dbd4df
+size 29925376

data/data/d7b3a1db-45de-4619-8ec9-81f7ee57d558/data_level0.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c9bab570b85b648a23d89c7ac0dcf49cbd61bb0be83e1af3219b0278a75a7fa3
+size 3212000

data/data/d7b3a1db-45de-4619-8ec9-81f7ee57d558/header.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a4c1a8a65a02d7e986335d4f10011318afe72d6bd448675a177bb916de977de8
+size 100

data/data/d7b3a1db-45de-4619-8ec9-81f7ee57d558/index_metadata.pickle ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b55fd3e4a7a1d550fcc51d468a0c5b07a504ab210af325db13917cd67b088544
+size 31576

data/data/d7b3a1db-45de-4619-8ec9-81f7ee57d558/length.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9762c629b316c3e412b4372b4cb95ebed3d0fc618e85f67ba691311fd48f893f
+size 4000

data/data/d7b3a1db-45de-4619-8ec9-81f7ee57d558/link_lists.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb1c2e6ee46100baebd0bba773d89ec3ef7b196fdeb4413e02f7fc0cab4357aa
+size 4888

gradio_demo.py ADDED Viewed

	@@ -0,0 +1,114 @@

+import time
+import gradio as gr
+import json
+import os
+from openai import OpenAI
+from gradio_multimodalchatbot import MultimodalChatbot
+from gradio.data_classes import FileData
+from config import settings
+from utils import query_pdfs
+def infer_chat(message):
+    model = settings.LLM_INFERENCE_MODEL
+    TOGETHER_API_KEY = settings.TOGETHER_API_KEY
+    client = OpenAI(
+        api_key=TOGETHER_API_KEY,
+        base_url='https://api.together.xyz/v1',
+    )
+    chat_response = client.chat.completions.create(
+        model=model,
+        messages=message,
+        top_p=0.2,
+        stream=False,
+    )
+    return chat_response.choices[0].message.content
+def paraphrase(message):
+    infer_message = [{
+        "role": "user",
+        "content": f"""
+            Simple paraphrase this message : `{message}`
+            Just return the paraphrased sentence, do not say anything else.
+        """
+    }]
+    response = infer_chat(infer_message)
+    return response
+def chat_response(message):
+    query_result = query_pdfs(message)
+    infer_message = [{
+        "role": "user",
+        "content": f"""
+            User will ask you the information relating to some pdf files.
+            This is their question: {message}
+            You are required to answer their question based on this relevant information which is queried from vector database according to the user's message. Extract the relevant info and answer to user. If the query result is table or picture,select the most appropriate table/picture provide path to the table. If the query give you different path, choose the first one.
+            This is the query result (information you rely on):
+            ```
+            {query_result}
+            ```
+            Your answer must be in this json format, dont reply anything else, like this:
+            {{
+                "text":"your response after concatenate all relative information to get the answer",
+                "files":"path_to_table or path_to_picture if you think a table or picture relate to user's question else you can leave this ''."
+            }}
+        """
+    }]
+    response = infer_chat(infer_message)
+    try:
+        json_loaded_response = json.loads(response)
+        print(json_loaded_response)
+    except:
+        print('JSON not properly generated')
+        print(response)
+    return json_loaded_response
+# # user_msg3 = {"text": "Give me a video clip please.",
+# #              "files": []}
+# # bot_msg3 = {"text": "Here is a video clip of the world",
+# #             "files": [{"file": FileData(path="table_Well Test Report_nr-20/table_page_004.png")},
+# #                     ]}
+# # conversation = [[user_msg3, bot_msg3]]
+# # with gr.Blocks() as demo:
+# #     MultimodalChatbot(value=conversation, height=800)
+# # demo.launch()
+def process_chat(message, history):
+    # Call your chat function
+    response = chat_response(message)
+    # Append the new message to history
+    history.append((message, response["text"]))
+    # Handle image display
+    image = None
+    if response["files"] and os.path.isfile(response["files"]):
+        try:
+            image = response["files"]
+        except Exception as e:
+            print(f"Error loading image: {e}")
+            image = None
+    return history, image
+if __name__ == "__main__":
+    with gr.Blocks() as demo:
+        chatbot = gr.Chatbot()
+        msg = gr.Textbox(label="Message")
+        image_output = gr.Image(label="Response Image")
+        msg.submit(
+            process_chat,
+            inputs=[msg, chatbot],
+            outputs=[chatbot, image_output],
+            queue=False
+        ).then(
+            lambda: "",
+            None,
+            msg
+        )
+        demo.launch(share=True)

logs/__pycache__/logger_config.cpython-311.pyc ADDED Viewed

Binary file (2 kB). View file

logs/chat_inference.log ADDED Viewed

File without changes

logs/chroma.log ADDED Viewed

File without changes

logs/encoder_inference.log ADDED Viewed

The diff for this file is too large to render. See raw diff

logs/init_profile.log ADDED Viewed

File without changes

logs/logger_config.py ADDED Viewed

	@@ -0,0 +1,34 @@

+from loguru import logger
+logger.add(
+    "logs/chat_inference.log",
+    filter=lambda record: record["extra"].get("logger_name") == "chat_inference",
+    level="INFO",
+)
+logger.add(
+    "logs/chroma.log",
+    filter=lambda record: record["extra"].get("logger_name") == "chroma",
+    level="INFO",
+)
+logger.add(
+    "logs/encoder_inference.log",
+    filter=lambda record: record["extra"].get("logger_name") == "encoder_inference",
+    level="INFO",
+)
+logger.add(
+    "logs/init_profile.log",
+    filter=lambda record: record["extra"].get("logger_name") == "init_profile",
+    level="INFO",
+)
+logger.add(
+    "logs/offline_flow.log",
+    filter=lambda record: record["extra"].get("logger_name") == "offline_flow",
+    level="INFO",
+)
+logger.add(
+    "logs/system.log",
+    filter=lambda record: record["extra"].get("logger_name") == "system",
+    level="INFO",
+)
+__all__ = ["logger"]

logs/offline_flow.log ADDED Viewed

File without changes

logs/system.log ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:22f01ee701dc64347cbb987bea1dc435514f6e841e2b8534421a898e2c965eda
+size 26008376

pdf/15_9_F1_F1A_F1B_EOWR_directional_drilling_MWD_Mudlogging.pdf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0fcc319424916d4e8b92dc638922a25ba8732570e1bc1803793328bd033a5130
+size 7041417

pdf/A Stratigraphic Reconstruction of Bulk Volatile Chemistry from Fluid Inclusions_FI090048b-1.pdf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2ee93d7cc9fbe16d6beed138d9714d57acffb4bed5a171ae7d2847f54c3e3ce7
+size 1467698

pdf/BIOSTRAT_REPORT_1.pdf ADDED Viewed

Binary file (974 kB). View file

pdf/BIOSTRAT_REPORT_2.pdf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:11d9163d4bad64581fbad705beff63169b6b1db12279eb1b29d761bc9c03a5b2
+size 1131578

pdf/DRILLING_REPORT_1.pdf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a7ae6dc9c060c355867cd4e9de2c647b735389e256f9a0b8c9e45cc1b7ab3ab1
+size 1279799

pdf/FWR_completion.pdf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f59ce77015fc54d2e0f9fcc54ceec3dc3184b9b701124e12339ba907d021e793
+size 1468326