Vector_db_v3 / app.py
ShynBui's picture
Update app.py
c51362a verified
raw
history blame
5.05 kB
# -*- coding: utf-8 -*-
import gradio as gr
import os
from langchain.retrievers import EnsembleRetriever
from utils import *
import requests
from pyvi import ViTokenizer, ViPosTagger
import time
from transformers import AutoTokenizer, AutoModelForQuestionAnswering
import torch
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain.chains import create_history_aware_retriever, create_retrieval_chain
from langchain_community.chat_message_histories import ChatMessageHistory
retriever = load_the_embedding_retrieve(is_ready=False, k=10)
bm25_retriever = load_the_bm25_retrieve(k=1)
ensemble_retriever = EnsembleRetriever(
retrievers=[bm25_retriever, retriever], weights=[0.1, 0.9]
)
parent_document_retrieve = load_the_parent_document_retrieve()
# tokenizer = AutoTokenizer.from_pretrained("ShynBui/vie_qa", token=os.environ.get("HF_TOKEN"))
# model = AutoModelForQuestionAnswering.from_pretrained("ShynBui/vie_qa", token=os.environ.get("HF_TOKEN"))
llm = ChatOpenAI(model="gpt-3.5-turbo-0125", temperature=1,openai_api_key=os.environ["OPENAI_API_KEY"])
llm_long = ChatOpenAI(model="gpt-3.5-turbo-0125", temperature=1,max_tokens=1024, openai_api_key=os.environ["OPENAI_API_KEY"])
def greet3(quote, history):
# print(history)
#check quote
if quote[-1] != '?':
quote += '?'
demo_ephemeral_chat_history = ChatMessageHistory()
if history == '':
history = [("Bạn có thể giải thích về quy chế và quyền của sinh viên tại trường này không?",
'''Quy chế và quyền của sinh viên tại trường Đại học Mở TP.HCM được quy định rõ trong các điều khoản sau:
1. Hiệu trưởng Trường có quyền ra quyết định thành lập và quy định cụ thể về chức năng, nhiệm vụ, tổ chức và hoạt động của Hội đồng khen thưởng và kỷ luật sinh viên.
2. Sinh viên có quyền khiếu nại về khen thưởng, kỷ luật. Khi có vi phạm kỷ luật, sinh viên có quyền được phân tích và đề nghị hình thức kỷ luật thông qua việc họp với các tổ chức sinh viên và gửi biên bản họp đến phòng Công tác sinh viên để trình Hội đồng.
3. Sinh viên có quyền đề đạt nguyện vọng và khiếu nại lên Hiệu trưởng Trường để giải quyết các vấn đề có liên quan đến quyền, lợi ích chính đáng của sinh viên.
4. Sinh viên được hỗ trợ giới thiệu nhà trọ theo quy định của trường.
Các chủ đề liên quan mà bạn có thể muốn tìm hiểu thêm:
- Quy chế và quyền của sinh viên tại các trường đại học khác.
- Hệ thống hỗ trợ sinh viên tại trường Đại học Mở TP.HCM.
- Quy trình khiếu nại và giải quyết tranh chấp sinh viên tại trường Đại học Mở TP.HCM.
'''),
("Chào.",
"Chào. Chúng ta vừa bắt đầu câu chuyện thôi.")]
for user, assistant in history[-1:]:
demo_ephemeral_chat_history.add_user_message(user)
demo_ephemeral_chat_history.add_ai_message(assistant)
else:
for user, assistant in eval(history)[-1:]:
demo_ephemeral_chat_history.add_user_message(user)
demo_ephemeral_chat_history.add_ai_message(assistant)
# Summary the message
chat_history = summarize_messages(demo_ephemeral_chat_history=demo_ephemeral_chat_history, llm=llm).messages
print("Chat history:", chat_history)
# Get the new question
new_question = get_question_from_summarize(chat_history[0].content, quote, llm)
# Retrieve
documents_query = ensemble_retriever.invoke(new_question)
documents_query2 = ensemble_retriever.invoke(quote)
parent_documents_query = parent_document_retrieve.invoke(new_question)
parent_documents_query2 = parent_document_retrieve.invoke(quote)
# print(documents_query)
list_of_query = [documents_query, documents_query2, parent_documents_query, parent_documents_query2]
list_context = []
for i in list_of_query:
for j in i:
list_context.append(j.page_content)
list_context = set(list_context)
context = '\n'.join(list_context)
print(context)
# Get answer
answer = get_final_answer(question=new_question + ' ' + quote, context=context,
prompt=os.environ['PROMPT'], llm=llm_long)
return new_question + ' ' + quote, answer
if __name__ == "__main__":
quote = "Địa chỉ nhà trường?"
iface = gr.Interface(fn=greet3, inputs=["text", "text"], outputs=["text", "text"])
iface.launch(share=True)
#Những cái đã làm tốt hơn những gì - Đóng góp gì
# 1. Dataset - Xu lý
# 2. Tăng ngữ cảnh
# 3. Tăng khả năng truy vết
# 4.