RAGOndevice

Running on Zero

App Files Files Community

RAGOndevice / app.py

cutechicken

Update app.py

0de5bb6 verified about 1 month ago

raw

history blame

8.95 kB

	import torch
	import gradio as gr
	import spaces
	from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
	import os
	from threading import Thread
	import random
	from datasets import load_dataset
	import numpy as np
	from sklearn.feature_extraction.text import TfidfVectorizer

	# GPU 메모리 관리
	torch.cuda.empty_cache()

	HF_TOKEN = os.environ.get("HF_TOKEN", None)
	MODEL_ID = "CohereForAI/c4ai-command-r7b-12-2024"
	MODELS = os.environ.get("MODELS")
	MODEL_NAME = MODEL_ID.split("/")[-1]

	# 모델과 토크나이저 로드
	model = AutoModelForCausalLM.from_pretrained(
	MODEL_ID,
	torch_dtype=torch.bfloat16,
	device_map="auto",
	)
	tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)

	# 위키피디아 데이터셋 로드
	wiki_dataset = load_dataset("lcw99/wikipedia-korean-20240501-1million-qna")
	print("Wikipedia dataset loaded:", wiki_dataset)

	# TF-IDF 벡터라이저 초기화 및 학습
	print("TF-IDF 벡터화 시작...")
	questions = wiki_dataset['train']['question'][:10000] # 처음 10000개만 사용
	vectorizer = TfidfVectorizer(max_features=1000)
	question_vectors = vectorizer.fit_transform(questions)
	print("TF-IDF 벡터화 완료")

	def find_relevant_context(query, top_k=3):
	# 쿼리 벡터화
	query_vector = vectorizer.transform([query])

	# 코사인 유사도 계산
	similarities = (query_vector * question_vectors.T).toarray()[0]

	# 가장 유사한 질문들의 인덱스
	top_indices = np.argsort(similarities)[-top_k:][::-1]

	# 관련 컨텍스트 추출
	relevant_contexts = []
	for idx in top_indices:
	if similarities[idx] > 0: # 유사도가 0보다 큰 경우만 포함
	relevant_contexts.append({
	'question': questions[idx],
	'answer': wiki_dataset['train']['answer'][idx],
	'similarity': similarities[idx]
	})

	return relevant_contexts

	@spaces.GPU
	def stream_chat(message: str, history: list, temperature: float, max_new_tokens: int, top_p: float, top_k: int, penalty: float):
	print(f'message is - {message}')
	print(f'history is - {history}')

	# 관련 컨텍스트 찾기
	relevant_contexts = find_relevant_context(message)
	context_prompt = "\n\n관련 참고 정보:\n"
	for ctx in relevant_contexts:
	context_prompt += f"Q: {ctx['question']}\nA: {ctx['answer']}\n유사도: {ctx['similarity']:.3f}\n\n"

	# 대화 히스토리 구성
	conversation = []
	for prompt, answer in history:
	conversation.extend([
	{"role": "user", "content": prompt},
	{"role": "assistant", "content": answer}
	])


	# 컨텍스트를 포함한 최종 프롬프트 구성
	final_message = context_prompt + "\n현재 질문: " + message
	conversation.append({"role": "user", "content": final_message})

	input_ids = tokenizer.apply_chat_template(conversation, tokenize=False, add_generation_prompt=True)
	inputs = tokenizer(input_ids, return_tensors="pt").to(0)


	streamer = TextIteratorStreamer(tokenizer, timeout=10., skip_prompt=True, skip_special_tokens=True)

	generate_kwargs = dict(
	inputs,
	streamer=streamer,
	top_k=top_k,
	top_p=top_p,
	repetition_penalty=penalty,
	max_new_tokens=max_new_tokens,
	do_sample=True,
	temperature=temperature,
	eos_token_id=[255001],
	)

	thread = Thread(target=model.generate, kwargs=generate_kwargs)
	thread.start()

	buffer = ""
	for new_text in streamer:
	buffer += new_text
	yield buffer

	chatbot = gr.Chatbot(height=500)

	CSS = """
	/* 전체 페이지 스타일링 */
	body {
	background: linear-gradient(135deg, #f5f7fa 0%, #c3cfe2 100%);
	min-height: 100vh;
	font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif;
	}
	/* 메인 컨테이너 */
	.container {
	max-width: 1200px;
	margin: 0 auto;
	padding: 2rem;
	background: rgba(255, 255, 255, 0.95);
	border-radius: 20px;
	box-shadow: 0 20px 40px rgba(0, 0, 0, 0.1);
	backdrop-filter: blur(10px);
	transform: perspective(1000px) translateZ(0);
	transition: all 0.3s ease;
	}
	/* 제목 스타일링 */
	h1 {
	color: #2d3436;
	font-size: 2.5rem;
	text-align: center;
	margin-bottom: 2rem;
	text-shadow: 2px 2px 4px rgba(0, 0, 0, 0.1);
	transform: perspective(1000px) translateZ(20px);
	}
	h3 {
	text-align: center;
	color: #2d3436;
	font-size: 1.5rem;
	margin: 1rem 0;
	}
	/* 채팅박스 스타일링 */
	.chatbox {
	background: white;
	border-radius: 15px;
	box-shadow: 0 8px 32px rgba(31, 38, 135, 0.15);
	backdrop-filter: blur(4px);
	border: 1px solid rgba(255, 255, 255, 0.18);
	padding: 1rem;
	margin: 1rem 0;
	transform: translateZ(0);
	transition: all 0.3s ease;
	}
	/* 메시지 스타일링 */
	.chatbox .messages .message.user {
	background: linear-gradient(145deg, #e1f5fe, #bbdefb);
	border-radius: 15px;
	padding: 1rem;
	margin: 0.5rem;
	box-shadow: 5px 5px 15px rgba(0, 0, 0, 0.05);
	transform: translateZ(10px);
	animation: messageIn 0.3s ease-out;
	}
	.chatbox .messages .message.bot {
	background: linear-gradient(145deg, #f5f5f5, #eeeeee);
	border-radius: 15px;
	padding: 1rem;
	margin: 0.5rem;
	box-shadow: 5px 5px 15px rgba(0, 0, 0, 0.05);
	transform: translateZ(10px);
	animation: messageIn 0.3s ease-out;
	}
	/* 버튼 스타일링 */
	.duplicate-button {
	background: linear-gradient(145deg, #24292e, #1a1e22) !important;
	color: white !important;
	border-radius: 100vh !important;
	padding: 0.8rem 1.5rem !important;
	box-shadow: 3px 3px 10px rgba(0, 0, 0, 0.2) !important;
	transition: all 0.3s ease !important;
	border: none !important;
	cursor: pointer !important;
	}
	.duplicate-button:hover {
	transform: translateY(-2px) !important;
	box-shadow: 0 5px 15px rgba(0, 0, 0, 0.3) !important;
	}
	/* 입력 필드 스타일링 */
	"""

	with gr.Blocks(css=CSS) as demo:
	gr.ChatInterface(
	fn=stream_chat,
	chatbot=chatbot,
	fill_height=True,
	theme="soft",
	additional_inputs_accordion=gr.Accordion(label="⚙️ 옵션", open=False, render=False),
	additional_inputs=[
	gr.Slider(
	minimum=0,
	maximum=1,
	step=0.1,
	value=0.8,
	label="온도",
	render=False,
	),
	gr.Slider(
	minimum=128,
	maximum=8000,
	step=1,
	value=4000,
	label="최대 토큰 수",
	render=False,
	),
	gr.Slider(
	minimum=0.0,
	maximum=1.0,
	step=0.1,
	value=0.8,
	label="상위 확률",
	render=False,
	),
	gr.Slider(
	minimum=1,
	maximum=20,
	step=1,
	value=20,
	label="상위 K",
	render=False,
	),
	gr.Slider(
	minimum=0.0,
	maximum=2.0,
	step=0.1,
	value=1.0,
	label="반복 패널티",
	render=False,
	),
	],
	examples=[
	["한국의 전통 절기와 24절기에 대해 자세히 설명해주세요."],
	["우리나라 전통 음식 중 건강에 좋은 발효음식 5가지를 추천하고 그 효능을 설명해주세요."],
	["한국의 대표적인 산들을 소개하고, 각 산의 특징과 등산 코스를 추천해주세요."],
	["사물놀이의 악기 구성과 장단에 대해 초보자도 이해하기 쉽게 설명해주세요."],
	["한국의 전통 건축물에 담긴 과학적 원리를 현대적 관점에서 분석해주세요."],
	["조선시대 과거 시험 제도를 현대의 입시 제도와 비교하여 설명해주세요."],
	["한국의 4대 궁궐을 비교하여 각각의 특징과 역사적 의미를 설명해주세요."],
	["한국의 전통 놀이를 현대적으로 재해석하여 실내에서 할 수 있는 방법을 제안해주세요."],
	["한글 창제 과정과 훈민정음의 과학적 원리를 상세히 설명해주세요."],
	["한국의 전통 차 문화에 대해 설명하고, 계절별로 어울리는 전통차를 추천해주세요."],
	["한국의 전통 의복인 한복의 구조와 특징을 과학적, 미학적 관점에서 분석해주세요."],
	["한국의 전통 가옥 구조를 기후와 환경 관점에서 분석하고, 현대 건축에 적용할 수 있는 요소를 제안해주세요."]
	],
	cache_examples=False,
	)

	if __name__ == "__main__":
	demo.launch()