daqc commited on
Commit
c848ca2
·
verified ·
1 Parent(s): 2ff27d0

Upload app.py

Browse files
Files changed (1) hide show
  1. app.py +144 -0
app.py ADDED
@@ -0,0 +1,144 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import gradio as gr
2
+
3
+ # !python -c "import torch; assert torch.cuda.get_device_capability()[0] >= 8, 'Hardware not supported for Flash Attention'"
4
+ import json
5
+ import torch
6
+ from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig, GemmaTokenizer, StoppingCriteria, StoppingCriteriaList, GenerationConfig
7
+ # from google.colab import userdata
8
+ import os
9
+
10
+ model_id = "somosnlp/kuntur-peru-legal-es-gemma-2b-it-merged"
11
+ bnb_config = BitsAndBytesConfig(
12
+ load_in_4bit=True,
13
+ bnb_4bit_quant_type="nf4",
14
+ bnb_4bit_compute_dtype=torch.bfloat16
15
+ )
16
+ max_seq_length=512
17
+
18
+ # if torch.cuda.get_device_capability()[0] >= 8:
19
+ # # print("Flash Attention")
20
+ # attn_implementation="flash_attention_2"
21
+ # else:
22
+ # attn_implementation=None
23
+ attn_implementation=None
24
+
25
+ tokenizer = AutoTokenizer.from_pretrained(model_id,
26
+ max_length = max_seq_length)
27
+ model = AutoModelForCausalLM.from_pretrained(model_id,
28
+ # quantization_config=bnb_config,
29
+ device_map = {"":0},
30
+ attn_implementation = attn_implementation, # A100 o H100
31
+ ).eval()
32
+
33
+
34
+
35
+ class ListOfTokensStoppingCriteria(StoppingCriteria):
36
+ """
37
+ Clase para definir un criterio de parada basado en una lista de tokens específicos.
38
+ """
39
+ def __init__(self, tokenizer, stop_tokens):
40
+ self.tokenizer = tokenizer
41
+ # Codifica cada token de parada y guarda sus IDs en una lista
42
+ self.stop_token_ids_list = [tokenizer.encode(stop_token, add_special_tokens=False) for stop_token in stop_tokens]
43
+
44
+ def __call__(self, input_ids, scores, **kwargs):
45
+ # Verifica si los últimos tokens generados coinciden con alguno de los conjuntos de tokens de parada
46
+ for stop_token_ids in self.stop_token_ids_list:
47
+ len_stop_tokens = len(stop_token_ids)
48
+ if len(input_ids[0]) >= len_stop_tokens:
49
+ if input_ids[0, -len_stop_tokens:].tolist() == stop_token_ids:
50
+ return True
51
+ return False
52
+
53
+ # Uso del criterio de parada personalizado
54
+ stop_tokens = ["end_of_turn"] # Lista de tokens de parada
55
+
56
+ # Inicializa tu criterio de parada con el tokenizer y la lista de tokens de parada
57
+ stopping_criteria = ListOfTokensStoppingCriteria(tokenizer, stop_tokens)
58
+
59
+ # Añade tu criterio de parada a una StoppingCriteriaList
60
+ stopping_criteria_list = StoppingCriteriaList([stopping_criteria])
61
+
62
+ def generate_text(prompt, max_length=2048):
63
+ # prompt="""What were the main contributions of Eratosthenes to the development of mathematics in ancient Greece?"""
64
+ prompt=prompt.replace("\n", "").replace("¿","").replace("?","")
65
+
66
+
67
+ #EXAMPLE
68
+ input_text = f'''<start_of_turn>system
69
+ You are a helpful AI assistant. You only answer in JSON format.
70
+ Eres un agente experto en la constitución política del perú de 1993 que solo responde formato JSON:
71
+ {{
72
+ "respuesta": "La defensa de la persona humana y el respeto de su dignidad son el fin supremo de la sociedad y del Estado.",
73
+ "fuente": "Constitución Política del Perú 1993 - Capitulo 1, Artículo 1;",
74
+ "tema": "Violencia contra la niñez; Desigualdad y violencia hacia las mujeres; Seguridad ciudadana"
75
+ }}
76
+ Respondes nada mas que en formato JSON y respeta las instrucciones para las siguientes claves, IMPORTANTE NO CREAR SUBCLAVES, toda la respuesta debe ir dentro de la clave 'respuesta':
77
+ 1. respuesta: Solo en esta seccion se detallara toda, TODA, TODA la respuesta, esto incluye la resolución del problema propuesto o la solucion a situaciones de vulneración de derechos.
78
+ 2. fuente: La fuente debe ser siempre 'Constitución Política del Perú 1993', variando únicamente el número de artículo y capítulo. Solamente debes basarte en los articulos de la Constitucion Politica del Peru de 1993, puedes usar otro texto juridico solo en casos extremos, en este caso se debera separar los textos juridicos con sus respectivos capitulos y articulos con punto y coma.
79
+ 3. tema: Solo escoge los temas de la lista proporcionada, no inventes ni crees un nuevo tema, en caso de considerarse mas de 2 temas se separa con punto y coma, escoge solo los que se adecuen a la respuesta, no consideres todos los temas al mismo tiempo: Educación, Conflictos sociales, Prevención de la corrupción, Servicios públicos, Violencia contra la niñez, Desigualdad y violencia hacia las mujeres, Seguridad ciudadana, Discapacidad o Salud.
80
+ UNICAMENTE DEBES RESPONDER EN FORMATO JSON, SOLO EN JSON, JSON, JSON
81
+ <end_of_turn>
82
+ <start_of_turn>user
83
+ ¿{prompt}?<end_of_turn>\n<start_of_turn>model\n'''
84
+
85
+ inputs = tokenizer.encode(input_text,
86
+ return_tensors="pt",
87
+ add_special_tokens=False).to("cuda:0")
88
+ max_new_tokens=max_length
89
+ generation_config = GenerationConfig(
90
+ max_new_tokens=max_new_tokens,
91
+ temperature=0.15,
92
+ top_p=0.75, #0.9,
93
+ top_k=40, # 45
94
+ num_beams=2, #me
95
+ repetition_penalty=1., #1.1
96
+ do_sample=True,
97
+ )
98
+ outputs = model.generate(generation_config=generation_config,
99
+ input_ids=inputs,
100
+ stopping_criteria=stopping_criteria_list,)
101
+ return tokenizer.decode(outputs[0], skip_special_tokens=False) #True
102
+
103
+
104
+
105
+ def mostrar_respuesta(pregunta):
106
+ json_obj={}
107
+ json_obj['respuesta']='Esperando'
108
+ json_obj['fuente']='Esperando'
109
+ json_obj['tema']='Esperando'
110
+ if pregunta!="":
111
+ try:
112
+ res= generate_text(pregunta, max_length=512)
113
+ # print(">> RES:",res)
114
+ inicio_json = res.find('{')
115
+ fin_json = res.rfind('}') + 1
116
+ json_str = res[inicio_json:fin_json]
117
+ json_obj = json.loads(json_str)
118
+ # print("json_obj:",json_obj)
119
+ return json_obj["respuesta"], json_obj["fuente"], json_obj["tema"]
120
+ except:
121
+ return json_obj["respuesta"], json_obj["fuente"], json_obj["tema"]
122
+ return json_obj["respuesta"], json_obj["fuente"], json_obj["tema"]
123
+
124
+ # Ejemplos de preguntas
125
+ ejemplos = [
126
+ ["Una persona ha sido despedida de su trabajo injustamente y necesita entender cuáles son sus derechos laborales según la Constitución Política del Perú."],
127
+ ["¿Que establece el articulo 2 de la Constitucion Politica del Peru respecto a los derechos humanos?"],
128
+ ["¿Que articulo de la Constitucion Politica del Peru establece que toda persona tiene derecho a la vida, a su identidad, a su integridad moral, psíquica y física y a su libre desarrollo y bienestar?"],
129
+ ]
130
+
131
+ iface = gr.Interface(
132
+ fn=mostrar_respuesta,
133
+ inputs=gr.Textbox(label="Pregunta"),
134
+ outputs=[
135
+ gr.Textbox(label="Respuesta", lines=2),
136
+ gr.Textbox(label="Fuente", lines=1),
137
+ gr.Textbox(label="Tema", lines=1)
138
+ ],
139
+ title="Consulta Juridica basada en la Constitucion Politica del Peru",
140
+ description="Introduce tu pregunta sobre la Constitución Politica o una situación donde creas que tus derechos hayan sido vulnerados.",
141
+ examples=ejemplos,
142
+ )
143
+
144
+ iface.queue(max_size=14).launch(debug=True) # share=True,debug=True