File size: 2,340 Bytes
39c03f5
ceecf58
39c03f5
ceecf58
 
a80dff9
ceecf58
 
a80dff9
 
 
 
 
ceecf58
 
 
 
 
 
 
 
 
65c48b4
ceecf58
 
 
 
 
 
 
 
 
 
39c03f5
2fbf4d8
ceecf58
 
 
2fbf4d8
 
ceecf58
2fbf4d8
ceecf58
 
 
2fbf4d8
a80dff9
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
import gradio as gr
from transformers import AutoTokenizer, AutoModelForSequenceClassification, TextClassificationPipeline

title = "Clasificador de Tesis"

description = "Clasifica el texto de una tesis con la carrera a la que le pertenece."

article = """
    ## Obtenci贸n de los datos
        En un principio no se contaba con ning煤n dataset disponible, por lo que se opt贸 realizar un scraper para conseguir la informaci贸n. Se decidi贸 usar la base de datos [TESIUNAM](https://tesiunam.dgb.unam.mx/F?func=find-b-0&local_base=TES01), el cual es un cat谩logo en donde se pueden visualizar las tesis de los sustentantes que obtuvieron un grado en la Universidad Nacional Aut贸noma de M茅xico (UNAM), as铆 como de las tesis de licenciatura de escuelas incorporadas a ella.



    ## Miembros del Equipo:
        - Isaac Isa铆as L贸pez L贸pez ([MajorIsaiah](https://huggingface.co/MajorIsaiah))
        - Dionis L贸pez Ramos ([inoid](https://huggingface.co/inoid))
        - Yisel Clavel Quintero ([clavel](https://huggingface.co/clavel))
        - Ximena Yeraldin L贸pez L贸pez ([Ximyer](https://huggingface.co/Ximyer))
"""

tokenizer = AutoTokenizer.from_pretrained('hiiamsid/BETO_es_binary_classification', use_fast=False)
model = AutoModelForSequenceClassification.from_pretrained(
    'hackathon-pln-es/unam_tesis_BETO_finnetuning', num_labels=5, output_attentions=False, output_hidden_states=False)
pipe = TextClassificationPipeline(model=model, tokenizer=tokenizer, return_all_scores=True)
 
classificationResult = pipe("El objetivo de esta tesis es elaborar un estudio de las condiciones asociadas al aprendizaje desde casa.")


def thesis_prediction(input):
    pass
    

examples = ["Introducci贸n al an谩lisis de riesgos competitivos bajo el enfoque de la funci贸n de incidencia acumulada (FIA) y su aplicaci贸n con R", "Los promedios de calificaciones y clasificar por grupo o asignatura se realizaron a trav茅s de tablas din谩micas en Excel"]

if __name__ == "__main__":
    gr.Interface(
        fn=thesis_prediction,
        inputs=gr.inputs.Textbox(
            lines=2,
            placeholder="Ingrese de favor el t铆tulo de la tesis o un fragmento de esta.",
        ),
        outputs=["text"],
        title=title,
        description=description,
        article=article,
        examples=[examples],
    ).launch()