Edit model card

Uploaded model

  • Developed by: Agnuxo
  • Developed by: Agnuxo
  • License: apache-2.0
  • Finetuned from model : unsloth/qwen2.5-7b-bnb-4bit

This qwen2 model was trained 2x faster with Unsloth and Huggingface's TRL library.

Lector y Debatidor de Documentos 📚🗣️

Este modelo es parte de un sistema de lectura y debate de documentos que utiliza dos modelos de lenguaje para generar explicaciones y simular debates sobre el contenido de documentos PDF y TXT.

Descripción del Modelo

El sistema utiliza dos modelos principales:

  1. Agente-GPT (Profesor): Agnuxo/Agente-GPT-Qwen-2.5-7B-Spanish_16bit

    • Basado en Qwen 2.5 7B, adaptado para español
    • Función: Explicar documentos y generar preguntas para el debate
  2. Agente-Llama (Periodista): Agnuxo/Agente-Llama-3.1-Spanish_16bit

    • Basado en Llama 3.1, adaptado para español
    • Función: Responder preguntas y participar en el debate con un estilo periodístico

Uso Previsto

Este modelo está diseñado para:

  • Analizar y explicar documentos en español
  • Generar debates simulados sobre el contenido de los documentos
  • Proporcionar una experiencia interactiva de aprendizaje y discusión

Limitaciones y Sesgos

  • Los modelos están optimizados para el idioma español y pueden tener un rendimiento limitado en otros idiomas.
  • La calidad del debate depende de la calidad y relevancia del documento de entrada.
  • Pueden existir sesgos inherentes a los datos de entrenamiento utilizados.

Consideraciones Éticas

  • El sistema no debe utilizarse para generar o propagar información falsa o engañosa.
  • Los usuarios deben ser conscientes de que las respuestas son generadas por IA y pueden requerir verificación humana.

Métricas de Evaluación

  • Perplexidad: [Valor]
  • Precisión en tareas de comprensión de lectura: [Valor]

Entrenamiento

Los modelos fueron fine-tuned utilizando el dataset Agnuxo/Spanish-Debate-Dataset, que contiene:

  • Transcripciones de debates en español
  • Artículos periodísticos y académicos
  • Resúmenes de documentos en diversos campos

Explicación-Debate-PDF-VOZ

Programa en local para subir documentos PDF o TXT en cualquier idioma, con Opción de consuta, explicación y Debate sobre el documento entre dos LLM GPT y Llama, con salida de voz en Español.

🖥️ Interfaz de Usuario

La interfaz gráfica incluye:

  • 💬 Área de chat para mostrar el debate
  • 🎛️ Controles de velocidad de voz
  • 🔢 Ajustes de límite de tokens
  • 📂 Botón para cargar documentos
  • ▶️ Botones para iniciar explicación o debate

🧠 Modelos de IA

El programa utiliza dos modelos de lenguaje:

  • 🧑‍🏫 Profesor-GPT: Basado en "GPT"
  • 👩‍🎤 Periodista LLAMA: Basado en "Meta-Llama-3.1-8B"

🎙️ Síntesis de Voz

Se utilizan dos modelos de TTS:

  • 🇪🇸 Modelo español para el Profesor-GPT
  • 🇦🇷 Modelo con acento argentino para la Periodista LLAMA

📝 Notas Adicionales

  • El programa convierte números y fórmulas a texto para mejorar la síntesis de voz.
  • Se incluyen controles para ajustar la velocidad de reproducción de voz.
  • La interfaz permite una fácil navegación y control del proceso de lectura y debate.

Desarrollado por [Francisco Angulo de Lafuente]

📚 Lector y Debatidor de Documentos

Banner

🌟 Características Principales

  • 📖 Lectura de documentos PDF y TXT
  • 🗣️ Explicación del contenido en español
  • 🎭 Debate simulado entre dos IA
  • 🔊 Síntesis de voz para las respuestas
  • 🖥️ Interfaz gráfica moderna y fácil de usar

🛠️ Tecnologías Utilizadas

  • Python
  • PyQt5 para la interfaz gráfica
  • Transformers para modelos de lenguaje
  • TTS para síntesis de voz
  • PyPDF2 para lectura de PDFs

🚀 Cómo Funciona

El programa ofrece una experiencia interactiva de lectura y debate de documentos:

1️⃣ Carga de Documentos: Sube fácilmente archivos PDF o TXT.

2️⃣ Explicación del Contenido: Una IA explica el documento de forma clara y concisa.

3️⃣ Debate Simulado: Dos IA, un "Profesor-GPT" y una "Periodista LLAMA", debaten sobre el contenido.

4️⃣ Síntesis de Voz: Las respuestas se convierten en audio para una experiencia más inmersiva.

5️⃣ Interacción del Usuario: Participa en el debate añadiendo tus propios comentarios o preguntas.

Citación

Si utilizas este modelo en tu investigación, por favor cita:

Downloads last month
32
GGUF
Model size
3.4B params
Architecture
qwen2

8-bit

Inference API
Unable to determine this model’s pipeline type. Check the docs .

Dataset used to train Agnuxo/Agente-GPT-Qwen2.5-3B-Instruct-Spanish_8bit