blade-inspection-demo / setup_qwen_vision.md
Kesheratmex
**Add GPT‑4 Vision support with detailed prompt and fallback**
199293f

A newer version of the Gradio SDK is available: 5.49.1

Upgrade

Configuración de Qwen2-VL para Análisis de Imágenes

🎯 Qwen2-VL: Modelo de Visión Gratuito

Qwen2-VL es un modelo de visión gratuito y potente que puede analizar imágenes directamente. Es una excelente alternativa a GPT-4 Vision.

📋 Configuración Rápida

1. Obtener Token de Hugging Face (GRATIS)

  1. Ve a huggingface.co
  2. Crea una cuenta gratuita
  3. Ve a Settings → Access Tokens
  4. Crea un nuevo token con permisos de lectura
  5. Copia el token

2. Configurar Variables de Entorno

# Windows (PowerShell)
$env:HUGGINGFACE_API_TOKEN = "hf_tu_token_aqui"
$env:VISION_MODEL_ID = "Qwen/Qwen2-VL-7B-Instruct"
$env:HF_USE_ROUTER = "true"

# Linux/Mac
export HUGGINGFACE_API_TOKEN="hf_tu_token_aqui"
export VISION_MODEL_ID="Qwen/Qwen2-VL-7B-Instruct"
export HF_USE_ROUTER="true"

3. Modelos Disponibles

Qwen2-VL (Recomendado):

  • Qwen/Qwen2-VL-7B-Instruct - Modelo principal
  • Qwen/Qwen2-VL-2B-Instruct - Versión más ligera

Otros modelos de visión gratuitos:

  • microsoft/kosmos-2-patch14-224
  • Salesforce/blip2-opt-2.7b
  • llava-hf/llava-1.5-7b-hf

🚀 Uso

Una vez configurado, la aplicación automáticamente:

  1. Detectará que tienes Hugging Face configurado
  2. Usará Qwen2-VL para análisis visual directo
  3. Proporcionará análisis detallado en español

🔍 Capacidades de Qwen2-VL

  • ✅ Análisis visual directo de imágenes
  • ✅ Detección de defectos y anomalías
  • ✅ Descripción detallada de superficies
  • ✅ Comparación con detecciones YOLO
  • ✅ Recomendaciones de mantenimiento
  • ✅ Respuestas en español

🛠️ Solución de Problemas

Error: "Model loading"

# Espera unos minutos, el modelo se está cargando por primera vez
# Los modelos de HF pueden tardar en "despertar"

Error: "Token inválido"

# Verifica que el token sea correcto
echo $HUGGINGFACE_API_TOKEN

Usar modelo alternativo

# Si Qwen2-VL no funciona, prueba:
$env:VISION_MODEL_ID = "llava-hf/llava-1.5-7b-hf"

📊 Comparación

Modelo Costo Calidad Velocidad Configuración
GPT-4 Vision 💰 Pago 🌟🌟🌟🌟🌟 🚀🚀🚀 Fácil
Qwen2-VL 🆓 Gratis 🌟🌟🌟🌟 🚀🚀 Fácil
Análisis técnico 🆓 Gratis 🌟🌟 🚀🚀🚀 Automático

🎯 Resultado Esperado

Con Qwen2-VL configurado, obtendrás análisis como:

## 🔍 Análisis Visual Directo de la Pala

**Estado General:** Bueno con mantenimiento menor requerido

**Observaciones Específicas:**
- Superficie: Color gris uniforme, acabado mate normal
- Borde de ataque: Erosión leve visible en zona superior
- Suciedad: Dos áreas de acumulación claramente visibles

**Defectos Identificados Visualmente:**
- Dirt/suciedad: Confirmado en 2 ubicaciones
- Erosión menor en borde de ataque
- Decoloración UV leve

**Recomendaciones:**
- Limpieza programada (prioridad media)
- Inspección de erosión (seguimiento)

¡Qwen2-VL te dará análisis visual real y gratuito! 🎉