Spaces:
Sleeping
Sleeping
A newer version of the Gradio SDK is available:
5.49.1
Configuración de Qwen2-VL para Análisis de Imágenes
🎯 Qwen2-VL: Modelo de Visión Gratuito
Qwen2-VL es un modelo de visión gratuito y potente que puede analizar imágenes directamente. Es una excelente alternativa a GPT-4 Vision.
📋 Configuración Rápida
1. Obtener Token de Hugging Face (GRATIS)
- Ve a huggingface.co
- Crea una cuenta gratuita
- Ve a Settings → Access Tokens
- Crea un nuevo token con permisos de lectura
- Copia el token
2. Configurar Variables de Entorno
# Windows (PowerShell)
$env:HUGGINGFACE_API_TOKEN = "hf_tu_token_aqui"
$env:VISION_MODEL_ID = "Qwen/Qwen2-VL-7B-Instruct"
$env:HF_USE_ROUTER = "true"
# Linux/Mac
export HUGGINGFACE_API_TOKEN="hf_tu_token_aqui"
export VISION_MODEL_ID="Qwen/Qwen2-VL-7B-Instruct"
export HF_USE_ROUTER="true"
3. Modelos Disponibles
Qwen2-VL (Recomendado):
Qwen/Qwen2-VL-7B-Instruct
- Modelo principalQwen/Qwen2-VL-2B-Instruct
- Versión más ligera
Otros modelos de visión gratuitos:
microsoft/kosmos-2-patch14-224
Salesforce/blip2-opt-2.7b
llava-hf/llava-1.5-7b-hf
🚀 Uso
Una vez configurado, la aplicación automáticamente:
- Detectará que tienes Hugging Face configurado
- Usará Qwen2-VL para análisis visual directo
- Proporcionará análisis detallado en español
🔍 Capacidades de Qwen2-VL
- ✅ Análisis visual directo de imágenes
- ✅ Detección de defectos y anomalías
- ✅ Descripción detallada de superficies
- ✅ Comparación con detecciones YOLO
- ✅ Recomendaciones de mantenimiento
- ✅ Respuestas en español
🛠️ Solución de Problemas
Error: "Model loading"
# Espera unos minutos, el modelo se está cargando por primera vez
# Los modelos de HF pueden tardar en "despertar"
Error: "Token inválido"
# Verifica que el token sea correcto
echo $HUGGINGFACE_API_TOKEN
Usar modelo alternativo
# Si Qwen2-VL no funciona, prueba:
$env:VISION_MODEL_ID = "llava-hf/llava-1.5-7b-hf"
📊 Comparación
Modelo | Costo | Calidad | Velocidad | Configuración |
---|---|---|---|---|
GPT-4 Vision | 💰 Pago | 🌟🌟🌟🌟🌟 | 🚀🚀🚀 | Fácil |
Qwen2-VL | 🆓 Gratis | 🌟🌟🌟🌟 | 🚀🚀 | Fácil |
Análisis técnico | 🆓 Gratis | 🌟🌟 | 🚀🚀🚀 | Automático |
🎯 Resultado Esperado
Con Qwen2-VL configurado, obtendrás análisis como:
## 🔍 Análisis Visual Directo de la Pala
**Estado General:** Bueno con mantenimiento menor requerido
**Observaciones Específicas:**
- Superficie: Color gris uniforme, acabado mate normal
- Borde de ataque: Erosión leve visible en zona superior
- Suciedad: Dos áreas de acumulación claramente visibles
**Defectos Identificados Visualmente:**
- Dirt/suciedad: Confirmado en 2 ubicaciones
- Erosión menor en borde de ataque
- Decoloración UV leve
**Recomendaciones:**
- Limpieza programada (prioridad media)
- Inspección de erosión (seguimiento)
¡Qwen2-VL te dará análisis visual real y gratuito! 🎉