# Configuración de Qwen2-VL para Análisis de Imágenes ## 🎯 Qwen2-VL: Modelo de Visión Gratuito Qwen2-VL es un modelo de visión gratuito y potente que puede analizar imágenes directamente. Es una excelente alternativa a GPT-4 Vision. ## 📋 Configuración Rápida ### 1. Obtener Token de Hugging Face (GRATIS) 1. Ve a [huggingface.co](https://huggingface.co) 2. Crea una cuenta gratuita 3. Ve a Settings → Access Tokens 4. Crea un nuevo token con permisos de lectura 5. Copia el token ### 2. Configurar Variables de Entorno ```bash # Windows (PowerShell) $env:HUGGINGFACE_API_TOKEN = "hf_tu_token_aqui" $env:VISION_MODEL_ID = "Qwen/Qwen2-VL-7B-Instruct" $env:HF_USE_ROUTER = "true" # Linux/Mac export HUGGINGFACE_API_TOKEN="hf_tu_token_aqui" export VISION_MODEL_ID="Qwen/Qwen2-VL-7B-Instruct" export HF_USE_ROUTER="true" ``` ### 3. Modelos Disponibles **Qwen2-VL (Recomendado):** - `Qwen/Qwen2-VL-7B-Instruct` - Modelo principal - `Qwen/Qwen2-VL-2B-Instruct` - Versión más ligera **Otros modelos de visión gratuitos:** - `microsoft/kosmos-2-patch14-224` - `Salesforce/blip2-opt-2.7b` - `llava-hf/llava-1.5-7b-hf` ## 🚀 Uso Una vez configurado, la aplicación automáticamente: 1. **Detectará** que tienes Hugging Face configurado 2. **Usará Qwen2-VL** para análisis visual directo 3. **Proporcionará** análisis detallado en español ## 🔍 Capacidades de Qwen2-VL - ✅ Análisis visual directo de imágenes - ✅ Detección de defectos y anomalías - ✅ Descripción detallada de superficies - ✅ Comparación con detecciones YOLO - ✅ Recomendaciones de mantenimiento - ✅ Respuestas en español ## 🛠️ Solución de Problemas ### Error: "Model loading" ```bash # Espera unos minutos, el modelo se está cargando por primera vez # Los modelos de HF pueden tardar en "despertar" ``` ### Error: "Token inválido" ```bash # Verifica que el token sea correcto echo $HUGGINGFACE_API_TOKEN ``` ### Usar modelo alternativo ```bash # Si Qwen2-VL no funciona, prueba: $env:VISION_MODEL_ID = "llava-hf/llava-1.5-7b-hf" ``` ## 📊 Comparación | Modelo | Costo | Calidad | Velocidad | Configuración | |--------|-------|---------|-----------|---------------| | GPT-4 Vision | 💰 Pago | 🌟🌟🌟🌟🌟 | 🚀🚀🚀 | Fácil | | Qwen2-VL | 🆓 Gratis | 🌟🌟🌟🌟 | 🚀🚀 | Fácil | | Análisis técnico | 🆓 Gratis | 🌟🌟 | 🚀🚀🚀 | Automático | ## 🎯 Resultado Esperado Con Qwen2-VL configurado, obtendrás análisis como: ```markdown ## 🔍 Análisis Visual Directo de la Pala **Estado General:** Bueno con mantenimiento menor requerido **Observaciones Específicas:** - Superficie: Color gris uniforme, acabado mate normal - Borde de ataque: Erosión leve visible en zona superior - Suciedad: Dos áreas de acumulación claramente visibles **Defectos Identificados Visualmente:** - Dirt/suciedad: Confirmado en 2 ubicaciones - Erosión menor en borde de ataque - Decoloración UV leve **Recomendaciones:** - Limpieza programada (prioridad media) - Inspección de erosión (seguimiento) ``` ¡Qwen2-VL te dará análisis visual real y gratuito! 🎉