Spaces:

andresdegante
/

papalia3

Sleeping

App Files Files Community

Tu Nombre commited on 28 days ago

Commit

13c15b7

1 Parent(s): abd1ef4

Initial commit for Papalia3 Space

Browse files

Files changed (6) hide show

.DS_Store +0 -0
Dockerfile +38 -36
README.md +1 -1
app.py +15 -49
requirements.txt +1 -1
templates/index.html +21 -36

.DS_Store CHANGED Viewed

Binary files a/.DS_Store and b/.DS_Store differ

Dockerfile CHANGED Viewed

@@ -1,10 +1,9 @@
 FROM python:3.9
-# Install Ollama and required tools
 RUN apt-get update && apt-get install -y curl wget netcat-traditional && \
     curl -fsSL https://ollama.com/install.sh | sh
-# Create non-root user
 RUN useradd -m -u 1000 user
 WORKDIR /app
@@ -12,41 +11,45 @@ WORKDIR /app
 COPY --chown=user ./requirements.txt requirements.txt
 RUN pip install --no-cache-dir --upgrade -r requirements.txt
-# Copy application files including templates
 COPY --chown=user . /app
-# Create Modelfile as a separate step
-RUN printf "FROM llama3\n\nSYSTEM \"Eres un asistente especializado en Desarrollo Humano, basado en la duodécima edición del libro de Papalia. Tu objetivo es proporcionar información precisa y actualizada sobre el desarrollo humano a lo largo del ciclo vital. Base tu conocimiento en la obra de Diane E. Papalia, Ruth Duskin Feldman y Gabriela Martorell. Utiliza siempre evidencia científica y ejemplos del libro para respaldar tus respuestas.\"\n\nPARAMETER temperature 0.7\nPARAMETER top_k 40\nPARAMETER top_p 0.7\nPARAMETER repeat_penalty 1.1" > /app/Modelfile
-# Create startup script
-RUN printf '#!/bin/bash\n\
-echo "Configurando sistema..."\n\
-ulimit -v unlimited\n\
-\n\
-echo "Iniciando servidor Ollama..."\n\
-ollama serve &\n\
-\n\
-echo "Esperando a que Ollama esté listo..."\n\
-for i in {1..120}; do\n\
-    if nc -z localhost 11434; then\n\
-        echo "Ollama está listo"\n\
-        break\n\
-    fi\n\
-    echo "Esperando a Ollama... $i/120s"\n\
-    sleep 1\n\
-done\n\
-\n\
-echo "Creando modelo..."\n\
-cd /app\n\
-ollama create llama3.2:1b-papalia -f Modelfile\n\
-\n\
-echo "Verificando modelo..."\n\
-if ! ollama list | grep -q "llama3.2:1b-papalia"; then\n\
-    echo "Error: El modelo no se pudo crear"\n\
-    exit 1\n\
-fi\n\
-\n\
-echo "Iniciando API..."\n\
 exec uvicorn app:app --host 0.0.0.0 --port 7860 --timeout-keep-alive 120' > /app/start.sh
 RUN chmod +x /app/start.sh
@@ -54,7 +57,6 @@ RUN chmod +x /app/start.sh
 USER user
 ENV PATH="/home/user/.local/bin:$PATH"
-# Health check with increased interval
 HEALTHCHECK --interval=60s --timeout=30s --start-period=180s --retries=3 \
     CMD curl -f http://localhost:7860/health || exit 1

+# Dockerfile
 FROM python:3.9
 RUN apt-get update && apt-get install -y curl wget netcat-traditional && \
     curl -fsSL https://ollama.com/install.sh | sh
 RUN useradd -m -u 1000 user
 WORKDIR /app
 COPY --chown=user ./requirements.txt requirements.txt
 RUN pip install --no-cache-dir --upgrade -r requirements.txt
 COPY --chown=user . /app
+RUN echo 'FROM llama3
+SYSTEM "Eres un asistente especializado en Desarrollo Humano, basado en la duodécima edición del libro de Papalia. Tu objetivo es proporcionar información precisa y actualizada sobre el desarrollo humano a lo largo del ciclo vital. Base tu conocimiento en la obra de Diane E. Papalia, Ruth Duskin Feldman y Gabriela Martorell. Utiliza siempre evidencia científica y ejemplos del libro para respaldar tus respuestas."
+PARAMETER temperature 0.7
+PARAMETER top_k 40
+PARAMETER top_p 0.7
+PARAMETER repeat_penalty 1.1' > /app/Modelfile
+RUN printf '#!/bin/bash
+echo "Configurando sistema..."
+ulimit -v unlimited
+echo "Iniciando servidor Ollama..."
+ollama serve &
+echo "Esperando a que Ollama esté listo..."
+for i in {1..120}; do
+    if nc -z localhost 11434; then
+        echo "Ollama está listo"
+        break
+    fi
+    echo "Esperando a Ollama... $i/120s"
+    sleep 1
+done
+echo "Creando modelo..."
+cd /app
+ollama create llama3.2:1b-papalia -f Modelfile
+echo "Verificando modelo..."
+if ! ollama list | grep -q "llama3.2:1b-papalia"; then
+    echo "Error: El modelo no se pudo crear"
+    exit 1
+fi
+echo "Iniciando API..."
 exec uvicorn app:app --host 0.0.0.0 --port 7860 --timeout-keep-alive 120' > /app/start.sh
 RUN chmod +x /app/start.sh
 USER user
 ENV PATH="/home/user/.local/bin:$PATH"
 HEALTHCHECK --interval=60s --timeout=30s --start-period=180s --retries=3 \
     CMD curl -f http://localhost:7860/health || exit 1

README.md CHANGED Viewed

@@ -1,5 +1,5 @@
 ---
-title: Llama3 Papalia Nuevo
 emoji: 🏃
 colorFrom: red
 colorTo: purple

 ---
+title: Papali3
 emoji: 🏃
 colorFrom: red
 colorTo: purple

app.py CHANGED Viewed

@@ -1,11 +1,9 @@
 from fastapi import FastAPI, HTTPException, Request
 from fastapi.responses import HTMLResponse, JSONResponse
-from fastapi.staticfiles import StaticFiles
 from fastapi.templating import Jinja2Templates
 from fastapi.middleware.cors import CORSMiddleware
 from pydantic import BaseModel
 import httpx
-import os
 import logging
 from typing import Optional, Dict, Any
@@ -13,19 +11,12 @@ logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 app = FastAPI(
-    title="Llama3-Papalia Inference API & UI",
-    description="API para interactuar con el modelo Llama3-Papalia",
     version="1.0.0"
 )
-app.add_middleware(
-    CORSMiddleware,
-    allow_origins=["*"],
-    allow_credentials=True,
-    allow_methods=["*"],
-    allow_headers=["*"],
-)
 templates = Jinja2Templates(directory="templates")
 class QueryRequest(BaseModel):
@@ -45,11 +36,10 @@ async def check_ollama_status() -> Dict[str, Any]:
         async with httpx.AsyncClient(timeout=5.0) as client:
             response = await client.get(OLLAMA_BASE_URL)
             if response.status_code != 200:
-                return {"status": "error", "message": "Ollama no responde", "code": response.status_code}
-            # Verificar que el modelo esté disponible
             model_response = await client.post(
-                OLLAMA_BASE_URL + "/api/generate",
                 json={
                     "model": "llama3.2:1b-papalia",
                     "prompt": "test",
@@ -57,38 +47,25 @@ async def check_ollama_status() -> Dict[str, Any]:
                 },
                 timeout=5.0
             )
             if model_response.status_code != 200:
-                return {"status": "error", "message": "Modelo no disponible", "code": model_response.status_code}
-            return {"status": "ok", "message": "Servicio funcionando correctamente"}
     except Exception as e:
         return {"status": "error", "message": str(e)}
 @app.get("/", response_class=HTMLResponse)
 async def read_root(request: Request):
     status = await check_ollama_status()
-    return templates.TemplateResponse(
-        "index.html",
-        {
-            "request": request,
-            "title": "Llama3-Papalia Inference",
-            "status": status
-        }
-    )
 @app.post("/generate")
 async def generate_response(query: QueryRequest):
-    logger.info(f"Recibida solicitud: {query.prompt[:50]}...")
     try:
         async with httpx.AsyncClient(timeout=60.0) as client:
             status = await check_ollama_status()
             if status["status"] != "ok":
-                raise HTTPException(
-                    status_code=503,
-                    detail=status["message"]
-                )
             response = await client.post(
                 OLLAMA_API_URL,
@@ -103,31 +80,20 @@ async def generate_response(query: QueryRequest):
             )
             if response.status_code != 200:
-                raise HTTPException(
-                    status_code=response.status_code,
-                    detail=f"Error del modelo: {response.text}"
-                )
             result = response.json()
             logger.info("Respuesta generada exitosamente")
             return {"response": result.get("response", ""), "model": "llama3.2:1b-papalia"}
     except httpx.TimeoutException:
-        logger.error("Timeout en la solicitud a Ollama")
-        raise HTTPException(
-            status_code=504,
-            detail="Timeout en la solicitud al modelo"
-        )
     except Exception as e:
         logger.error(f"Error: {str(e)}")
-        raise HTTPException(
-            status_code=500,
-            detail=str(e)
-        )
 @app.get("/health")
 async def health_check():
     status = await check_ollama_status()
-    if status["status"] == "ok":
-        return {"status": "healthy", "message": status["message"]}
-    return {"status": "unhealthy", "error": status["message"]}

 from fastapi import FastAPI, HTTPException, Request
 from fastapi.responses import HTMLResponse, JSONResponse
 from fastapi.templating import Jinja2Templates
 from fastapi.middleware.cors import CORSMiddleware
 from pydantic import BaseModel
 import httpx
 import logging
 from typing import Optional, Dict, Any
 logger = logging.getLogger(__name__)
 app = FastAPI(
+    title="Llama3.2:1b-Papalia Inference API",
+    description="API para interactuar con el modelo especializado en Desarrollo Humano",
     version="1.0.0"
 )
+app.add_middleware(CORSMiddleware, allow_origins=["*"], allow_credentials=True, allow_methods=["*"], allow_headers=["*"])
 templates = Jinja2Templates(directory="templates")
 class QueryRequest(BaseModel):
         async with httpx.AsyncClient(timeout=5.0) as client:
             response = await client.get(OLLAMA_BASE_URL)
             if response.status_code != 200:
+                return {"status": "error", "message": "Ollama no responde"}
             model_response = await client.post(
+                OLLAMA_API_URL,
                 json={
                     "model": "llama3.2:1b-papalia",
                     "prompt": "test",
                 },
                 timeout=5.0
             )
             if model_response.status_code != 200:
+                return {"status": "error", "message": "Modelo no disponible"}
+            return {"status": "ok", "message": "Servicio activo"}
     except Exception as e:
         return {"status": "error", "message": str(e)}
 @app.get("/", response_class=HTMLResponse)
 async def read_root(request: Request):
     status = await check_ollama_status()
+    return templates.TemplateResponse("index.html", {"request": request, "title": "Papalia3 Inference", "status": status})
 @app.post("/generate")
 async def generate_response(query: QueryRequest):
+    logger.info(f"Solicitud recibida: {query.prompt[:50]}...")
     try:
         async with httpx.AsyncClient(timeout=60.0) as client:
             status = await check_ollama_status()
             if status["status"] != "ok":
+                raise HTTPException(status_code=503, detail=status["message"])
             response = await client.post(
                 OLLAMA_API_URL,
             )
             if response.status_code != 200:
+                raise HTTPException(status_code=response.status_code, detail=f"Error del modelo: {response.text}")
             result = response.json()
             logger.info("Respuesta generada exitosamente")
             return {"response": result.get("response", ""), "model": "llama3.2:1b-papalia"}
     except httpx.TimeoutException:
+        logger.error("Timeout en solicitud a Ollama")
+        raise HTTPException(status_code=504, detail="Timeout en solicitud al modelo")
     except Exception as e:
         logger.error(f"Error: {str(e)}")
+        raise HTTPException(status_code=500, detail=str(e))
 @app.get("/health")
 async def health_check():
     status = await check_ollama_status()
+    return {"status": "healthy", "message": status["message"]} if status["status"] == "ok" else {"status": "unhealthy", "error": status["message"]}

requirements.txt CHANGED Viewed

@@ -4,4 +4,4 @@ python-dotenv==1.0.0
 httpx==0.25.2
 pydantic==2.5.2
 jinja2==3.1.2
-python-multipart==0.0.6

 httpx==0.25.2
 pydantic==2.5.2
 jinja2==3.1.2
+python-multipart==0.0.6

templates/index.html CHANGED Viewed

@@ -1,33 +1,30 @@
 <!DOCTYPE html>
 <html>
 <head>
-    <title>Llama3-Papalia Inference</title>
     <script src="https://cdn.tailwindcss.com"></script>
 </head>
-<body class="bg-gray-100 p-8">
     <div class="max-w-4xl mx-auto">
         <div class="flex justify-between items-center mb-8">
-            <h1 class="text-3xl font-bold">Llama3-Papalia Inference</h1>
             <div id="service-status" class="text-sm">Verificando estado...</div>
         </div>
-        <div class="bg-white rounded-lg shadow-md p-6">
             <div class="mb-4">
-                <label class="block text-gray-700 text-sm font-bold mb-2" for="prompt">
-                    Prompt
-                </label>
                 <textarea
                     id="prompt"
                     class="shadow appearance-none border rounded w-full py-2 px-3 text-gray-700 leading-tight focus:outline-none focus:shadow-outline"
                     rows="4"
-                    placeholder="Escribe tu pregunta aquí..."></textarea>
             </div>
             <div class="grid grid-cols-2 gap-4 mb-4">
                 <div>
-                    <label class="block text-gray-700 text-sm font-bold mb-2" for="temperature">
-                        Temperature
-                    </label>
                     <input
                         type="number"
                         id="temperature"
@@ -38,9 +35,7 @@
                         class="shadow appearance-none border rounded w-full py-2 px-3 text-gray-700 leading-tight focus:outline-none focus:shadow-outline">
                 </div>
                 <div>
-                    <label class="block text-gray-700 text-sm font-bold mb-2" for="max_tokens">
-                        Max Tokens
-                    </label>
                     <input
                         type="number"
                         id="max_tokens"
@@ -58,19 +53,14 @@
                     class="bg-blue-500 hover:bg-blue-700 text-white font-bold py-2 px-4 rounded focus:outline-none focus:shadow-outline disabled:opacity-50">
                     Generar Respuesta
                 </button>
-                <div id="loading" class="hidden">
                     Generando...
                 </div>
             </div>
-            <div class="mt-8">
-                <label class="block text-gray-700 text-sm font-bold mb-2">
-                    Respuesta
-                </label>
-                <div
-                    id="response"
-                    class="mt-2 p-4 bg-gray-100 rounded min-h-[200px] whitespace-pre-wrap">
-                </div>
             </div>
         </div>
     </div>
@@ -81,20 +71,21 @@
                 const response = await fetch('/health');
                 const data = await response.json();
                 const statusEl = document.getElementById('service-status');
                 if (data.status === 'healthy') {
                     statusEl.textContent = '✅ Servicio activo';
-                    statusEl.className = 'text-green-600';
-                    document.getElementById('generate-button').disabled = false;
                 } else {
                     statusEl.textContent = '❌ ' + (data.error || 'Servicio no disponible');
-                    statusEl.className = 'text-red-600';
-                    document.getElementById('generate-button').disabled = true;
                 }
             } catch (error) {
                 const statusEl = document.getElementById('service-status');
                 statusEl.textContent = '❌ Error de conexión';
-                statusEl.className = 'text-red-600';
                 document.getElementById('generate-button').disabled = true;
             }
         }
@@ -119,9 +110,7 @@
             try {
                 const response = await fetch('/generate', {
                     method: 'POST',
-                    headers: {
-                        'Content-Type': 'application/json',
-                    },
                     body: JSON.stringify({
                         prompt: promptEl.value,
                         temperature: parseFloat(temperatureEl.value),
@@ -130,10 +119,7 @@
                 });
                 const data = await response.json();
-                if (!response.ok) {
-                    throw new Error(data.detail || 'Error en la generación de respuesta');
-                }
                 responseEl.textContent = data.response || 'No se recibió respuesta del modelo';
                 responseEl.className = 'mt-2 p-4 bg-gray-100 rounded min-h-[200px] whitespace-pre-wrap';
@@ -146,7 +132,6 @@
             }
         }
-        // Verificar estado cada 30 segundos
         checkHealth();
         setInterval(checkHealth, 30000);
     </script>

 <!DOCTYPE html>
 <html>
 <head>
+    <title>Papalia3 Inference</title>
     <script src="https://cdn.tailwindcss.com"></script>
+    <meta name="viewport" content="width=device-width, initial-scale=1.0">
 </head>
+<body class="bg-gray-100 p-4 md:p-8">
     <div class="max-w-4xl mx-auto">
         <div class="flex justify-between items-center mb-8">
+            <h1 class="text-2xl md:text-3xl font-bold">Papalia3 - Desarrollo Humano</h1>
             <div id="service-status" class="text-sm">Verificando estado...</div>
         </div>
+        <div class="bg-white rounded-lg shadow-md p-4 md:p-6">
             <div class="mb-4">
+                <label class="block text-gray-700 text-sm font-bold mb-2" for="prompt">Prompt</label>
                 <textarea
                     id="prompt"
                     class="shadow appearance-none border rounded w-full py-2 px-3 text-gray-700 leading-tight focus:outline-none focus:shadow-outline"
                     rows="4"
+                    placeholder="Escribe tu pregunta sobre Desarrollo Humano..."></textarea>
             </div>
             <div class="grid grid-cols-2 gap-4 mb-4">
                 <div>
+                    <label class="block text-gray-700 text-sm font-bold mb-2" for="temperature">Temperature</label>
                     <input
                         type="number"
                         id="temperature"
                         class="shadow appearance-none border rounded w-full py-2 px-3 text-gray-700 leading-tight focus:outline-none focus:shadow-outline">
                 </div>
                 <div>
+                    <label class="block text-gray-700 text-sm font-bold mb-2" for="max_tokens">Max Tokens</label>
                     <input
                         type="number"
                         id="max_tokens"
                     class="bg-blue-500 hover:bg-blue-700 text-white font-bold py-2 px-4 rounded focus:outline-none focus:shadow-outline disabled:opacity-50">
                     Generar Respuesta
                 </button>
+                <div id="loading" class="hidden text-gray-600">
                     Generando...
                 </div>
             </div>
+            <div class="mt-6">
+                <label class="block text-gray-700 text-sm font-bold mb-2">Respuesta</label>
+                <div id="response" class="mt-2 p-4 bg-gray-100 rounded min-h-[200px] whitespace-pre-wrap"></div>
             </div>
         </div>
     </div>
                 const response = await fetch('/health');
                 const data = await response.json();
                 const statusEl = document.getElementById('service-status');
+                const buttonEl = document.getElementById('generate-button');
                 if (data.status === 'healthy') {
                     statusEl.textContent = '✅ Servicio activo';
+                    statusEl.className = 'text-sm text-green-600';
+                    buttonEl.disabled = false;
                 } else {
                     statusEl.textContent = '❌ ' + (data.error || 'Servicio no disponible');
+                    statusEl.className = 'text-sm text-red-600';
+                    buttonEl.disabled = true;
                 }
             } catch (error) {
                 const statusEl = document.getElementById('service-status');
                 statusEl.textContent = '❌ Error de conexión';
+                statusEl.className = 'text-sm text-red-600';
                 document.getElementById('generate-button').disabled = true;
             }
         }
             try {
                 const response = await fetch('/generate', {
                     method: 'POST',
+                    headers: {'Content-Type': 'application/json'},
                     body: JSON.stringify({
                         prompt: promptEl.value,
                         temperature: parseFloat(temperatureEl.value),
                 });
                 const data = await response.json();
+                if (!response.ok) throw new Error(data.detail || 'Error en la generación');
                 responseEl.textContent = data.response || 'No se recibió respuesta del modelo';
                 responseEl.className = 'mt-2 p-4 bg-gray-100 rounded min-h-[200px] whitespace-pre-wrap';
             }
         }
         checkHealth();
         setInterval(checkHealth, 30000);
     </script>