Spaces:

histlearn
/

BoletimSed

Sleeping

App Files Files Community

histlearn commited on Oct 23, 2024

Commit

1a31ba8

verified ·

1 Parent(s): 404c2a9

Update app.py

Browse files

Files changed (1) hide show

app.py +115 -42

app.py CHANGED Viewed

@@ -9,14 +9,9 @@ import tempfile
 import os
 import matplotlib
 import shutil
 matplotlib.use('Agg')
-# Lista global de disciplinas básicas
-DISCIPLINAS_BASICAS = [
-    'LINGUA PORTUGUESA', 'ARTE', 'LINGUA ESTRANGEIRA INGLES',
-    'GEOGRAFIA', 'CIENCIAS', 'HISTORIA', 'MATEMATICA'
-]
 def extrair_tabelas_pdf(pdf_path):
     """Extrai tabelas do PDF e retorna um DataFrame processado."""
     try:
@@ -59,28 +54,66 @@ def converter_nota(valor):
     except:
         return 0
 def plotar_evolucao_bimestres(df_filtrado, temp_dir):
     """Plota gráfico de evolução das notas por bimestre."""
-    plt.figure(figsize=(12, 6))
-    # Filtrar apenas disciplinas básicas
-    df_filtrado = df_filtrado[df_filtrado['Disciplina'].isin(DISCIPLINAS_BASICAS)]
-    estilos = {
-        'LINGUA PORTUGUESA': {'cor': '#DC143C', 'marcador': 'p', 'zorder': 1, 'linestyle': '-', 'desloc': 0.1},
-        'ARTE': {'cor': '#4169E1', 'marcador': 'D', 'zorder': 2, 'linestyle': '--', 'desloc': 0.08},
-        'LINGUA ESTRANGEIRA INGLES': {'cor': '#9370DB', 'marcador': 'h', 'zorder': 3, 'linestyle': '-.', 'desloc': 0.06},
-        'GEOGRAFIA': {'cor': '#32CD32', 'marcador': '^', 'zorder': 4, 'linestyle': ':', 'desloc': 0.04},
-        'CIENCIAS': {'cor': '#FF8C00', 'marcador': 's', 'zorder': 5, 'linestyle': '-', 'desloc': 0.02},
-        'HISTORIA': {'cor': '#00CED1', 'marcador': '*', 'zorder': 6, 'linestyle': '--', 'desloc': -0.02},
-        'MATEMATICA': {'cor': '#FF69B4', 'marcador': 'o', 'zorder': 7, 'linestyle': '-.', 'desloc': -0.04}
-    }
     plt.grid(True, linestyle='--', alpha=0.3, zorder=0)
     colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
-    for disciplina in DISCIPLINAS_BASICAS:
         dados_disciplina = df_filtrado[df_filtrado['Disciplina'] == disciplina]
         if not dados_disciplina.empty:
             notas = dados_disciplina[colunas_notas].values[0]
@@ -90,28 +123,34 @@ def plotar_evolucao_bimestres(df_filtrado, temp_dir):
                 bimestres = np.arange(1, len(colunas_notas) + 1)[notas_validas]
                 notas_filtradas = notas[notas_validas]
-                estilo = estilos[disciplina]
-                notas_deslocadas = notas_filtradas + estilo['desloc']
-                plt.plot(bimestres, notas_deslocadas,
-                        color=estilo['cor'],
-                        marker=estilo['marcador'],
-                        markersize=10,
-                        linewidth=2.5,
                         label=disciplina,
-                        zorder=estilo['zorder'],
-                        linestyle=estilo['linestyle'],
                         alpha=0.8)
                 for x, y in zip(bimestres, notas_filtradas):
-                    plt.annotate(f"{y:.1f}", (x, y), textcoords="offset points", xytext=(0, 10), ha='center')
     plt.title('Evolução das Médias por Disciplina ao Longo dos Bimestres')
     plt.xlabel('Bimestres')
     plt.ylabel('Média de Notas')
     plt.xticks([1, 2, 3, 4], ['B1', 'B2', 'B3', 'B4'])
     plt.ylim(0, 10)
-    plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left')
     plt.tight_layout()
     plot_path = os.path.join(temp_dir, 'evolucao_notas.png')
@@ -121,10 +160,15 @@ def plotar_evolucao_bimestres(df_filtrado, temp_dir):
 def plotar_graficos_destacados(df_boletim_clean, temp_dir):
     """Plota gráficos de médias e frequências com destaques."""
-    plt.figure(figsize=(12, 6))
-    # Filtrar apenas disciplinas básicas
-    df_filtrado = df_boletim_clean[df_boletim_clean['Disciplina'].isin(DISCIPLINAS_BASICAS)]
     disciplinas = df_filtrado['Disciplina'].astype(str)
     # Processar frequências (remover % e converter para número)
@@ -140,21 +184,36 @@ def plotar_graficos_destacados(df_boletim_clean, temp_dir):
     frequencia_global_media = medias_frequencia.mean()
     plt.subplot(1, 2, 1)
-    plt.bar(disciplinas, medias_notas, color=cores_notas)
     plt.title('Média de Notas por Disciplina (Vermelho: < 5)')
-    plt.xticks(rotation=90)
     plt.ylim(0, 10)
     plt.subplot(1, 2, 2)
-    plt.bar(disciplinas, medias_frequencia, color=cores_frequencias)
     plt.title('Média de Frequência por Disciplina (Vermelho: < 75%)')
-    plt.xticks(rotation=90)
     plt.ylim(0, 100)
     plt.suptitle(f"Frequência Global Média: {frequencia_global_media:.2f}%")
     if frequencia_global_media < 75:
-        plt.figtext(0.5, 0.01, "Cuidado: Risco de Reprovação por Baixa Frequência", ha="center", fontsize=12, color="red")
     plt.tight_layout()
@@ -172,6 +231,11 @@ def gerar_relatorio_pdf(df, grafico1_path, grafico2_path):
     pdf.cell(0, 10, 'Relatório de Desempenho Escolar', 0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='C')
     pdf.ln(10)
     pdf.image(grafico1_path, x=10, w=190)
     pdf.ln(10)
     pdf.image(grafico2_path, x=10, w=190)
@@ -181,8 +245,9 @@ def gerar_relatorio_pdf(df, grafico1_path, grafico2_path):
     pdf.cell(0, 10, 'Avisos Importantes:', 0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
     pdf.set_font('Helvetica', '', 10)
-    # Filtrar apenas disciplinas básicas
-    df_filtrado = df[df['Disciplina'].isin(DISCIPLINAS_BASICAS)]
     # Calcular médias
     medias_notas = df_filtrado[['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
@@ -192,6 +257,14 @@ def gerar_relatorio_pdf(df, grafico1_path, grafico2_path):
     freq_data = df_filtrado[colunas_freq].replace('%', '', regex=True)
     medias_freq = freq_data.apply(pd.to_numeric, errors='coerce').mean(axis=1)
     for idx, (disciplina, media_nota, media_freq) in enumerate(zip(df_filtrado['Disciplina'], medias_notas, medias_freq)):
         if media_nota < 5:
             pdf.cell(0, 10, f'- {disciplina}: Média de notas abaixo de 5 ({media_nota:.1f})', 0,
@@ -267,7 +340,7 @@ def processar_boletim(file):
         print("Gerando relatório PDF...")
         pdf_path = gerar_relatorio_pdf(df, grafico1_path, grafico2_path)
         print("Relatório PDF gerado")
         # Criar arquivo temporário para retorno
         output_file = tempfile.NamedTemporaryFile(delete=False, suffix='.pdf')
         output_path = output_file.name

 import os
 import matplotlib
 import shutil
+import colorsys
 matplotlib.use('Agg')
 def extrair_tabelas_pdf(pdf_path):
     """Extrai tabelas do PDF e retorna um DataFrame processado."""
     try:
     except:
         return 0
+def obter_disciplinas_validas(df):
+    """Identifica disciplinas válidas no boletim."""
+    # Colunas de notas e frequências
+    colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
+    colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
+    # Converter notas para numérico
+    for col in colunas_notas:
+        if col in df.columns:
+            df[col] = df[col].apply(converter_nota)
+    # Identificar disciplinas que têm pelo menos uma nota ou frequência
+    disciplinas_validas = []
+    for _, row in df.iterrows():
+        disciplina = row['Disciplina']
+        notas = row[colunas_notas].astype(float)
+        freq = row[colunas_freq].replace('%', '', regex=True).astype(float)
+        if (notas > 0).any() or (freq > 0).any():
+            disciplinas_validas.append(disciplina)
+    return disciplinas_validas
+def gerar_paleta_cores(n_cores):
+    """Gera uma paleta de cores distintas para o número de disciplinas."""
+    cores_base = [
+        '#DC143C', '#4169E1', '#9370DB', '#32CD32', '#FF8C00',
+        '#00CED1', '#FF69B4', '#8B4513', '#4B0082', '#556B2F',
+        '#B8860B', '#483D8B', '#008B8B', '#8B008B', '#8B0000'
+    ]
+    # Se precisar de mais cores, gerar automaticamente
+    if n_cores > len(cores_base):
+        HSV_tuples = [(x/n_cores, 0.8, 0.9) for x in range(n_cores)]
+        cores_extras = ['#%02x%02x%02x' % tuple(int(x*255) for x in colorsys.hsv_to_rgb(*hsv))
+                       for hsv in HSV_tuples]
+        return cores_extras
+    return cores_base[:n_cores]
 def plotar_evolucao_bimestres(df_filtrado, temp_dir):
     """Plota gráfico de evolução das notas por bimestre."""
+    # Obter disciplinas válidas
+    disciplinas_validas = obter_disciplinas_validas(df_filtrado)
+    n_disciplinas = len(disciplinas_validas)
+    # Calcular tamanho da figura baseado no número de disciplinas
+    altura_figura = max(6, n_disciplinas * 0.4)
+    plt.figure(figsize=(14, altura_figura))
+    # Gerar cores para as disciplinas
+    cores = gerar_paleta_cores(n_disciplinas)
+    marcadores = ['o', 's', '^', 'D', 'v', '<', '>', 'p', 'h', '8', '*', 'H', '+', 'x', 'd']
+    estilos_linha = ['-', '--', '-.', ':', '-', '--', '-.', ':', '-', '--', '-.', ':', '-', '--', '-.']
     plt.grid(True, linestyle='--', alpha=0.3, zorder=0)
     colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
+    for idx, disciplina in enumerate(disciplinas_validas):
         dados_disciplina = df_filtrado[df_filtrado['Disciplina'] == disciplina]
         if not dados_disciplina.empty:
             notas = dados_disciplina[colunas_notas].values[0]
                 bimestres = np.arange(1, len(colunas_notas) + 1)[notas_validas]
                 notas_filtradas = notas[notas_validas]
+                plt.plot(bimestres, notas_filtradas,
+                        color=cores[idx % len(cores)],
+                        marker=marcadores[idx % len(marcadores)],
+                        markersize=8,
+                        linewidth=2,
                         label=disciplina,
+                        linestyle=estilos_linha[idx % len(estilos_linha)],
                         alpha=0.8)
                 for x, y in zip(bimestres, notas_filtradas):
+                    plt.annotate(f"{y:.1f}", (x, y),
+                               textcoords="offset points",
+                               xytext=(0, 5),
+                               ha='center',
+                               fontsize=8)
     plt.title('Evolução das Médias por Disciplina ao Longo dos Bimestres')
     plt.xlabel('Bimestres')
     plt.ylabel('Média de Notas')
     plt.xticks([1, 2, 3, 4], ['B1', 'B2', 'B3', 'B4'])
     plt.ylim(0, 10)
+    # Ajustar legenda baseado no número de disciplinas
+    if n_disciplinas > 10:
+        plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', fontsize=8)
+    else:
+        plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left')
     plt.tight_layout()
     plot_path = os.path.join(temp_dir, 'evolucao_notas.png')
 def plotar_graficos_destacados(df_boletim_clean, temp_dir):
     """Plota gráficos de médias e frequências com destaques."""
+    # Obter disciplinas válidas
+    disciplinas_validas = obter_disciplinas_validas(df_boletim_clean)
+    n_disciplinas = len(disciplinas_validas)
+    # Calcular tamanho da figura baseado no número de disciplinas
+    altura_figura = max(6, n_disciplinas * 0.4)
+    plt.figure(figsize=(14, altura_figura))
+    df_filtrado = df_boletim_clean[df_boletim_clean['Disciplina'].isin(disciplinas_validas)]
     disciplinas = df_filtrado['Disciplina'].astype(str)
     # Processar frequências (remover % e converter para número)
     frequencia_global_media = medias_frequencia.mean()
     plt.subplot(1, 2, 1)
+    barras_notas = plt.bar(disciplinas, medias_notas, color=cores_notas)
     plt.title('Média de Notas por Disciplina (Vermelho: < 5)')
+    plt.xticks(rotation=45, ha='right')
     plt.ylim(0, 10)
+    # Adicionar valores nas barras
+    for barra in barras_notas:
+        altura = barra.get_height()
+        plt.text(barra.get_x() + barra.get_width()/2., altura,
+                f'{altura:.1f}',
+                ha='center', va='bottom')
     plt.subplot(1, 2, 2)
+    barras_freq = plt.bar(disciplinas, medias_frequencia, color=cores_frequencias)
     plt.title('Média de Frequência por Disciplina (Vermelho: < 75%)')
+    plt.xticks(rotation=45, ha='right')
     plt.ylim(0, 100)
+    # Adicionar valores nas barras
+    for barra in barras_freq:
+        altura = barra.get_height()
+        plt.text(barra.get_x() + barra.get_width()/2., altura,
+                f'{altura:.1f}%',
+                ha='center', va='bottom')
     plt.suptitle(f"Frequência Global Média: {frequencia_global_media:.2f}%")
     if frequencia_global_media < 75:
+        plt.figtext(0.5, 0.02, "Cuidado: Risco de Reprovação por Baixa Frequência",
+                   ha="center", fontsize=12, color="red")
     plt.tight_layout()
     pdf.cell(0, 10, 'Relatório de Desempenho Escolar', 0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='C')
     pdf.ln(10)
+    # Informações do aluno se disponíveis
+    if 'Nome do Aluno' in df.columns:
+        pdf.set_font('Helvetica', '', 12)
+        pdf.cell(0, 10, f'Aluno: {df["Nome do Aluno"].iloc[0]}', 0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
     pdf.image(grafico1_path, x=10, w=190)
     pdf.ln(10)
     pdf.image(grafico2_path, x=10, w=190)
     pdf.cell(0, 10, 'Avisos Importantes:', 0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
     pdf.set_font('Helvetica', '', 10)
+    # Obter disciplinas válidas
+    disciplinas_validas = obter_disciplinas_validas(df)
+    df_filtrado = df[df['Disciplina'].isin(disciplinas_validas)]
     # Calcular médias
     medias_notas = df_filtrado[['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
     freq_data = df_filtrado[colunas_freq].replace('%', '', regex=True)
     medias_freq = freq_data.apply(pd.to_numeric, errors='coerce').mean(axis=1)
+    # Adicionar média global
+    media_global = medias_notas.mean()
+    freq_global = medias_freq.mean()
+    pdf.cell(0, 10, f'Média Global: {media_global:.1f}', 0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
+    pdf.cell(0, 10, f'Frequência Global: {freq_global:.1f}%', 0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
+    pdf.ln(5)
     for idx, (disciplina, media_nota, media_freq) in enumerate(zip(df_filtrado['Disciplina'], medias_notas, medias_freq)):
         if media_nota < 5:
             pdf.cell(0, 10, f'- {disciplina}: Média de notas abaixo de 5 ({media_nota:.1f})', 0,
         print("Gerando relatório PDF...")
         pdf_path = gerar_relatorio_pdf(df, grafico1_path, grafico2_path)
         print("Relatório PDF gerado")
         # Criar arquivo temporário para retorno
         output_file = tempfile.NamedTemporaryFile(delete=False, suffix='.pdf')
         output_path = output_file.name