Spaces:

histlearn
/

BoletimSed

Sleeping

App Files Files Community

histlearn commited on Oct 23, 2024

Commit

dd811fe

verified ·

1 Parent(s): a044811

Update app.py

Browse files

Files changed (1) hide show

app.py +90 -30

app.py CHANGED Viewed

@@ -7,17 +7,48 @@ from fpdf import FPDF
 import tempfile
 import os
 import matplotlib
-matplotlib.use('Agg')  # Usar backend não-interativo
 def converter_nota(valor):
     if pd.isna(valor) or valor == '-' or valor == 'N':
         return 0
     try:
-        return float(valor)
     except:
         return 0
 def plotar_evolucao_bimestres(df_filtrado, temp_dir):
     plt.figure(figsize=(12, 6))
     disciplinas_basicas = ['LINGUA PORTUGUESA', 'ARTE', 'LINGUA ESTRANGEIRA INGLES',
@@ -61,7 +92,7 @@ def plotar_evolucao_bimestres(df_filtrado, temp_dir):
                         alpha=0.8)
                 for x, y in zip(bimestres, notas_filtradas):
-                    plt.annotate(str(y), (x, y), textcoords="offset points", xytext=(0, 10), ha='center')
     plt.title('Evolução das Médias por Disciplina ao Longo dos Bimestres')
     plt.xlabel('Bimestres')
@@ -77,11 +108,16 @@ def plotar_evolucao_bimestres(df_filtrado, temp_dir):
     return plot_path
 def plotar_graficos_destacados(df_boletim_clean, temp_dir):
     plt.figure(figsize=(12, 6))
     disciplinas = df_boletim_clean['Disciplina'].astype(str)
-    medias_frequencia = df_boletim_clean[['Freq B1', 'Freq B2', 'Freq B3', 'Freq B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
     medias_notas = df_boletim_clean[['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
     cores_notas = ['red' if media < 5 else 'blue' for media in medias_notas]
@@ -114,6 +150,7 @@ def plotar_graficos_destacados(df_boletim_clean, temp_dir):
     return plot_path
 def gerar_relatorio_pdf(df, grafico1_path, grafico2_path):
     pdf = FPDF()
     pdf.add_page()
@@ -130,8 +167,13 @@ def gerar_relatorio_pdf(df, grafico1_path, grafico2_path):
     pdf.cell(0, 10, 'Avisos Importantes:', 0, 1, 'L')
     pdf.set_font('Arial', '', 10)
     medias_notas = df[['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
-    medias_freq = df[['Freq B1', 'Freq B2', 'Freq B3', 'Freq B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
     for idx, (disciplina, media_nota, media_freq) in enumerate(zip(df['Disciplina'], medias_notas, medias_freq)):
         if media_nota < 5:
@@ -144,55 +186,73 @@ def gerar_relatorio_pdf(df, grafico1_path, grafico2_path):
     pdf.output(pdf_path)
     return pdf_path
-def processar_boletim(pdf_file):
     try:
         temp_dir = tempfile.mkdtemp()
-        # Ler o arquivo temporário e salvar seu conteúdo
         temp_pdf = os.path.join(temp_dir, 'boletim.pdf')
         with open(temp_pdf, 'wb') as f:
-            f.write(pdf_file.read())  # Usar .read() para obter o conteúdo do arquivo
-        tables = camelot.read_pdf(temp_pdf, pages='all', flavor='lattice')
-        if len(tables) == 0:
-            return None, "Nenhuma tabela encontrada no PDF."
-        df = tables[0].df
-        df.columns = ['Disciplina', 'Nota B1', 'Freq B1', '%Freq B1', 'AC B1',
-                     'Nota B2', 'Freq B2', '%Freq B2', 'AC B2',
-                     'Nota B3', 'Freq B3', '%Freq B3', 'AC B3',
-                     'Nota B4', 'Freq B4', '%Freq B4', 'AC B4',
-                     'CF', 'Nota Final', 'Freq Final', 'AC Final']
         colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
         for col in colunas_notas:
-            df[col] = df[col].apply(converter_nota)
         grafico1_path = plotar_evolucao_bimestres(df, temp_dir)
         grafico2_path = plotar_graficos_destacados(df, temp_dir)
         pdf_path = gerar_relatorio_pdf(df, grafico1_path, grafico2_path)
         with open(pdf_path, 'rb') as f:
             pdf_content = f.read()
-        # Limpar arquivos temporários
-        os.remove(pdf_path)
-        for file in os.listdir(temp_dir):
-            os.remove(os.path.join(temp_dir, file))
-        os.rmdir(temp_dir)
         return pdf_content, "Relatório gerado com sucesso!"
     except Exception as e:
-        if 'temp_dir' in locals():
-            for file in os.listdir(temp_dir):
-                os.remove(os.path.join(temp_dir, file))
-            os.rmdir(temp_dir)
         return None, f"Erro ao processar o boletim: {str(e)}"
 iface = gr.Interface(
     fn=processar_boletim,
     inputs=gr.File(label="Upload do Boletim (PDF)"),

 import tempfile
 import os
 import matplotlib
+matplotlib.use('Agg')
+def extrair_tabelas_pdf(pdf_path):
+    """Extrai tabelas do PDF e retorna um DataFrame processado."""
+    try:
+        # Extrair tabelas do PDF usando o método 'lattice'
+        tables = camelot.read_pdf(pdf_path, pages='all', flavor='lattice')
+        print(f"Tabelas extraídas: {len(tables)}")
+        if len(tables) == 0:
+            raise ValueError("Nenhuma tabela foi extraída do PDF.")
+        # Processar a primeira tabela
+        df = tables[0].df
+        # Verificar se a tabela tem conteúdo
+        if df.empty:
+            raise ValueError("A tabela extraída está vazia.")
+        # Salvar todas as tabelas extraídas em CSV (para debug)
+        temp_dir = os.path.dirname(pdf_path)
+        for i, table in enumerate(tables):
+            csv_path = os.path.join(temp_dir, f'boletim_extraido_{i+1}.csv')
+            table.to_csv(csv_path)
+            print(f"Tabela {i+1} salva como CSV em {csv_path}")
+        return df
+    except Exception as e:
+        print(f"Erro na extração das tabelas: {str(e)}")
+        raise
 def converter_nota(valor):
+    """Converte valor de nota para float, tratando casos especiais."""
     if pd.isna(valor) or valor == '-' or valor == 'N':
         return 0
     try:
+        return float(valor.replace(',', '.'))  # Tratar decimal com vírgula
     except:
         return 0
 def plotar_evolucao_bimestres(df_filtrado, temp_dir):
+    """Plota gráfico de evolução das notas por bimestre."""
     plt.figure(figsize=(12, 6))
     disciplinas_basicas = ['LINGUA PORTUGUESA', 'ARTE', 'LINGUA ESTRANGEIRA INGLES',
                         alpha=0.8)
                 for x, y in zip(bimestres, notas_filtradas):
+                    plt.annotate(f"{y:.1f}", (x, y), textcoords="offset points", xytext=(0, 10), ha='center')
     plt.title('Evolução das Médias por Disciplina ao Longo dos Bimestres')
     plt.xlabel('Bimestres')
     return plot_path
 def plotar_graficos_destacados(df_boletim_clean, temp_dir):
+    """Plota gráficos de médias e frequências com destaques."""
     plt.figure(figsize=(12, 6))
     disciplinas = df_boletim_clean['Disciplina'].astype(str)
+    # Processar frequências (remover % e converter para número)
+    colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
+    freq_data = df_boletim_clean[colunas_freq].replace('%', '', regex=True)
+    medias_frequencia = freq_data.apply(pd.to_numeric, errors='coerce').mean(axis=1)
     medias_notas = df_boletim_clean[['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
     cores_notas = ['red' if media < 5 else 'blue' for media in medias_notas]
     return plot_path
 def gerar_relatorio_pdf(df, grafico1_path, grafico2_path):
+    """Gera relatório PDF com os gráficos e análises."""
     pdf = FPDF()
     pdf.add_page()
     pdf.cell(0, 10, 'Avisos Importantes:', 0, 1, 'L')
     pdf.set_font('Arial', '', 10)
+    # Calcular médias
     medias_notas = df[['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
+    # Processar frequências
+    colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
+    freq_data = df[colunas_freq].replace('%', '', regex=True)
+    medias_freq = freq_data.apply(pd.to_numeric, errors='coerce').mean(axis=1)
     for idx, (disciplina, media_nota, media_freq) in enumerate(zip(df['Disciplina'], medias_notas, medias_freq)):
         if media_nota < 5:
     pdf.output(pdf_path)
     return pdf_path
+def processar_boletim(file):
+    """Função principal que processa o boletim e gera o relatório."""
+    temp_dir = None
     try:
+        # Verificar se o arquivo é válido
+        if file is None:
+            return None, "Nenhum arquivo foi fornecido."
+        # Criar diretório temporário
         temp_dir = tempfile.mkdtemp()
+        print(f"Diretório temporário criado: {temp_dir}")
+        # Salvar o PDF enviado
         temp_pdf = os.path.join(temp_dir, 'boletim.pdf')
         with open(temp_pdf, 'wb') as f:
+            f.write(file.read())
+        print(f"PDF salvo em: {temp_pdf}")
+        # Extrair tabelas do PDF
+        print("Iniciando extração das tabelas...")
+        df = extrair_tabelas_pdf(temp_pdf)
+        print("Tabelas extraídas com sucesso")
+        # Verificar se o DataFrame foi criado corretamente
+        if df is None or df.empty:
+            raise ValueError("Não foi possível extrair dados do PDF.")
+        # Processar notas
         colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
         for col in colunas_notas:
+            if col in df.columns:
+                df[col] = df[col].apply(converter_nota)
+        print("Notas processadas")
+        # Gerar gráficos
+        print("Gerando gráficos...")
         grafico1_path = plotar_evolucao_bimestres(df, temp_dir)
         grafico2_path = plotar_graficos_destacados(df, temp_dir)
+        print("Gráficos gerados")
+        # Gerar PDF
+        print("Gerando relatório PDF...")
         pdf_path = gerar_relatorio_pdf(df, grafico1_path, grafico2_path)
+        print("Relatório PDF gerado")
+        # Ler PDF gerado
         with open(pdf_path, 'rb') as f:
             pdf_content = f.read()
         return pdf_content, "Relatório gerado com sucesso!"
     except Exception as e:
+        print(f"Erro durante o processamento: {str(e)}")
         return None, f"Erro ao processar o boletim: {str(e)}"
+    finally:
+        # Limpar arquivos temporários
+        if temp_dir and os.path.exists(temp_dir):
+            try:
+                for file in os.listdir(temp_dir):
+                    os.remove(os.path.join(temp_dir, file))
+                os.rmdir(temp_dir)
+                print("Arquivos temporários limpos")
+            except Exception as e:
+                print(f"Erro ao limpar arquivos temporários: {str(e)}")
+# Interface Gradio
 iface = gr.Interface(
     fn=processar_boletim,
     inputs=gr.File(label="Upload do Boletim (PDF)"),