Spaces:

histlearn
/

BoletimSed

Sleeping

App Files Files Community

histlearn commited on Oct 23, 2024

Commit

404c2a9

verified ·

1 Parent(s): 62eed5e

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -12

app.py CHANGED Viewed

@@ -11,6 +11,12 @@ import matplotlib
 import shutil
 matplotlib.use('Agg')
 def extrair_tabelas_pdf(pdf_path):
     """Extrai tabelas do PDF e retorna um DataFrame processado."""
     try:
@@ -45,7 +51,11 @@ def converter_nota(valor):
     if pd.isna(valor) or valor == '-' or valor == 'N':
         return 0
     try:
-        return float(str(valor).replace(',', '.'))  # Tratar decimal com vírgula
     except:
         return 0
@@ -53,8 +63,8 @@ def plotar_evolucao_bimestres(df_filtrado, temp_dir):
     """Plota gráfico de evolução das notas por bimestre."""
     plt.figure(figsize=(12, 6))
-    disciplinas_basicas = ['LINGUA PORTUGUESA', 'ARTE', 'LINGUA ESTRANGEIRA INGLES',
-                          'GEOGRAFIA', 'CIENCIAS', 'HISTORIA', 'MATEMATICA']
     estilos = {
         'LINGUA PORTUGUESA': {'cor': '#DC143C', 'marcador': 'p', 'zorder': 1, 'linestyle': '-', 'desloc': 0.1},
@@ -70,7 +80,7 @@ def plotar_evolucao_bimestres(df_filtrado, temp_dir):
     colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
-    for disciplina in disciplinas_basicas:
         dados_disciplina = df_filtrado[df_filtrado['Disciplina'] == disciplina]
         if not dados_disciplina.empty:
             notas = dados_disciplina[colunas_notas].values[0]
@@ -113,14 +123,16 @@ def plotar_graficos_destacados(df_boletim_clean, temp_dir):
     """Plota gráficos de médias e frequências com destaques."""
     plt.figure(figsize=(12, 6))
-    disciplinas = df_boletim_clean['Disciplina'].astype(str)
     # Processar frequências (remover % e converter para número)
     colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
-    freq_data = df_boletim_clean[colunas_freq].replace('%', '', regex=True)
     medias_frequencia = freq_data.apply(pd.to_numeric, errors='coerce').mean(axis=1)
-    medias_notas = df_boletim_clean[['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
     cores_notas = ['red' if media < 5 else 'blue' for media in medias_notas]
     cores_frequencias = ['red' if media < 75 else 'green' for media in medias_frequencia]
@@ -169,15 +181,18 @@ def gerar_relatorio_pdf(df, grafico1_path, grafico2_path):
     pdf.cell(0, 10, 'Avisos Importantes:', 0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
     pdf.set_font('Helvetica', '', 10)
     # Calcular médias
-    medias_notas = df[['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
     # Processar frequências
     colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
-    freq_data = df[colunas_freq].replace('%', '', regex=True)
     medias_freq = freq_data.apply(pd.to_numeric, errors='coerce').mean(axis=1)
-    for idx, (disciplina, media_nota, media_freq) in enumerate(zip(df['Disciplina'], medias_notas, medias_freq)):
         if media_nota < 5:
             pdf.cell(0, 10, f'- {disciplina}: Média de notas abaixo de 5 ({media_nota:.1f})', 0,
                     new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
@@ -252,7 +267,7 @@ def processar_boletim(file):
         print("Gerando relatório PDF...")
         pdf_path = gerar_relatorio_pdf(df, grafico1_path, grafico2_path)
         print("Relatório PDF gerado")
         # Criar arquivo temporário para retorno
         output_file = tempfile.NamedTemporaryFile(delete=False, suffix='.pdf')
         output_path = output_file.name
@@ -276,7 +291,7 @@ def processar_boletim(file):
 # Interface Gradio
 iface = gr.Interface(
     fn=processar_boletim,
-    inputs=gr.File(label="Upload do Boletim (PDF)"),  # Removido o type="filepath"
     outputs=[
         gr.File(label="Relatório (PDF)"),
         gr.Textbox(label="Status")

 import shutil
 matplotlib.use('Agg')
+# Lista global de disciplinas básicas
+DISCIPLINAS_BASICAS = [
+    'LINGUA PORTUGUESA', 'ARTE', 'LINGUA ESTRANGEIRA INGLES',
+    'GEOGRAFIA', 'CIENCIAS', 'HISTORIA', 'MATEMATICA'
+]
 def extrair_tabelas_pdf(pdf_path):
     """Extrai tabelas do PDF e retorna um DataFrame processado."""
     try:
     if pd.isna(valor) or valor == '-' or valor == 'N':
         return 0
     try:
+        if isinstance(valor, str):
+            # Remover possíveis espaços e substituir vírgula por ponto
+            valor_limpo = valor.strip().replace(',', '.')
+            return float(valor_limpo)
+        return float(valor)
     except:
         return 0
     """Plota gráfico de evolução das notas por bimestre."""
     plt.figure(figsize=(12, 6))
+    # Filtrar apenas disciplinas básicas
+    df_filtrado = df_filtrado[df_filtrado['Disciplina'].isin(DISCIPLINAS_BASICAS)]
     estilos = {
         'LINGUA PORTUGUESA': {'cor': '#DC143C', 'marcador': 'p', 'zorder': 1, 'linestyle': '-', 'desloc': 0.1},
     colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
+    for disciplina in DISCIPLINAS_BASICAS:
         dados_disciplina = df_filtrado[df_filtrado['Disciplina'] == disciplina]
         if not dados_disciplina.empty:
             notas = dados_disciplina[colunas_notas].values[0]
     """Plota gráficos de médias e frequências com destaques."""
     plt.figure(figsize=(12, 6))
+    # Filtrar apenas disciplinas básicas
+    df_filtrado = df_boletim_clean[df_boletim_clean['Disciplina'].isin(DISCIPLINAS_BASICAS)]
+    disciplinas = df_filtrado['Disciplina'].astype(str)
     # Processar frequências (remover % e converter para número)
     colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
+    freq_data = df_filtrado[colunas_freq].replace('%', '', regex=True)
     medias_frequencia = freq_data.apply(pd.to_numeric, errors='coerce').mean(axis=1)
+    medias_notas = df_filtrado[['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
     cores_notas = ['red' if media < 5 else 'blue' for media in medias_notas]
     cores_frequencias = ['red' if media < 75 else 'green' for media in medias_frequencia]
     pdf.cell(0, 10, 'Avisos Importantes:', 0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
     pdf.set_font('Helvetica', '', 10)
+    # Filtrar apenas disciplinas básicas
+    df_filtrado = df[df['Disciplina'].isin(DISCIPLINAS_BASICAS)]
     # Calcular médias
+    medias_notas = df_filtrado[['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
     # Processar frequências
     colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
+    freq_data = df_filtrado[colunas_freq].replace('%', '', regex=True)
     medias_freq = freq_data.apply(pd.to_numeric, errors='coerce').mean(axis=1)
+    for idx, (disciplina, media_nota, media_freq) in enumerate(zip(df_filtrado['Disciplina'], medias_notas, medias_freq)):
         if media_nota < 5:
             pdf.cell(0, 10, f'- {disciplina}: Média de notas abaixo de 5 ({media_nota:.1f})', 0,
                     new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
         print("Gerando relatório PDF...")
         pdf_path = gerar_relatorio_pdf(df, grafico1_path, grafico2_path)
         print("Relatório PDF gerado")
         # Criar arquivo temporário para retorno
         output_file = tempfile.NamedTemporaryFile(delete=False, suffix='.pdf')
         output_path = output_file.name
 # Interface Gradio
 iface = gr.Interface(
     fn=processar_boletim,
+    inputs=gr.File(label="Upload do Boletim (PDF)"),
     outputs=[
         gr.File(label="Relatório (PDF)"),
         gr.Textbox(label="Status")