Spaces:

histlearn
/

BoletimSed

Sleeping

App Files Files Community

histlearn commited on Oct 23, 2024

Commit

aab19b1

verified ·

1 Parent(s): 1a31ba8

Update app.py

Browse files

Files changed (1) hide show

app.py +43 -15

app.py CHANGED Viewed

@@ -9,7 +9,6 @@ import tempfile
 import os
 import matplotlib
 import shutil
-import colorsys
 matplotlib.use('Agg')
 def extrair_tabelas_pdf(pdf_path):
@@ -43,14 +42,19 @@ def extrair_tabelas_pdf(pdf_path):
 def converter_nota(valor):
     """Converte valor de nota para float, tratando casos especiais."""
-    if pd.isna(valor) or valor == '-' or valor == 'N':
         return 0
     try:
         if isinstance(valor, str):
             # Remover possíveis espaços e substituir vírgula por ponto
             valor_limpo = valor.strip().replace(',', '.')
             return float(valor_limpo)
-        return float(valor)
     except:
         return 0
@@ -60,17 +64,26 @@ def obter_disciplinas_validas(df):
     colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
     colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
-    # Converter notas para numérico
     for col in colunas_notas:
         if col in df.columns:
-            df[col] = df[col].apply(converter_nota)
     # Identificar disciplinas que têm pelo menos uma nota ou frequência
     disciplinas_validas = []
     for _, row in df.iterrows():
         disciplina = row['Disciplina']
-        notas = row[colunas_notas].astype(float)
-        freq = row[colunas_freq].replace('%', '', regex=True).astype(float)
         if (notas > 0).any() or (freq > 0).any():
             disciplinas_validas.append(disciplina)
@@ -100,6 +113,9 @@ def plotar_evolucao_bimestres(df_filtrado, temp_dir):
     disciplinas_validas = obter_disciplinas_validas(df_filtrado)
     n_disciplinas = len(disciplinas_validas)
     # Calcular tamanho da figura baseado no número de disciplinas
     altura_figura = max(6, n_disciplinas * 0.4)
     plt.figure(figsize=(14, altura_figura))
@@ -117,11 +133,11 @@ def plotar_evolucao_bimestres(df_filtrado, temp_dir):
         dados_disciplina = df_filtrado[df_filtrado['Disciplina'] == disciplina]
         if not dados_disciplina.empty:
             notas = dados_disciplina[colunas_notas].values[0]
-            notas_validas = notas > 0
             if any(notas_validas):
                 bimestres = np.arange(1, len(colunas_notas) + 1)[notas_validas]
-                notas_filtradas = notas[notas_validas]
                 plt.plot(bimestres, notas_filtradas,
                         color=cores[idx % len(cores)],
@@ -162,6 +178,10 @@ def plotar_graficos_destacados(df_boletim_clean, temp_dir):
     """Plota gráficos de médias e frequências com destaques."""
     # Obter disciplinas válidas
     disciplinas_validas = obter_disciplinas_validas(df_boletim_clean)
     n_disciplinas = len(disciplinas_validas)
     # Calcular tamanho da figura baseado no número de disciplinas
@@ -171,12 +191,16 @@ def plotar_graficos_destacados(df_boletim_clean, temp_dir):
     df_filtrado = df_boletim_clean[df_boletim_clean['Disciplina'].isin(disciplinas_validas)]
     disciplinas = df_filtrado['Disciplina'].astype(str)
-    # Processar frequências (remover % e converter para número)
     colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
     freq_data = df_filtrado[colunas_freq].replace('%', '', regex=True)
-    medias_frequencia = freq_data.apply(pd.to_numeric, errors='coerce').mean(axis=1)
-    medias_notas = df_filtrado[['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
     cores_notas = ['red' if media < 5 else 'blue' for media in medias_notas]
     cores_frequencias = ['red' if media < 75 else 'green' for media in medias_frequencia]
@@ -250,12 +274,15 @@ def gerar_relatorio_pdf(df, grafico1_path, grafico2_path):
     df_filtrado = df[df['Disciplina'].isin(disciplinas_validas)]
     # Calcular médias
-    medias_notas = df_filtrado[['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']].apply(pd.to_numeric, errors='coerce').mean(axis=1)
     # Processar frequências
     colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
     freq_data = df_filtrado[colunas_freq].replace('%', '', regex=True)
-    medias_freq = freq_data.apply(pd.to_numeric, errors='coerce').mean(axis=1)
     # Adicionar média global
     media_global = medias_notas.mean()
@@ -327,7 +354,8 @@ def processar_boletim(file):
         # Processar notas
         colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
         for col in colunas_notas:
-            df[col] = df[col].apply(converter_nota)
         print("Notas processadas")
         # Gerar gráficos

 import os
 import matplotlib
 import shutil
 matplotlib.use('Agg')
 def extrair_tabelas_pdf(pdf_path):
 def converter_nota(valor):
     """Converte valor de nota para float, tratando casos especiais."""
+    if pd.isna(valor) or valor == '-' or valor == 'N' or valor == '' or valor == 'None':
         return 0
     try:
         if isinstance(valor, str):
             # Remover possíveis espaços e substituir vírgula por ponto
             valor_limpo = valor.strip().replace(',', '.')
+            # Se depois de limpar ainda estiver vazio, retorna 0
+            if not valor_limpo:
+                return 0
             return float(valor_limpo)
+        elif isinstance(valor, (int, float)):
+            return float(valor)
+        return 0
     except:
         return 0
     colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
     colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
+    # Converter notas para numérico, tratando valores inválidos
     for col in colunas_notas:
         if col in df.columns:
+            df[col] = df[col].apply(lambda x: converter_nota(x))
+    # Converter frequências, tratando valores inválidos
+    for col in colunas_freq:
+        if col in df.columns:
+            df[col] = df[col].replace('%', '', regex=True)
+            df[col] = df[col].apply(lambda x: converter_nota(x) if pd.notna(x) else 0)
     # Identificar disciplinas que têm pelo menos uma nota ou frequência
     disciplinas_validas = []
     for _, row in df.iterrows():
         disciplina = row['Disciplina']
+        if pd.isna(disciplina) or disciplina == '':
+            continue
+        notas = pd.to_numeric(row[colunas_notas], errors='coerce').fillna(0)
+        freq = pd.to_numeric(row[colunas_freq], errors='coerce').fillna(0)
         if (notas > 0).any() or (freq > 0).any():
             disciplinas_validas.append(disciplina)
     disciplinas_validas = obter_disciplinas_validas(df_filtrado)
     n_disciplinas = len(disciplinas_validas)
+    if n_disciplinas == 0:
+        raise ValueError("Nenhuma disciplina válida encontrada para plotar.")
     # Calcular tamanho da figura baseado no número de disciplinas
     altura_figura = max(6, n_disciplinas * 0.4)
     plt.figure(figsize=(14, altura_figura))
         dados_disciplina = df_filtrado[df_filtrado['Disciplina'] == disciplina]
         if not dados_disciplina.empty:
             notas = dados_disciplina[colunas_notas].values[0]
+            notas_validas = pd.to_numeric(notas, errors='coerce').fillna(0) > 0
             if any(notas_validas):
                 bimestres = np.arange(1, len(colunas_notas) + 1)[notas_validas]
+                notas_filtradas = pd.to_numeric(notas[notas_validas], errors='coerce').fillna(0)
                 plt.plot(bimestres, notas_filtradas,
                         color=cores[idx % len(cores)],
     """Plota gráficos de médias e frequências com destaques."""
     # Obter disciplinas válidas
     disciplinas_validas = obter_disciplinas_validas(df_boletim_clean)
+    if not disciplinas_validas:
+        raise ValueError("Nenhuma disciplina válida encontrada no boletim.")
     n_disciplinas = len(disciplinas_validas)
     # Calcular tamanho da figura baseado no número de disciplinas
     df_filtrado = df_boletim_clean[df_boletim_clean['Disciplina'].isin(disciplinas_validas)]
     disciplinas = df_filtrado['Disciplina'].astype(str)
+    # Processar frequências com tratamento de erros melhorado
     colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
     freq_data = df_filtrado[colunas_freq].replace('%', '', regex=True)
+    freq_data = freq_data.apply(pd.to_numeric, errors='coerce').fillna(0)
+    medias_frequencia = freq_data.mean(axis=1)
+    # Processar notas com tratamento de erros melhorado
+    colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
+    notas_data = df_filtrado[colunas_notas].apply(pd.to_numeric, errors='coerce').fillna(0)
+    medias_notas = notas_data.mean(axis=1)
     cores_notas = ['red' if media < 5 else 'blue' for media in medias_notas]
     cores_frequencias = ['red' if media < 75 else 'green' for media in medias_frequencia]
     df_filtrado = df[df['Disciplina'].isin(disciplinas_validas)]
     # Calcular médias
+    colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
+    notas_data = df_filtrado[colunas_notas].apply(pd.to_numeric, errors='coerce').fillna(0)
+    medias_notas = notas_data.mean(axis=1)
     # Processar frequências
     colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
     freq_data = df_filtrado[colunas_freq].replace('%', '', regex=True)
+    freq_data = freq_data.apply(pd.to_numeric, errors='coerce').fillna(0)
+    medias_freq = freq_data.mean(axis=1)
     # Adicionar média global
     media_global = medias_notas.mean()
         # Processar notas
         colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
         for col in colunas_notas:
+            if col in df.columns:
+                df[col] = df[col].apply(converter_nota)
         print("Notas processadas")
         # Gerar gráficos