Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
@@ -11,8 +11,22 @@ import matplotlib
|
|
11 |
import shutil
|
12 |
import colorsys
|
13 |
from datetime import datetime
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
14 |
matplotlib.use('Agg')
|
15 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
16 |
# Configurações globais
|
17 |
ESCALA_MAXIMA_NOTAS = 12
|
18 |
LIMITE_APROVACAO_NOTA = 5
|
@@ -20,6 +34,10 @@ LIMITE_APROVACAO_FREQ = 75
|
|
20 |
BIMESTRES = ['1º Bimestre', '2º Bimestre', '3º Bimestre', '4º Bimestre']
|
21 |
CONCEITOS_VALIDOS = ['ES', 'EP', 'ET']
|
22 |
|
|
|
|
|
|
|
|
|
23 |
# Definição das disciplinas de formação básica
|
24 |
FORMACAO_BASICA = {
|
25 |
'fundamental': {
|
@@ -40,7 +58,7 @@ FORMACAO_BASICA = {
|
|
40 |
'BIOLOGIA',
|
41 |
'FISICA',
|
42 |
'QUIMICA',
|
43 |
-
'
|
44 |
'FILOSOFIA',
|
45 |
'SOCIOLOGIA',
|
46 |
'ARTE',
|
@@ -48,33 +66,44 @@ FORMACAO_BASICA = {
|
|
48 |
}
|
49 |
}
|
50 |
|
51 |
-
|
52 |
-
|
53 |
-
|
54 |
-
|
55 |
-
|
|
|
|
|
|
|
|
|
|
|
56 |
|
57 |
-
|
58 |
-
|
59 |
-
|
60 |
-
|
61 |
-
|
62 |
-
|
63 |
-
|
64 |
-
|
65 |
-
|
66 |
-
if disc_data['disciplina'] in FORMACAO_BASICA[nivel]:
|
67 |
-
formacao_basica.append(disc_data)
|
68 |
-
else:
|
69 |
-
diversificada.append(disc_data)
|
70 |
-
|
71 |
-
return {
|
72 |
-
'nivel': nivel,
|
73 |
-
'formacao_basica': formacao_basica,
|
74 |
-
'diversificada': diversificada
|
75 |
-
}
|
76 |
|
77 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
78 |
"""Converte valor de nota para float, tratando casos especiais e conceitos."""
|
79 |
if pd.isna(valor) or valor == '-' or valor == 'N' or valor == '' or valor == 'None':
|
80 |
return None
|
@@ -95,14 +124,12 @@ def converter_nota(valor):
|
|
95 |
|
96 |
return None
|
97 |
|
98 |
-
def calcular_media_bimestres(notas):
|
99 |
"""Calcula média considerando apenas bimestres com notas válidas."""
|
100 |
notas_validas = [nota for nota in notas if nota is not None]
|
101 |
-
if
|
102 |
-
return 0
|
103 |
-
return sum(notas_validas) / len(notas_validas)
|
104 |
|
105 |
-
def calcular_frequencia_media(frequencias):
|
106 |
"""Calcula média de frequência considerando apenas bimestres cursados."""
|
107 |
freq_validas = []
|
108 |
for freq in frequencias:
|
@@ -116,12 +143,10 @@ def calcular_frequencia_media(frequencias):
|
|
116 |
except:
|
117 |
continue
|
118 |
|
119 |
-
if
|
120 |
-
return 0
|
121 |
-
return sum(freq_validas) / len(freq_validas)
|
122 |
|
123 |
-
def extrair_tabelas_pdf(pdf_path):
|
124 |
-
"""Extrai tabelas do PDF usando stream
|
125 |
try:
|
126 |
# Extrair nome do aluno usando stream
|
127 |
tables_header = camelot.read_pdf(
|
@@ -133,7 +158,7 @@ def extrair_tabelas_pdf(pdf_path):
|
|
133 |
|
134 |
info_aluno = {}
|
135 |
|
136 |
-
# Procurar
|
137 |
for table in tables_header:
|
138 |
df = table.df
|
139 |
for i in range(len(df)):
|
@@ -158,7 +183,7 @@ def extrair_tabelas_pdf(pdf_path):
|
|
158 |
flavor='lattice'
|
159 |
)
|
160 |
|
161 |
-
# Encontrar tabela de notas
|
162 |
df_notas = None
|
163 |
max_rows = 0
|
164 |
|
@@ -179,16 +204,22 @@ def extrair_tabelas_pdf(pdf_path):
|
|
179 |
if df_notas is None:
|
180 |
raise ValueError("Tabela de notas não encontrada")
|
181 |
|
182 |
-
# Adicionar
|
183 |
df_notas.attrs['nome'] = info_aluno.get('nome', 'Nome não encontrado')
|
184 |
|
185 |
return df_notas
|
186 |
|
187 |
except Exception as e:
|
188 |
-
|
189 |
raise
|
190 |
-
|
191 |
-
def
|
|
|
|
|
|
|
|
|
|
|
|
|
192 |
"""Identifica disciplinas válidas no boletim com seus dados."""
|
193 |
colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
|
194 |
colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
|
@@ -231,272 +262,370 @@ def obter_disciplinas_validas(df):
|
|
231 |
|
232 |
return disciplinas_dados
|
233 |
|
234 |
-
def
|
235 |
-
"""
|
236 |
-
|
237 |
-
|
238 |
-
|
239 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
240 |
]
|
241 |
|
242 |
-
if n_cores
|
243 |
-
|
244 |
-
cores_extras = ['#%02x%02x%02x' % tuple(int(x*255) for x in colorsys.hsv_to_rgb(*hsv))
|
245 |
-
for hsv in HSV_tuples]
|
246 |
-
return cores_extras
|
247 |
|
248 |
-
|
|
|
|
|
|
|
249 |
|
250 |
-
def plotar_evolucao_bimestres(disciplinas_dados, temp_dir
|
251 |
-
|
|
|
|
|
252 |
n_disciplinas = len(disciplinas_dados)
|
253 |
|
254 |
if n_disciplinas == 0:
|
255 |
raise ValueError("Nenhuma disciplina válida encontrada para plotar.")
|
256 |
|
257 |
-
|
|
|
|
|
258 |
|
259 |
-
|
260 |
-
|
261 |
-
|
262 |
-
|
263 |
-
plt.grid(True, linestyle='--', alpha=0.3, zorder=0)
|
264 |
|
265 |
-
|
266 |
-
|
|
|
267 |
|
268 |
-
#
|
269 |
-
|
|
|
270 |
|
271 |
-
# Primeira passagem: coletar todos os valores e determinar grupos
|
272 |
-
grupos_notas = {} # {bimestre: {nota: [índices]}}
|
273 |
-
for idx, disc_data in enumerate(disciplinas_dados):
|
274 |
-
notas = pd.Series(disc_data['notas'])
|
275 |
-
bimestres_cursados = disc_data['bimestres_cursados']
|
276 |
-
|
277 |
-
if bimestres_cursados:
|
278 |
-
notas_validas = [nota for i, nota in enumerate(notas, 1) if i in bimestres_cursados and nota is not None]
|
279 |
-
bimestres = [bim for bim in bimestres_cursados if notas[bim-1] is not None]
|
280 |
-
|
281 |
-
for bim, nota in zip(bimestres, notas_validas):
|
282 |
-
if nota is not None:
|
283 |
-
if bim not in grupos_notas:
|
284 |
-
grupos_notas[bim] = {}
|
285 |
-
if nota not in grupos_notas[bim]:
|
286 |
-
grupos_notas[bim][nota] = []
|
287 |
-
grupos_notas[bim][nota].append(idx)
|
288 |
-
|
289 |
-
# Segunda passagem: plotar e anotar
|
290 |
for idx, disc_data in enumerate(disciplinas_dados):
|
291 |
notas = pd.Series(disc_data['notas'])
|
292 |
bimestres_cursados = disc_data['bimestres_cursados']
|
293 |
desloc = deslocamentos[idx]
|
294 |
|
295 |
if bimestres_cursados:
|
296 |
-
notas_validas = [nota for i, nota in enumerate(notas, 1)
|
297 |
-
|
|
|
|
|
298 |
bimestres_deslocados = [bim + desloc for bim in bimestres]
|
299 |
|
300 |
if notas_validas:
|
301 |
-
#
|
302 |
plt.plot(bimestres_deslocados, notas_validas,
|
303 |
color=cores[idx % len(cores)],
|
304 |
marker=marcadores[idx % len(marcadores)],
|
305 |
-
markersize=
|
306 |
-
linewidth=
|
307 |
label=disc_data['disciplina'],
|
308 |
linestyle=estilos_linha[idx % len(estilos_linha)],
|
309 |
-
alpha=0.8
|
|
|
|
|
|
|
|
|
|
|
|
|
310 |
|
311 |
-
#
|
312 |
-
for
|
313 |
if nota is not None:
|
314 |
-
|
315 |
-
|
316 |
-
|
317 |
-
|
318 |
-
|
319 |
-
|
320 |
-
|
321 |
-
|
322 |
-
|
323 |
-
|
324 |
-
|
325 |
-
|
326 |
-
|
327 |
-
|
328 |
-
|
329 |
-
|
330 |
-
|
331 |
-
|
332 |
-
|
333 |
-
|
334 |
-
|
335 |
-
|
336 |
-
|
337 |
-
|
338 |
-
|
339 |
-
|
340 |
-
|
341 |
-
|
342 |
-
|
343 |
-
|
344 |
-
#
|
345 |
-
|
346 |
-
|
347 |
-
|
348 |
-
plt.
|
349 |
-
|
350 |
-
plt.xticks([1, 2, 3, 4], ['1º Bim', '2º Bim', '3º Bim', '4º Bim'])
|
351 |
plt.ylim(0, ESCALA_MAXIMA_NOTAS)
|
352 |
|
353 |
-
#
|
354 |
-
plt.axhline(y=LIMITE_APROVACAO_NOTA, color=
|
355 |
-
|
356 |
-
|
|
|
|
|
|
|
357 |
|
358 |
-
#
|
359 |
if n_disciplinas > 8:
|
360 |
-
plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left',
|
|
|
|
|
361 |
ncol=max(1, n_disciplinas // 12))
|
362 |
else:
|
363 |
-
plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left',
|
|
|
|
|
364 |
|
365 |
plt.tight_layout()
|
366 |
|
367 |
-
#
|
368 |
nome_arquivo = nome_arquivo or 'evolucao_notas.png'
|
369 |
plot_path = os.path.join(temp_dir, nome_arquivo)
|
370 |
-
plt.savefig(plot_path, bbox_inches='tight', dpi=300
|
|
|
371 |
plt.close()
|
|
|
372 |
return plot_path
|
373 |
|
374 |
-
def plotar_graficos_destacados(disciplinas_dados, temp_dir):
|
375 |
-
"""Plota gráficos de médias e frequências com
|
376 |
n_disciplinas = len(disciplinas_dados)
|
377 |
|
378 |
if not n_disciplinas:
|
379 |
raise ValueError("Nenhuma disciplina válida encontrada no boletim.")
|
380 |
|
381 |
-
#
|
382 |
-
plt.
|
|
|
|
|
|
|
383 |
|
384 |
disciplinas = [d['disciplina'] for d in disciplinas_dados]
|
385 |
medias_notas = [d['media_notas'] for d in disciplinas_dados]
|
386 |
medias_freq = [d['media_freq'] for d in disciplinas_dados]
|
387 |
|
388 |
-
#
|
389 |
-
|
390 |
-
|
391 |
-
|
392 |
-
|
393 |
-
cores_notas = ['red' if media < LIMITE_APROVACAO_NOTA else '#2ecc71' for media in medias_notas]
|
394 |
-
cores_freq = ['red' if media < LIMITE_APROVACAO_FREQ else '#2ecc71' for media in medias_freq]
|
395 |
|
396 |
# Calcular médias globais
|
397 |
media_global = np.mean(medias_notas)
|
398 |
freq_global = np.mean(medias_freq)
|
399 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
400 |
# Gráfico de notas
|
401 |
barras_notas = ax1.bar(disciplinas, medias_notas, color=cores_notas)
|
402 |
-
ax1.set_title('Média de Notas por Disciplina',
|
|
|
403 |
ax1.set_ylim(0, ESCALA_MAXIMA_NOTAS)
|
404 |
-
ax1.
|
405 |
-
|
406 |
-
|
407 |
-
|
408 |
-
|
409 |
-
|
410 |
-
|
411 |
-
|
412 |
-
|
413 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
414 |
|
415 |
# Valores nas barras de notas
|
416 |
for barra in barras_notas:
|
417 |
altura = barra.get_height()
|
|
|
418 |
ax1.text(barra.get_x() + barra.get_width()/2., altura,
|
419 |
f'{altura:.1f}',
|
420 |
-
ha='center',
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
421 |
|
422 |
# Gráfico de frequências
|
423 |
barras_freq = ax2.bar(disciplinas, medias_freq, color=cores_freq)
|
424 |
-
ax2.set_title('Frequência Média por Disciplina',
|
|
|
425 |
ax2.set_ylim(0, 110)
|
426 |
-
ax2.
|
427 |
-
|
428 |
-
|
429 |
-
|
430 |
-
|
431 |
-
|
432 |
-
|
433 |
-
|
434 |
-
|
435 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
436 |
|
437 |
# Valores nas barras de frequência
|
438 |
for barra in barras_freq:
|
439 |
altura = barra.get_height()
|
|
|
440 |
ax2.text(barra.get_x() + barra.get_width()/2., altura,
|
441 |
f'{altura:.1f}%',
|
442 |
-
ha='center',
|
443 |
-
|
444 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
445 |
plt.suptitle(
|
446 |
f'Desempenho Geral\nMédia Global: {media_global:.1f} | Frequência Global: {freq_global:.1f}%',
|
447 |
-
y=0.98,
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
448 |
)
|
449 |
|
450 |
-
# Aviso de
|
451 |
if freq_global < LIMITE_APROVACAO_FREQ:
|
452 |
plt.figtext(0.5, 0.02,
|
453 |
"Atenção: Risco de Reprovação por Baixa Frequência",
|
454 |
-
ha="center",
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
455 |
|
456 |
plt.tight_layout()
|
457 |
|
458 |
-
# Salvar
|
459 |
plot_path = os.path.join(temp_dir, 'medias_frequencias.png')
|
460 |
-
plt.savefig(plot_path,
|
|
|
|
|
|
|
|
|
461 |
plt.close()
|
462 |
|
463 |
return plot_path
|
464 |
|
465 |
-
def gerar_relatorio_pdf(df, disciplinas_dados
|
466 |
-
|
467 |
-
|
|
|
|
|
468 |
pdf.set_auto_page_break(auto=True, margin=15)
|
469 |
|
470 |
# Primeira página - Informações e Formação Básica
|
471 |
pdf.add_page()
|
472 |
pdf.set_font('Helvetica', 'B', 18)
|
473 |
-
pdf.cell(0, 10, 'Relatório de Desempenho Escolar',
|
|
|
474 |
pdf.ln(15)
|
475 |
|
476 |
# Informações do aluno
|
477 |
pdf.set_font('Helvetica', 'B', 12)
|
478 |
-
pdf.cell(0, 10, 'Informações do Aluno',
|
|
|
479 |
pdf.line(10, pdf.get_y(), 200, pdf.get_y())
|
480 |
pdf.ln(5)
|
481 |
|
482 |
-
#
|
483 |
if hasattr(df, 'attrs') and 'nome' in df.attrs:
|
484 |
pdf.set_font('Helvetica', 'B', 11)
|
485 |
pdf.cell(30, 7, 'Nome:', 0, 0)
|
486 |
pdf.set_font('Helvetica', '', 11)
|
487 |
-
pdf.cell(0, 7, df.attrs['nome'],
|
|
|
488 |
|
489 |
pdf.ln(10)
|
490 |
|
491 |
# Data do relatório
|
492 |
data_atual = datetime.now().strftime('%d/%m/%Y')
|
493 |
pdf.set_font('Helvetica', 'I', 10)
|
494 |
-
pdf.cell(0, 5, f'Data de geração: {data_atual}',
|
|
|
495 |
pdf.ln(15)
|
496 |
|
497 |
-
#
|
498 |
pdf.set_font('Helvetica', 'B', 14)
|
499 |
-
pdf.cell(0, 10, 'Evolução das Notas - Formação Geral Básica',
|
|
|
500 |
pdf.line(10, pdf.get_y(), 200, pdf.get_y())
|
501 |
pdf.ln(10)
|
502 |
pdf.image(grafico_basica, x=10, w=190)
|
@@ -504,7 +633,8 @@ def gerar_relatorio_pdf(df, disciplinas_dados, grafico_basica, grafico_diversifi
|
|
504 |
# Segunda página - Parte Diversificada
|
505 |
pdf.add_page()
|
506 |
pdf.set_font('Helvetica', 'B', 14)
|
507 |
-
pdf.cell(0, 10, 'Evolução das Notas - Parte Diversificada',
|
|
|
508 |
pdf.line(10, pdf.get_y(), 200, pdf.get_y())
|
509 |
pdf.ln(10)
|
510 |
pdf.image(grafico_diversificada, x=10, w=190)
|
@@ -512,7 +642,8 @@ def gerar_relatorio_pdf(df, disciplinas_dados, grafico_basica, grafico_diversifi
|
|
512 |
# Terceira página - Médias e Frequências
|
513 |
pdf.add_page()
|
514 |
pdf.set_font('Helvetica', 'B', 14)
|
515 |
-
pdf.cell(0, 10, 'Análise de Médias e Frequências',
|
|
|
516 |
pdf.line(10, pdf.get_y(), 200, pdf.get_y())
|
517 |
pdf.ln(10)
|
518 |
pdf.image(grafico_medias, x=10, w=190)
|
@@ -520,41 +651,47 @@ def gerar_relatorio_pdf(df, disciplinas_dados, grafico_basica, grafico_diversifi
|
|
520 |
# Quarta página - Análise Detalhada
|
521 |
pdf.add_page()
|
522 |
pdf.set_font('Helvetica', 'B', 14)
|
523 |
-
pdf.cell(0, 10, 'Análise Detalhada',
|
|
|
524 |
pdf.line(10, pdf.get_y(), 200, pdf.get_y())
|
525 |
pdf.ln(10)
|
526 |
|
527 |
-
#
|
528 |
medias_notas = [d['media_notas'] for d in disciplinas_dados]
|
529 |
medias_freq = [d['media_freq'] for d in disciplinas_dados]
|
530 |
media_global = np.mean(medias_notas)
|
531 |
freq_global = np.mean(medias_freq)
|
532 |
|
533 |
-
# Resumo geral
|
534 |
pdf.set_font('Helvetica', 'B', 12)
|
535 |
-
pdf.cell(0, 7, 'Resumo Geral:',
|
|
|
536 |
pdf.ln(5)
|
537 |
|
538 |
pdf.set_font('Helvetica', '', 11)
|
539 |
-
pdf.cell(0, 7, f'Média Global: {media_global:.1f}',
|
540 |
-
|
|
|
|
|
541 |
pdf.ln(10)
|
542 |
|
543 |
-
#
|
544 |
pdf.set_font('Helvetica', 'B', 12)
|
545 |
-
pdf.cell(0, 10, 'Pontos de Atenção:',
|
|
|
546 |
pdf.ln(5)
|
547 |
|
548 |
pdf.set_font('Helvetica', '', 10)
|
549 |
-
|
550 |
-
# Disciplinas com baixo desempenho
|
551 |
disciplinas_risco = []
|
552 |
for disc_data in disciplinas_dados:
|
553 |
avisos = []
|
554 |
if disc_data['media_notas'] < LIMITE_APROVACAO_NOTA:
|
555 |
-
avisos.append(
|
|
|
|
|
556 |
if disc_data['media_freq'] < LIMITE_APROVACAO_FREQ:
|
557 |
-
avisos.append(
|
|
|
|
|
558 |
|
559 |
if avisos:
|
560 |
disciplinas_risco.append((disc_data['disciplina'], avisos))
|
@@ -562,110 +699,97 @@ def gerar_relatorio_pdf(df, disciplinas_dados, grafico_basica, grafico_diversifi
|
|
562 |
if disciplinas_risco:
|
563 |
for disc, avisos in disciplinas_risco:
|
564 |
pdf.set_font('Helvetica', 'B', 10)
|
565 |
-
pdf.cell(0, 7, f'- {disc}:',
|
|
|
566 |
pdf.set_font('Helvetica', '', 10)
|
567 |
for aviso in avisos:
|
568 |
pdf.cell(10) # Indentação
|
569 |
-
pdf.cell(0, 7, f'- {aviso}',
|
|
|
570 |
else:
|
571 |
-
pdf.cell(0, 7, 'Nenhum problema identificado.',
|
|
|
572 |
|
573 |
-
|
574 |
-
pdf.set_y(-30)
|
575 |
-
pdf.line(10, pdf.get_y(), 200, pdf.get_y())
|
576 |
-
pdf.ln(5)
|
577 |
-
pdf.set_font('Helvetica', 'I', 8)
|
578 |
-
pdf.cell(0, 10, 'Este relatório é uma análise automática e deve ser validado junto à secretaria da escola.',
|
579 |
-
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='C')
|
580 |
|
581 |
# Salvar PDF
|
582 |
-
|
583 |
-
|
584 |
-
|
585 |
-
return pdf_path
|
586 |
|
587 |
-
def processar_boletim(file):
|
588 |
"""Função principal que processa o boletim e gera o relatório."""
|
589 |
-
temp_dir = None
|
590 |
try:
|
591 |
if file is None:
|
592 |
return None, "Nenhum arquivo foi fornecido."
|
593 |
|
594 |
-
|
595 |
-
|
596 |
-
|
597 |
-
|
598 |
-
|
599 |
-
|
600 |
-
|
601 |
-
|
602 |
-
|
603 |
-
|
604 |
-
|
605 |
-
|
606 |
-
|
607 |
-
|
608 |
-
print("Tabelas extraídas com sucesso")
|
609 |
-
|
610 |
-
if df is None or df.empty:
|
611 |
-
return None, "Não foi possível extrair dados do PDF."
|
612 |
-
|
613 |
-
try:
|
614 |
-
# Processar disciplinas
|
615 |
disciplinas_dados = obter_disciplinas_validas(df)
|
616 |
if not disciplinas_dados:
|
617 |
return None, "Nenhuma disciplina válida encontrada no boletim."
|
618 |
|
619 |
-
# Separar disciplinas
|
620 |
categorias = separar_disciplinas_por_categoria(disciplinas_dados)
|
621 |
-
|
622 |
-
nivel_texto = "Ensino Médio" if nivel == "medio" else "Ensino Fundamental"
|
623 |
|
624 |
-
# Gerar gráficos
|
625 |
-
|
626 |
-
|
627 |
-
|
628 |
-
|
629 |
-
|
630 |
-
|
631 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
632 |
|
633 |
-
|
634 |
-
|
635 |
-
|
636 |
-
|
637 |
-
|
|
|
|
|
638 |
)
|
639 |
|
640 |
-
|
641 |
-
|
642 |
-
|
643 |
-
# Gerar PDF
|
644 |
-
print("Gerando relatório PDF...")
|
645 |
-
pdf_path = gerar_relatorio_pdf(df, disciplinas_dados, grafico_basica, grafico_diversificada, grafico_medias)
|
646 |
-
print("Relatório PDF gerado")
|
647 |
-
|
648 |
-
# Criar arquivo de retorno
|
649 |
-
output_file = tempfile.NamedTemporaryFile(delete=False, suffix='.pdf')
|
650 |
-
output_path = output_file.name
|
651 |
shutil.copy2(pdf_path, output_path)
|
652 |
-
|
653 |
return output_path, "Relatório gerado com sucesso!"
|
654 |
|
655 |
-
except Exception as e:
|
656 |
-
return None, f"Erro ao processar os dados: {str(e)}"
|
657 |
-
|
658 |
except Exception as e:
|
659 |
-
|
660 |
return None, f"Erro ao processar o boletim: {str(e)}"
|
661 |
-
|
662 |
-
finally:
|
663 |
-
if temp_dir and os.path.exists(temp_dir):
|
664 |
-
try:
|
665 |
-
shutil.rmtree(temp_dir)
|
666 |
-
print("Arquivos temporários limpos")
|
667 |
-
except Exception as e:
|
668 |
-
print(f"Erro ao limpar arquivos temporários: {str(e)}")
|
669 |
|
670 |
# Interface Gradio
|
671 |
iface = gr.Interface(
|
@@ -681,11 +805,13 @@ iface = gr.Interface(
|
|
681 |
],
|
682 |
title="Análise de Boletim Escolar",
|
683 |
description="Faça upload do boletim em PDF para gerar um relatório com análises e visualizações.",
|
684 |
-
allow_flagging="never"
|
|
|
685 |
)
|
686 |
|
687 |
if __name__ == "__main__":
|
688 |
iface.launch(
|
689 |
server_name="0.0.0.0",
|
690 |
-
share=True
|
|
|
691 |
)
|
|
|
11 |
import shutil
|
12 |
import colorsys
|
13 |
from datetime import datetime
|
14 |
+
from concurrent.futures import ThreadPoolExecutor
|
15 |
+
from typing import Dict, List, Tuple, Optional
|
16 |
+
from io import BytesIO
|
17 |
+
import logging
|
18 |
+
from contextlib import contextmanager
|
19 |
+
|
20 |
+
# Configurar matplotlib
|
21 |
matplotlib.use('Agg')
|
22 |
|
23 |
+
# Configurar logging
|
24 |
+
logging.basicConfig(
|
25 |
+
level=logging.INFO,
|
26 |
+
format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
|
27 |
+
)
|
28 |
+
logger = logging.getLogger(__name__)
|
29 |
+
|
30 |
# Configurações globais
|
31 |
ESCALA_MAXIMA_NOTAS = 12
|
32 |
LIMITE_APROVACAO_NOTA = 5
|
|
|
34 |
BIMESTRES = ['1º Bimestre', '2º Bimestre', '3º Bimestre', '4º Bimestre']
|
35 |
CONCEITOS_VALIDOS = ['ES', 'EP', 'ET']
|
36 |
|
37 |
+
# Cores para os gráficos
|
38 |
+
COR_APROVADO = '#2ECC71' # Verde suave
|
39 |
+
COR_REPROVADO = '#E74C3C' # Vermelho suave
|
40 |
+
|
41 |
# Definição das disciplinas de formação básica
|
42 |
FORMACAO_BASICA = {
|
43 |
'fundamental': {
|
|
|
58 |
'BIOLOGIA',
|
59 |
'FISICA',
|
60 |
'QUIMICA',
|
61 |
+
'INGLES',
|
62 |
'FILOSOFIA',
|
63 |
'SOCIOLOGIA',
|
64 |
'ARTE',
|
|
|
66 |
}
|
67 |
}
|
68 |
|
69 |
+
# Context managers
|
70 |
+
@contextmanager
|
71 |
+
def temp_directory():
|
72 |
+
"""Context manager para diretório temporário."""
|
73 |
+
temp_dir = tempfile.mkdtemp()
|
74 |
+
try:
|
75 |
+
yield temp_dir
|
76 |
+
finally:
|
77 |
+
if os.path.exists(temp_dir):
|
78 |
+
shutil.rmtree(temp_dir)
|
79 |
|
80 |
+
@contextmanager
|
81 |
+
def temp_file(suffix=None):
|
82 |
+
"""Context manager para arquivo temporário."""
|
83 |
+
temp = tempfile.NamedTemporaryFile(delete=False, suffix=suffix)
|
84 |
+
try:
|
85 |
+
yield temp.name
|
86 |
+
finally:
|
87 |
+
if os.path.exists(temp.name):
|
88 |
+
os.unlink(temp.name)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
89 |
|
90 |
+
class PDFReport(FPDF):
|
91 |
+
"""Classe personalizada para geração do relatório PDF."""
|
92 |
+
def __init__(self):
|
93 |
+
super().__init__()
|
94 |
+
self.set_auto_page_break(auto=True, margin=15)
|
95 |
+
|
96 |
+
def header_footer(self):
|
97 |
+
"""Adiciona header e footer padrão nas páginas."""
|
98 |
+
self.set_y(-30)
|
99 |
+
self.line(10, self.get_y(), 200, self.get_y())
|
100 |
+
self.ln(5)
|
101 |
+
self.set_font('Helvetica', 'I', 8)
|
102 |
+
self.cell(0, 10,
|
103 |
+
'Este relatório é uma análise automática e deve ser validado junto à secretaria da escola.',
|
104 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='C')
|
105 |
+
|
106 |
+
def converter_nota(valor) -> Optional[float]:
|
107 |
"""Converte valor de nota para float, tratando casos especiais e conceitos."""
|
108 |
if pd.isna(valor) or valor == '-' or valor == 'N' or valor == '' or valor == 'None':
|
109 |
return None
|
|
|
124 |
|
125 |
return None
|
126 |
|
127 |
+
def calcular_media_bimestres(notas: List[float]) -> float:
|
128 |
"""Calcula média considerando apenas bimestres com notas válidas."""
|
129 |
notas_validas = [nota for nota in notas if nota is not None]
|
130 |
+
return sum(notas_validas) / len(notas_validas) if notas_validas else 0
|
|
|
|
|
131 |
|
132 |
+
def calcular_frequencia_media(frequencias: List[str]) -> float:
|
133 |
"""Calcula média de frequência considerando apenas bimestres cursados."""
|
134 |
freq_validas = []
|
135 |
for freq in frequencias:
|
|
|
143 |
except:
|
144 |
continue
|
145 |
|
146 |
+
return sum(freq_validas) / len(freq_validas) if freq_validas else 0
|
|
|
|
|
147 |
|
148 |
+
def extrair_tabelas_pdf(pdf_path: str) -> pd.DataFrame:
|
149 |
+
"""Extrai tabelas do PDF usando stream para o nome e lattice para notas."""
|
150 |
try:
|
151 |
# Extrair nome do aluno usando stream
|
152 |
tables_header = camelot.read_pdf(
|
|
|
158 |
|
159 |
info_aluno = {}
|
160 |
|
161 |
+
# Procurar nome do aluno
|
162 |
for table in tables_header:
|
163 |
df = table.df
|
164 |
for i in range(len(df)):
|
|
|
183 |
flavor='lattice'
|
184 |
)
|
185 |
|
186 |
+
# Encontrar tabela de notas
|
187 |
df_notas = None
|
188 |
max_rows = 0
|
189 |
|
|
|
204 |
if df_notas is None:
|
205 |
raise ValueError("Tabela de notas não encontrada")
|
206 |
|
207 |
+
# Adicionar informações do aluno ao DataFrame
|
208 |
df_notas.attrs['nome'] = info_aluno.get('nome', 'Nome não encontrado')
|
209 |
|
210 |
return df_notas
|
211 |
|
212 |
except Exception as e:
|
213 |
+
logger.error(f"Erro na extração das tabelas: {str(e)}")
|
214 |
raise
|
215 |
+
|
216 |
+
def detectar_nivel_ensino(disciplinas: List[str]) -> str:
|
217 |
+
"""Detecta se é ensino fundamental ou médio baseado nas disciplinas."""
|
218 |
+
disciplinas_set = set(disciplinas)
|
219 |
+
disciplinas_exclusivas_medio = {'BIOLOGIA', 'FISICA', 'QUIMICA', 'FILOSOFIA', 'SOCIOLOGIA'}
|
220 |
+
return 'medio' if any(d in disciplinas_set for d in disciplinas_exclusivas_medio) else 'fundamental'
|
221 |
+
|
222 |
+
def obter_disciplinas_validas(df: pd.DataFrame) -> List[Dict]:
|
223 |
"""Identifica disciplinas válidas no boletim com seus dados."""
|
224 |
colunas_notas = ['Nota B1', 'Nota B2', 'Nota B3', 'Nota B4']
|
225 |
colunas_freq = ['%Freq B1', '%Freq B2', '%Freq B3', '%Freq B4']
|
|
|
262 |
|
263 |
return disciplinas_dados
|
264 |
|
265 |
+
def separar_disciplinas_por_categoria(disciplinas_dados: List[Dict]) -> Dict:
|
266 |
+
"""Separa as disciplinas em formação básica e diversificada."""
|
267 |
+
disciplinas = [d['disciplina'] for d in disciplinas_dados]
|
268 |
+
nivel = detectar_nivel_ensino(disciplinas)
|
269 |
+
|
270 |
+
formacao_basica = []
|
271 |
+
diversificada = []
|
272 |
+
|
273 |
+
for disc_data in disciplinas_dados:
|
274 |
+
if disc_data['disciplina'] in FORMACAO_BASICA[nivel]:
|
275 |
+
formacao_basica.append(disc_data)
|
276 |
+
else:
|
277 |
+
diversificada.append(disc_data)
|
278 |
+
|
279 |
+
return {
|
280 |
+
'nivel': nivel,
|
281 |
+
'formacao_basica': formacao_basica,
|
282 |
+
'diversificada': diversificada
|
283 |
+
}
|
284 |
+
|
285 |
+
def gerar_paleta_cores(n_cores: int) -> List[str]:
|
286 |
+
"""Gera uma paleta de cores harmoniosa."""
|
287 |
+
cores_formacao_basica = [
|
288 |
+
'#2E86C1', # Azul royal
|
289 |
+
'#2ECC71', # Verde esmeralda
|
290 |
+
'#E74C3C', # Vermelho coral
|
291 |
+
'#F1C40F', # Amarelo ouro
|
292 |
+
'#8E44AD', # Roxo médio
|
293 |
+
'#E67E22', # Laranja escuro
|
294 |
+
'#16A085', # Verde-água
|
295 |
+
'#D35400' # Laranja queimado
|
296 |
]
|
297 |
|
298 |
+
if n_cores <= len(cores_formacao_basica):
|
299 |
+
return cores_formacao_basica[:n_cores]
|
|
|
|
|
|
|
300 |
|
301 |
+
# Gerar cores adicionais se necessário
|
302 |
+
HSV_tuples = [(x/n_cores, 0.8, 0.9) for x in range(n_cores)]
|
303 |
+
return ['#%02x%02x%02x' % tuple(int(x*255) for x in colorsys.hsv_to_rgb(*hsv))
|
304 |
+
for hsv in HSV_tuples]
|
305 |
|
306 |
+
def plotar_evolucao_bimestres(disciplinas_dados: List[Dict], temp_dir: str,
|
307 |
+
titulo: Optional[str] = None,
|
308 |
+
nome_arquivo: Optional[str] = None) -> str:
|
309 |
+
"""Plota gráfico de evolução das notas com visual aprimorado."""
|
310 |
n_disciplinas = len(disciplinas_dados)
|
311 |
|
312 |
if n_disciplinas == 0:
|
313 |
raise ValueError("Nenhuma disciplina válida encontrada para plotar.")
|
314 |
|
315 |
+
# Configuração do estilo
|
316 |
+
plt.style.use('seaborn')
|
317 |
+
fig, ax = plt.subplots(figsize=(11.69, 8.27))
|
318 |
|
319 |
+
# Configurar grid mais suave
|
320 |
+
ax.grid(True, linestyle='--', alpha=0.2, color='gray')
|
321 |
+
ax.set_axisbelow(True)
|
|
|
|
|
322 |
|
323 |
+
cores = gerar_paleta_cores(n_disciplinas)
|
324 |
+
marcadores = ['o', 's', '^', 'D', 'v', '<', '>', 'p']
|
325 |
+
estilos_linha = ['-', '--', '-.', ':']
|
326 |
|
327 |
+
# Deslocamento sutil para evitar sobreposição
|
328 |
+
deslocamentos = np.linspace(-0.02, 0.02, n_disciplinas)
|
329 |
+
anotacoes_usadas = {}
|
330 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
331 |
for idx, disc_data in enumerate(disciplinas_dados):
|
332 |
notas = pd.Series(disc_data['notas'])
|
333 |
bimestres_cursados = disc_data['bimestres_cursados']
|
334 |
desloc = deslocamentos[idx]
|
335 |
|
336 |
if bimestres_cursados:
|
337 |
+
notas_validas = [nota for i, nota in enumerate(notas, 1)
|
338 |
+
if i in bimestres_cursados and nota is not None]
|
339 |
+
bimestres = [bim for bim in bimestres_cursados
|
340 |
+
if notas[bim-1] is not None]
|
341 |
bimestres_deslocados = [bim + desloc for bim in bimestres]
|
342 |
|
343 |
if notas_validas:
|
344 |
+
# Linha com sombreamento
|
345 |
plt.plot(bimestres_deslocados, notas_validas,
|
346 |
color=cores[idx % len(cores)],
|
347 |
marker=marcadores[idx % len(marcadores)],
|
348 |
+
markersize=8,
|
349 |
+
linewidth=2.5,
|
350 |
label=disc_data['disciplina'],
|
351 |
linestyle=estilos_linha[idx % len(estilos_linha)],
|
352 |
+
alpha=0.8,
|
353 |
+
zorder=3)
|
354 |
+
|
355 |
+
# Área sombreada sob a linha
|
356 |
+
plt.fill_between(bimestres_deslocados, 0, notas_validas,
|
357 |
+
color=cores[idx % len(cores)],
|
358 |
+
alpha=0.1)
|
359 |
|
360 |
+
# Anotações elegantes
|
361 |
+
for bim, nota in zip(bimestres_deslocados, notas_validas):
|
362 |
if nota is not None:
|
363 |
+
y_offset = 10
|
364 |
+
while any(abs(y - (nota + y_offset/20)) < 0.4
|
365 |
+
for y, _ in anotacoes_usadas.get(bim, [])):
|
366 |
+
y_offset += 5
|
367 |
+
|
368 |
+
plt.annotate(f"{nota:.1f}",
|
369 |
+
(bim, nota),
|
370 |
+
xytext=(0, y_offset),
|
371 |
+
textcoords="offset points",
|
372 |
+
ha='center',
|
373 |
+
va='bottom',
|
374 |
+
fontsize=9,
|
375 |
+
bbox=dict(
|
376 |
+
facecolor='white',
|
377 |
+
edgecolor=cores[idx % len(cores)],
|
378 |
+
alpha=0.8,
|
379 |
+
pad=2,
|
380 |
+
boxstyle='round,pad=0.5'
|
381 |
+
))
|
382 |
+
|
383 |
+
if bim not in anotacoes_usadas:
|
384 |
+
anotacoes_usadas[bim] = []
|
385 |
+
anotacoes_usadas[bim].append((nota + y_offset/20, nota))
|
386 |
+
|
387 |
+
# Estilização
|
388 |
+
titulo_grafico = titulo or 'Evolução das Médias por Disciplina'
|
389 |
+
plt.title(titulo_grafico, pad=20, fontsize=14, fontweight='bold')
|
390 |
+
plt.xlabel('Bimestres', fontsize=12, labelpad=10)
|
391 |
+
plt.ylabel('Notas', fontsize=12, labelpad=10)
|
392 |
+
|
393 |
+
# Remover bordas desnecessárias
|
394 |
+
ax.spines['top'].set_visible(False)
|
395 |
+
ax.spines['right'].set_visible(False)
|
396 |
+
|
397 |
+
plt.xticks([1, 2, 3, 4], ['1º Bim', '2º Bim', '3º Bim', '4º Bim'],
|
398 |
+
fontsize=10)
|
|
|
399 |
plt.ylim(0, ESCALA_MAXIMA_NOTAS)
|
400 |
|
401 |
+
# Linha de aprovação estilizada
|
402 |
+
plt.axhline(y=LIMITE_APROVACAO_NOTA, color=COR_REPROVADO,
|
403 |
+
linestyle='--', alpha=0.3, linewidth=2)
|
404 |
+
plt.text(0.02, LIMITE_APROVACAO_NOTA + 0.1,
|
405 |
+
'Média mínima para aprovação',
|
406 |
+
transform=plt.gca().get_yaxis_transform(),
|
407 |
+
color=COR_REPROVADO, alpha=0.7)
|
408 |
|
409 |
+
# Legenda estilizada
|
410 |
if n_disciplinas > 8:
|
411 |
+
plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left',
|
412 |
+
fontsize=9, framealpha=0.8,
|
413 |
+
fancybox=True, shadow=True,
|
414 |
ncol=max(1, n_disciplinas // 12))
|
415 |
else:
|
416 |
+
plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left',
|
417 |
+
fontsize=10, framealpha=0.8,
|
418 |
+
fancybox=True, shadow=True)
|
419 |
|
420 |
plt.tight_layout()
|
421 |
|
422 |
+
# Salvar com alta qualidade
|
423 |
nome_arquivo = nome_arquivo or 'evolucao_notas.png'
|
424 |
plot_path = os.path.join(temp_dir, nome_arquivo)
|
425 |
+
plt.savefig(plot_path, bbox_inches='tight', dpi=300,
|
426 |
+
facecolor='white', edgecolor='none')
|
427 |
plt.close()
|
428 |
+
|
429 |
return plot_path
|
430 |
|
431 |
+
def plotar_graficos_destacados(disciplinas_dados: List[Dict], temp_dir: str) -> str:
|
432 |
+
"""Plota gráficos de médias e frequências com visual aprimorado."""
|
433 |
n_disciplinas = len(disciplinas_dados)
|
434 |
|
435 |
if not n_disciplinas:
|
436 |
raise ValueError("Nenhuma disciplina válida encontrada no boletim.")
|
437 |
|
438 |
+
# Configuração do estilo
|
439 |
+
plt.style.use('seaborn')
|
440 |
+
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(12, 10),
|
441 |
+
height_ratios=[1, 1])
|
442 |
+
plt.subplots_adjust(hspace=0.4)
|
443 |
|
444 |
disciplinas = [d['disciplina'] for d in disciplinas_dados]
|
445 |
medias_notas = [d['media_notas'] for d in disciplinas_dados]
|
446 |
medias_freq = [d['media_freq'] for d in disciplinas_dados]
|
447 |
|
448 |
+
# Definir cores baseadas nos limites
|
449 |
+
cores_notas = [COR_REPROVADO if media < LIMITE_APROVACAO_NOTA
|
450 |
+
else COR_APROVADO for media in medias_notas]
|
451 |
+
cores_freq = [COR_REPROVADO if media < LIMITE_APROVACAO_FREQ
|
452 |
+
else COR_APROVADO for media in medias_freq]
|
|
|
|
|
453 |
|
454 |
# Calcular médias globais
|
455 |
media_global = np.mean(medias_notas)
|
456 |
freq_global = np.mean(medias_freq)
|
457 |
|
458 |
+
# Configurações comuns para os eixos
|
459 |
+
for ax in [ax1, ax2]:
|
460 |
+
ax.grid(True, axis='y', alpha=0.2, linestyle='--')
|
461 |
+
ax.set_axisbelow(True)
|
462 |
+
ax.spines['top'].set_visible(False)
|
463 |
+
ax.spines['right'].set_visible(False)
|
464 |
+
|
465 |
# Gráfico de notas
|
466 |
barras_notas = ax1.bar(disciplinas, medias_notas, color=cores_notas)
|
467 |
+
ax1.set_title('Média de Notas por Disciplina',
|
468 |
+
pad=20, fontsize=14, fontweight='bold')
|
469 |
ax1.set_ylim(0, ESCALA_MAXIMA_NOTAS)
|
470 |
+
ax1.set_xticklabels(disciplinas, rotation=45,
|
471 |
+
ha='right', va='top', fontsize=10)
|
472 |
+
ax1.set_ylabel('Notas', fontsize=12, labelpad=10)
|
473 |
+
|
474 |
+
# Linha de média mínima
|
475 |
+
ax1.axhline(y=LIMITE_APROVACAO_NOTA,
|
476 |
+
color=COR_REPROVADO,
|
477 |
+
linestyle='--',
|
478 |
+
alpha=0.3,
|
479 |
+
linewidth=2)
|
480 |
+
ax1.text(0.02, LIMITE_APROVACAO_NOTA + 0.1,
|
481 |
+
'Média mínima (5,0)',
|
482 |
+
transform=ax1.get_yaxis_transform(),
|
483 |
+
color=COR_REPROVADO,
|
484 |
+
alpha=0.7,
|
485 |
+
fontsize=10)
|
486 |
|
487 |
# Valores nas barras de notas
|
488 |
for barra in barras_notas:
|
489 |
altura = barra.get_height()
|
490 |
+
cor_texto = 'white' if altura >= LIMITE_APROVACAO_NOTA else 'black'
|
491 |
ax1.text(barra.get_x() + barra.get_width()/2., altura,
|
492 |
f'{altura:.1f}',
|
493 |
+
ha='center',
|
494 |
+
va='bottom',
|
495 |
+
fontsize=10,
|
496 |
+
bbox=dict(
|
497 |
+
facecolor='white',
|
498 |
+
edgecolor='none',
|
499 |
+
alpha=0.7,
|
500 |
+
pad=1
|
501 |
+
),
|
502 |
+
color=cor_texto if altura >= 8 else 'black')
|
503 |
|
504 |
# Gráfico de frequências
|
505 |
barras_freq = ax2.bar(disciplinas, medias_freq, color=cores_freq)
|
506 |
+
ax2.set_title('Frequência Média por Disciplina',
|
507 |
+
pad=20, fontsize=14, fontweight='bold')
|
508 |
ax2.set_ylim(0, 110)
|
509 |
+
ax2.set_xticklabels(disciplinas, rotation=45,
|
510 |
+
ha='right', va='top', fontsize=10)
|
511 |
+
ax2.set_ylabel('Frequência (%)', fontsize=12, labelpad=10)
|
512 |
+
|
513 |
+
# Linha de frequência mínima
|
514 |
+
ax2.axhline(y=LIMITE_APROVACAO_FREQ,
|
515 |
+
color=COR_REPROVADO,
|
516 |
+
linestyle='--',
|
517 |
+
alpha=0.3,
|
518 |
+
linewidth=2)
|
519 |
+
ax2.text(0.02, LIMITE_APROVACAO_FREQ + 1,
|
520 |
+
'Frequência mínima (75%)',
|
521 |
+
transform=ax2.get_yaxis_transform(),
|
522 |
+
color=COR_REPROVADO,
|
523 |
+
alpha=0.7,
|
524 |
+
fontsize=10)
|
525 |
|
526 |
# Valores nas barras de frequência
|
527 |
for barra in barras_freq:
|
528 |
altura = barra.get_height()
|
529 |
+
cor_texto = 'white' if altura >= LIMITE_APROVACAO_FREQ else 'black'
|
530 |
ax2.text(barra.get_x() + barra.get_width()/2., altura,
|
531 |
f'{altura:.1f}%',
|
532 |
+
ha='center',
|
533 |
+
va='bottom',
|
534 |
+
fontsize=10,
|
535 |
+
bbox=dict(
|
536 |
+
facecolor='white',
|
537 |
+
edgecolor='none',
|
538 |
+
alpha=0.7,
|
539 |
+
pad=1
|
540 |
+
),
|
541 |
+
color=cor_texto if altura >= 90 else 'black')
|
542 |
+
|
543 |
+
# Título global com estilo
|
544 |
plt.suptitle(
|
545 |
f'Desempenho Geral\nMédia Global: {media_global:.1f} | Frequência Global: {freq_global:.1f}%',
|
546 |
+
y=0.98,
|
547 |
+
fontsize=16,
|
548 |
+
fontweight='bold',
|
549 |
+
bbox=dict(
|
550 |
+
facecolor='white',
|
551 |
+
edgecolor='none',
|
552 |
+
alpha=0.8,
|
553 |
+
pad=5,
|
554 |
+
boxstyle='round,pad=0.5'
|
555 |
+
)
|
556 |
)
|
557 |
|
558 |
+
# Aviso de reprovação estilizado
|
559 |
if freq_global < LIMITE_APROVACAO_FREQ:
|
560 |
plt.figtext(0.5, 0.02,
|
561 |
"Atenção: Risco de Reprovação por Baixa Frequência",
|
562 |
+
ha="center",
|
563 |
+
fontsize=12,
|
564 |
+
color=COR_REPROVADO,
|
565 |
+
weight='bold',
|
566 |
+
bbox=dict(
|
567 |
+
facecolor='#FFEBEE',
|
568 |
+
edgecolor=COR_REPROVADO,
|
569 |
+
alpha=0.9,
|
570 |
+
pad=5,
|
571 |
+
boxstyle='round,pad=0.5'
|
572 |
+
))
|
573 |
|
574 |
plt.tight_layout()
|
575 |
|
576 |
+
# Salvar com alta qualidade
|
577 |
plot_path = os.path.join(temp_dir, 'medias_frequencias.png')
|
578 |
+
plt.savefig(plot_path,
|
579 |
+
bbox_inches='tight',
|
580 |
+
dpi=300,
|
581 |
+
facecolor='white',
|
582 |
+
edgecolor='none')
|
583 |
plt.close()
|
584 |
|
585 |
return plot_path
|
586 |
|
587 |
+
def gerar_relatorio_pdf(df: pd.DataFrame, disciplinas_dados: List[Dict],
|
588 |
+
grafico_basica: str, grafico_diversificada: str,
|
589 |
+
grafico_medias: str) -> str:
|
590 |
+
"""Gera relatório PDF com análise completa."""
|
591 |
+
pdf = PDFReport()
|
592 |
pdf.set_auto_page_break(auto=True, margin=15)
|
593 |
|
594 |
# Primeira página - Informações e Formação Básica
|
595 |
pdf.add_page()
|
596 |
pdf.set_font('Helvetica', 'B', 18)
|
597 |
+
pdf.cell(0, 10, 'Relatório de Desempenho Escolar',
|
598 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='C')
|
599 |
pdf.ln(15)
|
600 |
|
601 |
# Informações do aluno
|
602 |
pdf.set_font('Helvetica', 'B', 12)
|
603 |
+
pdf.cell(0, 10, 'Informações do Aluno',
|
604 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
|
605 |
pdf.line(10, pdf.get_y(), 200, pdf.get_y())
|
606 |
pdf.ln(5)
|
607 |
|
608 |
+
# Nome do aluno
|
609 |
if hasattr(df, 'attrs') and 'nome' in df.attrs:
|
610 |
pdf.set_font('Helvetica', 'B', 11)
|
611 |
pdf.cell(30, 7, 'Nome:', 0, 0)
|
612 |
pdf.set_font('Helvetica', '', 11)
|
613 |
+
pdf.cell(0, 7, df.attrs['nome'],
|
614 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT)
|
615 |
|
616 |
pdf.ln(10)
|
617 |
|
618 |
# Data do relatório
|
619 |
data_atual = datetime.now().strftime('%d/%m/%Y')
|
620 |
pdf.set_font('Helvetica', 'I', 10)
|
621 |
+
pdf.cell(0, 5, f'Data de geração: {data_atual}',
|
622 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='R')
|
623 |
pdf.ln(15)
|
624 |
|
625 |
+
# Gráficos de evolução
|
626 |
pdf.set_font('Helvetica', 'B', 14)
|
627 |
+
pdf.cell(0, 10, 'Evolução das Notas - Formação Geral Básica',
|
628 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
|
629 |
pdf.line(10, pdf.get_y(), 200, pdf.get_y())
|
630 |
pdf.ln(10)
|
631 |
pdf.image(grafico_basica, x=10, w=190)
|
|
|
633 |
# Segunda página - Parte Diversificada
|
634 |
pdf.add_page()
|
635 |
pdf.set_font('Helvetica', 'B', 14)
|
636 |
+
pdf.cell(0, 10, 'Evolução das Notas - Parte Diversificada',
|
637 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
|
638 |
pdf.line(10, pdf.get_y(), 200, pdf.get_y())
|
639 |
pdf.ln(10)
|
640 |
pdf.image(grafico_diversificada, x=10, w=190)
|
|
|
642 |
# Terceira página - Médias e Frequências
|
643 |
pdf.add_page()
|
644 |
pdf.set_font('Helvetica', 'B', 14)
|
645 |
+
pdf.cell(0, 10, 'Análise de Médias e Frequências',
|
646 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
|
647 |
pdf.line(10, pdf.get_y(), 200, pdf.get_y())
|
648 |
pdf.ln(10)
|
649 |
pdf.image(grafico_medias, x=10, w=190)
|
|
|
651 |
# Quarta página - Análise Detalhada
|
652 |
pdf.add_page()
|
653 |
pdf.set_font('Helvetica', 'B', 14)
|
654 |
+
pdf.cell(0, 10, 'Análise Detalhada',
|
655 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
|
656 |
pdf.line(10, pdf.get_y(), 200, pdf.get_y())
|
657 |
pdf.ln(10)
|
658 |
|
659 |
+
# Resumo geral
|
660 |
medias_notas = [d['media_notas'] for d in disciplinas_dados]
|
661 |
medias_freq = [d['media_freq'] for d in disciplinas_dados]
|
662 |
media_global = np.mean(medias_notas)
|
663 |
freq_global = np.mean(medias_freq)
|
664 |
|
|
|
665 |
pdf.set_font('Helvetica', 'B', 12)
|
666 |
+
pdf.cell(0, 7, 'Resumo Geral:',
|
667 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
|
668 |
pdf.ln(5)
|
669 |
|
670 |
pdf.set_font('Helvetica', '', 11)
|
671 |
+
pdf.cell(0, 7, f'Média Global: {media_global:.1f}',
|
672 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
|
673 |
+
pdf.cell(0, 7, f'Frequência Global: {freq_global:.1f}%',
|
674 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
|
675 |
pdf.ln(10)
|
676 |
|
677 |
+
# Pontos de atenção
|
678 |
pdf.set_font('Helvetica', 'B', 12)
|
679 |
+
pdf.cell(0, 10, 'Pontos de Atenção:',
|
680 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
|
681 |
pdf.ln(5)
|
682 |
|
683 |
pdf.set_font('Helvetica', '', 10)
|
|
|
|
|
684 |
disciplinas_risco = []
|
685 |
for disc_data in disciplinas_dados:
|
686 |
avisos = []
|
687 |
if disc_data['media_notas'] < LIMITE_APROVACAO_NOTA:
|
688 |
+
avisos.append(
|
689 |
+
f"Média de notas abaixo de {LIMITE_APROVACAO_NOTA} ({disc_data['media_notas']:.1f})"
|
690 |
+
)
|
691 |
if disc_data['media_freq'] < LIMITE_APROVACAO_FREQ:
|
692 |
+
avisos.append(
|
693 |
+
f"Frequência abaixo de {LIMITE_APROVACAO_FREQ}% ({disc_data['media_freq']:.1f}%)"
|
694 |
+
)
|
695 |
|
696 |
if avisos:
|
697 |
disciplinas_risco.append((disc_data['disciplina'], avisos))
|
|
|
699 |
if disciplinas_risco:
|
700 |
for disc, avisos in disciplinas_risco:
|
701 |
pdf.set_font('Helvetica', 'B', 10)
|
702 |
+
pdf.cell(0, 7, f'- {disc}:',
|
703 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
|
704 |
pdf.set_font('Helvetica', '', 10)
|
705 |
for aviso in avisos:
|
706 |
pdf.cell(10) # Indentação
|
707 |
+
pdf.cell(0, 7, f'- {aviso}',
|
708 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
|
709 |
else:
|
710 |
+
pdf.cell(0, 7, 'Nenhum problema identificado.',
|
711 |
+
0, new_x=XPos.LMARGIN, new_y=YPos.NEXT, align='L')
|
712 |
|
713 |
+
pdf.header_footer()
|
|
|
|
|
|
|
|
|
|
|
|
|
714 |
|
715 |
# Salvar PDF
|
716 |
+
with temp_file(suffix='.pdf') as temp_pdf:
|
717 |
+
pdf.output(temp_pdf)
|
718 |
+
return temp_pdf
|
|
|
719 |
|
720 |
+
def processar_boletim(file) -> Tuple[Optional[str], str]:
|
721 |
"""Função principal que processa o boletim e gera o relatório."""
|
|
|
722 |
try:
|
723 |
if file is None:
|
724 |
return None, "Nenhum arquivo foi fornecido."
|
725 |
|
726 |
+
with temp_directory() as temp_dir:
|
727 |
+
# Salvar arquivo temporário
|
728 |
+
temp_pdf = os.path.join(temp_dir, 'boletim.pdf')
|
729 |
+
with open(temp_pdf, 'wb') as f:
|
730 |
+
f.write(file)
|
731 |
+
|
732 |
+
if os.path.getsize(temp_pdf) == 0:
|
733 |
+
return None, "O arquivo está vazio."
|
734 |
+
|
735 |
+
# Extrair e processar dados
|
736 |
+
df = extrair_tabelas_pdf(temp_pdf)
|
737 |
+
if df is None or df.empty:
|
738 |
+
return None, "Não foi possível extrair dados do PDF."
|
739 |
+
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
740 |
disciplinas_dados = obter_disciplinas_validas(df)
|
741 |
if not disciplinas_dados:
|
742 |
return None, "Nenhuma disciplina válida encontrada no boletim."
|
743 |
|
744 |
+
# Separar disciplinas e determinar nível
|
745 |
categorias = separar_disciplinas_por_categoria(disciplinas_dados)
|
746 |
+
nivel_texto = "Ensino Médio" if categorias['nivel'] == "medio" else "Ensino Fundamental"
|
|
|
747 |
|
748 |
+
# Gerar gráficos em paralelo
|
749 |
+
with ThreadPoolExecutor() as executor:
|
750 |
+
futures = {
|
751 |
+
'basica': executor.submit(
|
752 |
+
plotar_evolucao_bimestres,
|
753 |
+
categorias['formacao_basica'],
|
754 |
+
temp_dir,
|
755 |
+
f"Evolução das Médias - Formação Geral Básica ({nivel_texto})",
|
756 |
+
'evolucao_basica.png'
|
757 |
+
),
|
758 |
+
'diversificada': executor.submit(
|
759 |
+
plotar_evolucao_bimestres,
|
760 |
+
categorias['diversificada'],
|
761 |
+
temp_dir,
|
762 |
+
f"Evolução das Médias - Parte Diversificada ({nivel_texto})",
|
763 |
+
'evolucao_diversificada.png'
|
764 |
+
),
|
765 |
+
'medias': executor.submit(
|
766 |
+
plotar_graficos_destacados,
|
767 |
+
disciplinas_dados,
|
768 |
+
temp_dir
|
769 |
+
)
|
770 |
+
}
|
771 |
+
|
772 |
+
grafico_basica = futures['basica'].result()
|
773 |
+
grafico_diversificada = futures['diversificada'].result()
|
774 |
+
grafico_medias = futures['medias'].result()
|
775 |
|
776 |
+
# Gerar relatório final
|
777 |
+
pdf_path = gerar_relatorio_pdf(
|
778 |
+
df,
|
779 |
+
disciplinas_dados,
|
780 |
+
grafico_basica,
|
781 |
+
grafico_diversificada,
|
782 |
+
grafico_medias
|
783 |
)
|
784 |
|
785 |
+
# Preparar arquivo de retorno
|
786 |
+
output_path = os.path.join(temp_dir, 'relatorio_final.pdf')
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
787 |
shutil.copy2(pdf_path, output_path)
|
|
|
788 |
return output_path, "Relatório gerado com sucesso!"
|
789 |
|
|
|
|
|
|
|
790 |
except Exception as e:
|
791 |
+
logger.exception("Erro durante o processamento")
|
792 |
return None, f"Erro ao processar o boletim: {str(e)}"
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
793 |
|
794 |
# Interface Gradio
|
795 |
iface = gr.Interface(
|
|
|
805 |
],
|
806 |
title="Análise de Boletim Escolar",
|
807 |
description="Faça upload do boletim em PDF para gerar um relatório com análises e visualizações.",
|
808 |
+
allow_flagging="never",
|
809 |
+
theme=gr.themes.Default()
|
810 |
)
|
811 |
|
812 |
if __name__ == "__main__":
|
813 |
iface.launch(
|
814 |
server_name="0.0.0.0",
|
815 |
+
share=True,
|
816 |
+
enable_queue=True
|
817 |
)
|