fschwartzer commited on
Commit
07df588
1 Parent(s): 081521a

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +6 -2
app.py CHANGED
@@ -5,6 +5,7 @@ from difflib import get_close_matches
5
  import re # Importa o módulo de expressões regulares
6
  import csv
7
  import datetime
 
8
 
9
  bens_df = pd.read_excel('bens_tab.xlsx')
10
 
@@ -34,10 +35,13 @@ def refinar_resultados(df):
34
  df_refinado = df_refinado[~df_refinado['Title'].str.contains(padrao_unidades, case=False, regex=True, na=False)]
35
  return df_refinado
36
 
37
-
 
 
 
38
  def filtrar_itens_similares(df, termo_pesquisa, limite=5):
39
  titulos = df['Title'].tolist()
40
- titulos_similares = get_close_matches(termo_pesquisa, titulos, n=limite, cutoff=0.1)
41
  df_filtrado = df[df['Title'].isin(titulos_similares)]
42
  return df_filtrado
43
 
 
5
  import re # Importa o módulo de expressões regulares
6
  import csv
7
  import datetime
8
+ from fuzzywuzzy import process
9
 
10
  bens_df = pd.read_excel('bens_tab.xlsx')
11
 
 
35
  df_refinado = df_refinado[~df_refinado['Title'].str.contains(padrao_unidades, case=False, regex=True, na=False)]
36
  return df_refinado
37
 
38
+ def get_best_match(query, choices, limit=5):
39
+ matches = process.extractBests(query, choices, limit=limit)
40
+ return [match[0] for match in matches if match[1] > 60] # Adjust score threshold as needed
41
+
42
  def filtrar_itens_similares(df, termo_pesquisa, limite=5):
43
  titulos = df['Title'].tolist()
44
+ titulos_similares = get_best_match(termo_pesquisa, titulos, limite=limite)
45
  df_filtrado = df[df['Title'].isin(titulos_similares)]
46
  return df_filtrado
47