Spaces:
Sleeping
Sleeping
fschwartzer
commited on
Update app.py
Browse files
app.py
CHANGED
@@ -38,11 +38,11 @@ def refinar_resultados(df):
|
|
38 |
df_refinado = df_refinado[~df_refinado['Title'].str.contains(padrao_unidades, case=False, regex=True, na=False)]
|
39 |
return df_refinado
|
40 |
|
41 |
-
def get_best_match(query, choices, limit=
|
42 |
matches = process.extract(query, choices, scorer=fuzz.WRatio, limit=limit)
|
43 |
-
return [match[0] for match in matches if match[1] >
|
44 |
|
45 |
-
def filtrar_itens_similares(df, termo_pesquisa, limit=
|
46 |
titulos = df['Title'].tolist()
|
47 |
titulos_similares = get_best_match(termo_pesquisa, titulos, limit=limit)
|
48 |
df_filtrado = df[df['Title'].isin(titulos_similares)]
|
|
|
38 |
df_refinado = df_refinado[~df_refinado['Title'].str.contains(padrao_unidades, case=False, regex=True, na=False)]
|
39 |
return df_refinado
|
40 |
|
41 |
+
def get_best_match(query, choices, limit=15):
|
42 |
matches = process.extract(query, choices, scorer=fuzz.WRatio, limit=limit)
|
43 |
+
return [match[0] for match in matches if match[1] > 50]
|
44 |
|
45 |
+
def filtrar_itens_similares(df, termo_pesquisa, limit=15):
|
46 |
titulos = df['Title'].tolist()
|
47 |
titulos_similares = get_best_match(termo_pesquisa, titulos, limit=limit)
|
48 |
df_filtrado = df[df['Title'].isin(titulos_similares)]
|