Spaces:
Sleeping
Sleeping
fschwartzer
commited on
Commit
•
07df588
1
Parent(s):
081521a
Update app.py
Browse files
app.py
CHANGED
@@ -5,6 +5,7 @@ from difflib import get_close_matches
|
|
5 |
import re # Importa o módulo de expressões regulares
|
6 |
import csv
|
7 |
import datetime
|
|
|
8 |
|
9 |
bens_df = pd.read_excel('bens_tab.xlsx')
|
10 |
|
@@ -34,10 +35,13 @@ def refinar_resultados(df):
|
|
34 |
df_refinado = df_refinado[~df_refinado['Title'].str.contains(padrao_unidades, case=False, regex=True, na=False)]
|
35 |
return df_refinado
|
36 |
|
37 |
-
|
|
|
|
|
|
|
38 |
def filtrar_itens_similares(df, termo_pesquisa, limite=5):
|
39 |
titulos = df['Title'].tolist()
|
40 |
-
titulos_similares =
|
41 |
df_filtrado = df[df['Title'].isin(titulos_similares)]
|
42 |
return df_filtrado
|
43 |
|
|
|
5 |
import re # Importa o módulo de expressões regulares
|
6 |
import csv
|
7 |
import datetime
|
8 |
+
from fuzzywuzzy import process
|
9 |
|
10 |
bens_df = pd.read_excel('bens_tab.xlsx')
|
11 |
|
|
|
35 |
df_refinado = df_refinado[~df_refinado['Title'].str.contains(padrao_unidades, case=False, regex=True, na=False)]
|
36 |
return df_refinado
|
37 |
|
38 |
+
def get_best_match(query, choices, limit=5):
|
39 |
+
matches = process.extractBests(query, choices, limit=limit)
|
40 |
+
return [match[0] for match in matches if match[1] > 60] # Adjust score threshold as needed
|
41 |
+
|
42 |
def filtrar_itens_similares(df, termo_pesquisa, limite=5):
|
43 |
titulos = df['Title'].tolist()
|
44 |
+
titulos_similares = get_best_match(termo_pesquisa, titulos, limite=limite)
|
45 |
df_filtrado = df[df['Title'].isin(titulos_similares)]
|
46 |
return df_filtrado
|
47 |
|