Spaces:

GMARTINEZMILLA
/

Final_Project

Sleeping

App Files Files Community

GMARTINEZMILLA commited on Oct 17, 2024

Commit

573b084

1 Parent(s): 768acc0

bugfix: Manufacturers Alerts

Browse files

Files changed (2) hide show

app.py +26 -16
utils.py +10 -11

app.py CHANGED Viewed

@@ -10,7 +10,7 @@ from sklearn.feature_extraction.text import TfidfVectorizer
 from sklearn.metrics.pairwise import cosine_similarity
 from sklearn.metrics import mean_absolute_error, mean_squared_error
 from joblib import dump, load
-from utils import recomienda_tfid
 # Page configuration
 st.set_page_config(page_title="DeepInsightz", page_icon=":bar_chart:", layout="wide")
@@ -682,6 +682,9 @@ elif page == "Customer Analysis":
 # Customer Recommendations Page
 elif page == "Articles Recommendations":
     # Estilo principal de la página
     st.markdown(
         "<h1 style='text-align: center; color: #2E86C1;'>Articles Recommendations</h1>",
@@ -693,30 +696,38 @@ elif page == "Articles Recommendations":
     st.write("### Select items and assign quantities for the basket:")
     # Añadir separador para mejorar la segmentación visual
     st.divider()
-    # Mostrar lista de artículos disponibles
-    available_articles = productos['DESCRIPCION'].unique()
-    selected_articles = st.multiselect("Select Articles", available_articles)
-    # Mostrar cantidades en la misma fila
     quantities = {}
-    if selected_articles:
         st.write("### Selected Items and Quantities:")
-        for article in selected_articles:
-            col1, col2 = st.columns([3, 1])  # Configurar las proporciones de las columnas
             with col1:
-                st.write(article)  # Mostrar el nombre del artículo
             with col2:
-                quantities[article] = st.number_input(f"Qty for {article}", min_value=0, step=1, key=article)  # Pedir cantidad
     # Añadir un botón estilizado "Calcular" con icono
     if st.button("🛒 Calculate Recommendations"):
-        # Crear una lista de artículos basada en la selección de códigos y cantidades
         new_basket = []
-        for article in selected_articles:
-            quantity = quantities[article]
             if quantity > 0:
-                new_basket.extend([article] * quantity)  # Añadir el código 'article' tantas veces como 'quantity'
         if new_basket:
             # Procesar la lista para recomendar
-            recommendations_df = recomienda_tfid(new_basket)
             if not recommendations_df.empty:
                 st.success("### Recommendations based on the current basket:")
@@ -725,7 +736,6 @@ elif page == "Articles Recommendations":
                 st.warning("⚠️ No recommendations found for the provided basket.")
         else:
             st.warning("⚠️ Please select at least one article and set its quantity.")
 # # Customer Recommendations Page
 # elif page == "Articles Recommendations":
 #     st.title("Articles Recommendations")

 from sklearn.metrics.pairwise import cosine_similarity
 from sklearn.metrics import mean_absolute_error, mean_squared_error
 from joblib import dump, load
+from utils import recomienda_tf
 # Page configuration
 st.set_page_config(page_title="DeepInsightz", page_icon=":bar_chart:", layout="wide")
 # Customer Recommendations Page
 elif page == "Articles Recommendations":
+    # Carga de CSV necesarios cestas y productos
+    cestas = pd.read_csv('cestas.csv')
+    productos = pd.read_csv('productos.csv')
     # Estilo principal de la página
     st.markdown(
         "<h1 style='text-align: center; color: #2E86C1;'>Articles Recommendations</h1>",
     st.write("### Select items and assign quantities for the basket:")
     # Añadir separador para mejorar la segmentación visual
     st.divider()
+    # Mostrar lista de artículos disponibles (ahora se usa el código asociado a cada descripción)
+    available_articles = productos[['CODIGO', 'DESCRIPCION']].drop_duplicates()
+    # Crear diccionario para asignar las descripciones a los códigos
+    article_dict = dict(zip(available_articles['DESCRIPCION'], available_articles['CODIGO']))
+    # Permitir seleccionar las descripciones, pero trabajar con los códigos
+    selected_descriptions = st.multiselect("Select Articles", available_articles['DESCRIPCION'].unique())
     quantities = {}
+    if selected_descriptions:
         st.write("### Selected Items and Quantities:")
+        for description in selected_descriptions:
+            code = article_dict[description]  # Usar el código del artículo
+            col1, col2 = st.columns([1, 3])  # Ajustar proporciones para que las cantidades vayan a la izquierda
             with col1:
+                # Caja de número para la cantidad, asociada al código
+                quantities[code] = st.number_input(f"Quantity {code}", min_value=0, step=1, key=code)
             with col2:
+                # Mostrar la descripción del artículo
+                st.write(description)
     # Añadir un botón estilizado "Calcular" con icono
     if st.button("🛒 Calculate Recommendations"):
+        # Crear una lista de artículos basada en los códigos y cantidades
         new_basket = []
+        for code in quantities:
+            quantity = quantities[code]
             if quantity > 0:
+                new_basket.extend([code] * quantity)  # Añadir el código tantas veces como 'quantity'
         if new_basket:
             # Procesar la lista para recomendar
+            recommendations_df = recomienda_tf(new_basket, cestas, productos)
             if not recommendations_df.empty:
                 st.success("### Recommendations based on the current basket:")
                 st.warning("⚠️ No recommendations found for the provided basket.")
         else:
             st.warning("⚠️ Please select at least one article and set its quantity.")
 # # Customer Recommendations Page
 # elif page == "Articles Recommendations":
 #     st.title("Articles Recommendations")

utils.py CHANGED Viewed

@@ -1,4 +1,3 @@
 import pandas as pd
 import numpy as np
 import warnings
@@ -6,34 +5,34 @@ warnings.filterwarnings('ignore')
 from sklearn.feature_extraction.text import TfidfVectorizer
 from sklearn.metrics.pairwise import cosine_similarity
 from joblib import dump, load
-def recomienda_tfid(new_basket):
-    cestas = pd.read_csv('cestas.csv')
-    productos = pd.read_csv('productos.csv')
     # Cargar la matriz TF-IDF y el modelo
-    tfidf_matrix = load('tfidf_matrix.joblib')
     # MAtriz que tienen cada columna los diferentes artículos y las diferentes cestas en las filas
     # Los valores son la importancia de cada artículo en la cesta según las veces que aparece en la misma y el total de artículos
-    tfidf = load('tfidf_model.joblib')
-    # Convertir la nueva cesta en formato TF-IDF
     new_basket_str = ' '.join(new_basket)
-    new_basket_tfidf = tfidf.transform([new_basket_str])
     # Comparar la nueva cesta con las anteriores
     # Calculando la distancia coseoidal, distancia entre rectas
-    similarities = cosine_similarity(new_basket_tfidf, tfidf_matrix)
     # La similitud coseno devuelve un valor entre 0 y 1, donde 1 significa
     # que las cestas son idénticas en términos de productos y 0 que no comparten ningún producto.
     # Obtener los índices de las cestas más similares
     # Muestra los índices de Las 3 cestas más parecidas atendiendo a la distancia calculada anteriormente
-    similar_indices = similarities.argsort()[0][-4:]  # Las 3 más similares
     # Crear un diccionario para contar las recomendaciones
     recommendations_count = {}
@@ -78,4 +77,4 @@ def recomienda_tfid(new_basket):
     recommendations_df = pd.DataFrame(recommendations_data)
-    return recommendations_df

 import pandas as pd
 import numpy as np
 import warnings
 from sklearn.feature_extraction.text import TfidfVectorizer
 from sklearn.metrics.pairwise import cosine_similarity
 from joblib import dump, load
+from sklearn.preprocessing import normalize
+def recomienda_tf(new_basket, cestas, productos):
     # Cargar la matriz TF-IDF y el modelo
+    tf_matrix = load('../models/tf_matrix.joblib')
     # MAtriz que tienen cada columna los diferentes artículos y las diferentes cestas en las filas
     # Los valores son la importancia de cada artículo en la cesta según las veces que aparece en la misma y el total de artículos
+    count = load('../models/count_vectorizer.joblib')
+    # Convertir la nueva cesta en formato TF (Term Frequency)
     new_basket_str = ' '.join(new_basket)
+    new_basket_vector = count.transform([new_basket_str])
+    new_basket_tf = normalize(new_basket_vector, norm='l1') # Normalizamos la matriz count de la cesta actual
     # Comparar la nueva cesta con las anteriores
     # Calculando la distancia coseoidal, distancia entre rectas
+    similarities = cosine_similarity(new_basket_tf, tf_matrix)
     # La similitud coseno devuelve un valor entre 0 y 1, donde 1 significa
     # que las cestas son idénticas en términos de productos y 0 que no comparten ningún producto.
     # Obtener los índices de las cestas más similares
     # Muestra los índices de Las 3 cestas más parecidas atendiendo a la distancia calculada anteriormente
+    similar_indices = similarities.argsort()[0][-4:]  # Las 4 más similares
     # Crear un diccionario para contar las recomendaciones
     recommendations_count = {}
     recommendations_df = pd.DataFrame(recommendations_data)
+    return recommendations_df