from sklearn.metrics.pairwise import cosine_similarity
import pandas as pd
import numpy as np
from vectorization import spotify_data
import json
import gradio as gr
from gradio.components import Textbox
from ast import literal_eval
spotify_data_processed = pd.read_csv('dataset_modificado.csv')

def convert_string_to_array(str_vector):
    # Si str_vector ya es un array de NumPy, devolverlo directamente
    if isinstance(str_vector, np.ndarray):
        return str_vector

    try:
        cleaned_str = str_vector.replace('[', '').replace(']', '').replace('\n', ' ').replace('\r', '').strip()
        vector_elements = [float(item) for item in cleaned_str.split()]
        return np.array(vector_elements)
    except ValueError as e:
        print("Error:", e)
        return np.zeros((100,))


spotify_data_processed['song_vector'] = spotify_data_processed['song_vector'].apply(convert_string_to_array)


# Aplicar la función a las primeras filas para ver los resultados
sample_data = spotify_data_processed['song_vector'].head()
converted_vectors = sample_data.apply(convert_string_to_array)
print(converted_vectors)


def recommend_song(song_name, artist_name, spotify_data_processed, top_n=4):
    # Filtrar para encontrar la canción específica
    specific_song = spotify_data_processed[(spotify_data_processed['song'] == song_name)
                                            & (spotify_data_processed['artist'] == artist_name)]

    # Verificar si la canción existe en el dataset
    if specific_song.empty:
        return pd.DataFrame({"Error": ["Canción no encontrada en la base de datos."]})


    # Obtener el vector de la canción específica
    song_vec = specific_song['song_vector'].iloc[0]

    # Asegurarte de que song_vec sea un array de NumPy
    if isinstance(song_vec, str):
        song_vec = convert_string_to_array(song_vec)

    all_song_vectors = np.array(spotify_data_processed['song_vector'].tolist())

    # Calcular similitudes
    similarities = cosine_similarity([song_vec], all_song_vectors)[0]

    # Obtener los índices de las canciones más similares
    top_indices = np.argsort(similarities)[::-1][1:top_n+1]

    # Devolver los nombres y artistas de las canciones más similares
    recommended_songs = spotify_data_processed.iloc[top_indices][['song', 'artist']]
    return recommended_songs


def recommend_song_interface(song_name, artist_name):
    recommendations_df = recommend_song(song_name, artist_name, spotify_data_processed)
    
    if isinstance(recommendations_df, pd.DataFrame):
        # Convierte el DataFrame en una lista de listas y luego a un formato de texto plano para la salida
        recommendations_list = recommendations_df.values.tolist()
        return ["{} by {}".format(song, artist) for song, artist in recommendations_list]
    else:
        # Si no es un DataFrame, devolver el mensaje de error
        return recommendations_df

# Crear la interfaz con Gradio
iface = gr.Interface(
    fn=recommend_song_interface,
    inputs=[
        gr.Textbox(placeholder="Ingrese el título de la canción", label="Título de la Canción"),
        gr.Textbox(placeholder="Ingrese el nombre del artista", label="Nombre del Artista")
    ],
    outputs=[gr.Text(label="Recomendación 1"),
             gr.Text(label="Recomendación 2"),
             gr.Text(label="Recomendación 3"),
             gr.Text(label="Recomendación 4")],
    title="Recomendador de Canciones",
    description="Ingrese el título de una canción y el nombre del artista para obtener recomendaciones.",
    theme="dark",  # Comenta o elimina si el tema oscuro no está disponible

)

iface.launch()