Spaces:
Sleeping
Sleeping
File size: 725 Bytes
4a584a3 e370355 4a584a3 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
import numpy as np
from vectorization import model, spotify_data
# Funci贸n para convertir una canci贸n en un vector promedio de sus palabras
def song_vector(tokens, model):
# Filtrar palabras que est谩n en el modelo
tokens = [word for word in tokens if word in model.wv.key_to_index]
if len(tokens) == 0:
return np.zeros(model.vector_size)
# Calcular el promedio de los vectores de las palabras
song_vec = np.mean([model.wv[word] for word in tokens], axis=0)
return song_vec
# Aplicar esta funci贸n a cada canci贸n en tu dataset
spotify_data['song_vector'] = spotify_data['cleaned_text'].apply(lambda x: song_vector(x, model))
spotify_data.to_csv('dataset_modificado.csv', index=False)
|