Spaces:

HaggiVaggi
/

movie_rec

Sleeping

App Files Files Community

HaggiVaggi commited on Dec 14, 2023

Commit

d3d9b91

1 Parent(s): 88068fa

Update app.py

Browse files

Files changed (1) hide show

app.py +6 -13

app.py CHANGED Viewed

@@ -65,22 +65,15 @@ if page == "какая-то еще":
             outputs = model(**tokens)
         embeddings = outputs.last_hidden_state.mean(dim=1)
         return embeddings
-    def convert_tensor_string(tensor_string):
-        try:
-        # Извлечение чисел из строки с использованием регулярного выражения
-            numbers = re.findall(r'-?\d+\.?\d*', tensor_string)
-            return [float(num) for num in numbers]
-        except ValueError:
-        # В случае ошибки (например, если строка не соответствует ожидаемому формату), вернем пустой список
-            return []
     df2 = pd.read_csv('data_with_embeddings.csv')
-    embeddings = pd.read_pickle('embeddings.pkl')
-    # Проверка и преобразование строки с тензорами
-    df2['description_embedding'] = df2['description_embedding'].apply(convert_tensor_string)
     # Объединение тензоров в один большой тензор
-    embeddings_tensor = torch.stack(df2['description_embedding'].tolist())
     # Получение ввода пользователя
     user_input = st.text_area('Введите описание фильма')
@@ -93,4 +86,4 @@ if page == "какая-то еще":
     sorted_indices = similarity_scores.argsort()[::-1]
     recs = df2.iloc[sorted_indices[:10]].reset_index(drop=True)
     recs.index = recs.index + 1
-    st.write(recs[['movie_title', 'description']])

             outputs = model(**tokens)
         embeddings = outputs.last_hidden_state.mean(dim=1)
         return embeddings
+    # Чтение данных из файла
     df2 = pd.read_csv('data_with_embeddings.csv')
+    # Обработка пустых значений
+    df2['description_embedding'] = df2['description_embedding'].apply(lambda x: [] if pd.isna(x) else x)
     # Объединение тензоров в один большой тензор
+    embeddings_tensor = torch.stack(df2['description_embedding'].apply(torch.tensor).tolist())
     # Получение ввода пользователя
     user_input = st.text_area('Введите описание фильма')
     sorted_indices = similarity_scores.argsort()[::-1]
     recs = df2.iloc[sorted_indices[:10]].reset_index(drop=True)
     recs.index = recs.index + 1
+    st.write(recs[['movie_title', 'description']])