Spaces:
Sleeping
Sleeping
Commit
·
d3d9b91
1
Parent(s):
88068fa
Update app.py
Browse files
app.py
CHANGED
@@ -65,22 +65,15 @@ if page == "какая-то еще":
|
|
65 |
outputs = model(**tokens)
|
66 |
embeddings = outputs.last_hidden_state.mean(dim=1)
|
67 |
return embeddings
|
68 |
-
|
69 |
-
|
70 |
-
# Извлечение чисел из строки с использованием регулярного выражения
|
71 |
-
numbers = re.findall(r'-?\d+\.?\d*', tensor_string)
|
72 |
-
return [float(num) for num in numbers]
|
73 |
-
except ValueError:
|
74 |
-
# В случае ошибки (например, если строка не соответствует ожидаемому формату), вернем пустой список
|
75 |
-
return []
|
76 |
df2 = pd.read_csv('data_with_embeddings.csv')
|
77 |
-
embeddings = pd.read_pickle('embeddings.pkl')
|
78 |
|
79 |
-
#
|
80 |
-
df2['description_embedding'] = df2['description_embedding'].apply(
|
81 |
|
82 |
# Объединение тензоров в один большой тензор
|
83 |
-
embeddings_tensor = torch.stack(df2['description_embedding'].tolist())
|
84 |
|
85 |
# Получение ввода пользователя
|
86 |
user_input = st.text_area('Введите описание фильма')
|
@@ -93,4 +86,4 @@ if page == "какая-то еще":
|
|
93 |
sorted_indices = similarity_scores.argsort()[::-1]
|
94 |
recs = df2.iloc[sorted_indices[:10]].reset_index(drop=True)
|
95 |
recs.index = recs.index + 1
|
96 |
-
st.write(recs[['movie_title', 'description']])
|
|
|
65 |
outputs = model(**tokens)
|
66 |
embeddings = outputs.last_hidden_state.mean(dim=1)
|
67 |
return embeddings
|
68 |
+
|
69 |
+
# Чтение данных из файла
|
|
|
|
|
|
|
|
|
|
|
|
|
70 |
df2 = pd.read_csv('data_with_embeddings.csv')
|
|
|
71 |
|
72 |
+
# Обработка пустых значений
|
73 |
+
df2['description_embedding'] = df2['description_embedding'].apply(lambda x: [] if pd.isna(x) else x)
|
74 |
|
75 |
# Объединение тензоров в один большой тензор
|
76 |
+
embeddings_tensor = torch.stack(df2['description_embedding'].apply(torch.tensor).tolist())
|
77 |
|
78 |
# Получение ввода пользователя
|
79 |
user_input = st.text_area('Введите описание фильма')
|
|
|
86 |
sorted_indices = similarity_scores.argsort()[::-1]
|
87 |
recs = df2.iloc[sorted_indices[:10]].reset_index(drop=True)
|
88 |
recs.index = recs.index + 1
|
89 |
+
st.write(recs[['movie_title', 'description']])
|