HaggiVaggi commited on
Commit
d3d9b91
1 Parent(s): 88068fa

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +6 -13
app.py CHANGED
@@ -65,22 +65,15 @@ if page == "какая-то еще":
65
  outputs = model(**tokens)
66
  embeddings = outputs.last_hidden_state.mean(dim=1)
67
  return embeddings
68
- def convert_tensor_string(tensor_string):
69
- try:
70
- # Извлечение чисел из строки с использованием регулярного выражения
71
- numbers = re.findall(r'-?\d+\.?\d*', tensor_string)
72
- return [float(num) for num in numbers]
73
- except ValueError:
74
- # В случае ошибки (например, если строка не соответствует ожидаемому формату), вернем пустой список
75
- return []
76
  df2 = pd.read_csv('data_with_embeddings.csv')
77
- embeddings = pd.read_pickle('embeddings.pkl')
78
 
79
- # Проверка и преобразование строки с тензорами
80
- df2['description_embedding'] = df2['description_embedding'].apply(convert_tensor_string)
81
 
82
  # Объединение тензоров в один большой тензор
83
- embeddings_tensor = torch.stack(df2['description_embedding'].tolist())
84
 
85
  # Получение ввода пользователя
86
  user_input = st.text_area('Введите описание фильма')
@@ -93,4 +86,4 @@ if page == "какая-то еще":
93
  sorted_indices = similarity_scores.argsort()[::-1]
94
  recs = df2.iloc[sorted_indices[:10]].reset_index(drop=True)
95
  recs.index = recs.index + 1
96
- st.write(recs[['movie_title', 'description']])
 
65
  outputs = model(**tokens)
66
  embeddings = outputs.last_hidden_state.mean(dim=1)
67
  return embeddings
68
+
69
+ # Чтение данных из файла
 
 
 
 
 
 
70
  df2 = pd.read_csv('data_with_embeddings.csv')
 
71
 
72
+ # Обработка пустых значений
73
+ df2['description_embedding'] = df2['description_embedding'].apply(lambda x: [] if pd.isna(x) else x)
74
 
75
  # Объединение тензоров в один большой тензор
76
+ embeddings_tensor = torch.stack(df2['description_embedding'].apply(torch.tensor).tolist())
77
 
78
  # Получение ввода пользователя
79
  user_input = st.text_area('Введите описание фильма')
 
86
  sorted_indices = similarity_scores.argsort()[::-1]
87
  recs = df2.iloc[sorted_indices[:10]].reset_index(drop=True)
88
  recs.index = recs.index + 1
89
+ st.write(recs[['movie_title', 'description']])