HaggiVaggi commited on
Commit
7ceb2c7
1 Parent(s): e6e6052

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +6 -6
app.py CHANGED
@@ -66,18 +66,18 @@ if page == "какая-то еще":
66
  embeddings = outputs.last_hidden_state.mean(dim=1)
67
  return embeddings
68
  def convert_tensor_string(tensor_string):
69
- try:
70
  # Извлечение чисел из строки с использованием регулярного выражения
71
- numbers = re.findall(r'-?\d+\.?\d*', tensor_string)
72
- return [float(num) for num in numbers]
73
- except ValueError:
74
  # В случае ошибки (например, если строка не соответствует ожидаемому формату), вернем пустой список
75
- return []
76
  df2 = pd.read_csv('data_with_embeddings.csv')
77
  embeddings = pd.read_pickle('embeddings.pkl')
78
 
79
  # Проверка и преобразование строки с тензорами
80
- df2['description_embedding'] = df2['description_embedding'].apply(lambda x: parse_tensor_string(x) if pd.notna(x) else [])
81
 
82
  # Объединение тензоров в один большой тензор
83
  embeddings_tensor = torch.stack(df2['description_embedding'].tolist())
 
66
  embeddings = outputs.last_hidden_state.mean(dim=1)
67
  return embeddings
68
  def convert_tensor_string(tensor_string):
69
+ try:
70
  # Извлечение чисел из строки с использованием регулярного выражения
71
+ numbers = re.findall(r'-?\d+\.?\d*', tensor_string)
72
+ return [float(num) for num in numbers]
73
+ except ValueError:
74
  # В случае ошибки (например, если строка не соответствует ожидаемому формату), вернем пустой список
75
+ return []
76
  df2 = pd.read_csv('data_with_embeddings.csv')
77
  embeddings = pd.read_pickle('embeddings.pkl')
78
 
79
  # Проверка и преобразование строки с тензорами
80
+ df['description_embedding'] = df['description_embedding'].apply(convert_tensor_string)
81
 
82
  # Объединение тензоров в один большой тензор
83
  embeddings_tensor = torch.stack(df2['description_embedding'].tolist())