Spaces:
Sleeping
Sleeping
Commit
•
7ceb2c7
1
Parent(s):
e6e6052
Update app.py
Browse files
app.py
CHANGED
@@ -66,18 +66,18 @@ if page == "какая-то еще":
|
|
66 |
embeddings = outputs.last_hidden_state.mean(dim=1)
|
67 |
return embeddings
|
68 |
def convert_tensor_string(tensor_string):
|
69 |
-
|
70 |
# Извлечение чисел из строки с использованием регулярного выражения
|
71 |
-
|
72 |
-
|
73 |
-
|
74 |
# В случае ошибки (например, если строка не соответствует ожидаемому формату), вернем пустой список
|
75 |
-
|
76 |
df2 = pd.read_csv('data_with_embeddings.csv')
|
77 |
embeddings = pd.read_pickle('embeddings.pkl')
|
78 |
|
79 |
# Проверка и преобразование строки с тензорами
|
80 |
-
|
81 |
|
82 |
# Объединение тензоров в один большой тензор
|
83 |
embeddings_tensor = torch.stack(df2['description_embedding'].tolist())
|
|
|
66 |
embeddings = outputs.last_hidden_state.mean(dim=1)
|
67 |
return embeddings
|
68 |
def convert_tensor_string(tensor_string):
|
69 |
+
try:
|
70 |
# Извлечение чисел из строки с использованием регулярного выражения
|
71 |
+
numbers = re.findall(r'-?\d+\.?\d*', tensor_string)
|
72 |
+
return [float(num) for num in numbers]
|
73 |
+
except ValueError:
|
74 |
# В случае ошибки (например, если строка не соответствует ожидаемому формату), вернем пустой список
|
75 |
+
return []
|
76 |
df2 = pd.read_csv('data_with_embeddings.csv')
|
77 |
embeddings = pd.read_pickle('embeddings.pkl')
|
78 |
|
79 |
# Проверка и преобразование строки с тензорами
|
80 |
+
df['description_embedding'] = df['description_embedding'].apply(convert_tensor_string)
|
81 |
|
82 |
# Объединение тензоров в один большой тензор
|
83 |
embeddings_tensor = torch.stack(df2['description_embedding'].tolist())
|