tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:49285
- loss:ContrastiveLoss
base_model: sergeyzh/rubert-tiny-turbo
widget:
- source_sentence: >-
Здравствуйте! Подскажите, пожалуйста, у вас есть смарт-часы Samsung Gear?
И какие модели сейчас в наличии?
sentences:
- >-
{'long_web_name': 'Кронштейн для телевизора 17"-43" ONKRON M4S
наклонно-поворотный, чёрный', 'price': 2300.0, 'url':
'https://megamarket.ru/catalog/details/kronshteyn-dlya-televizora-onkron-m4s-100024214080/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-36/944/630/271/712/55/100024214080b0.jpg',
'id': '100024214080_16245', 'description': '<p>Настенный
наклонно-поворотный кронштейн для телевизора <strong>ONKRON
M4S</strong> предназначен для экранов с диагональю от 17 до 43
дюймов (43,18-109,2 см).</p><p>Крепление для ТВ подходит для маленьких и
средних телевизоров весом до 35 кг. Крепкий и надежный, при этом
элегантный кронштейн для ТВ станет стильным дополнением домашнего
интерьера.</p><p><strong>Преимущества:</strong></p><p>а) Предусмотренная
производителем система держателей проводов позволит закрепить их в
нужном положении – это придаст дополнительное удобство и сделает
более аккуратным внешний вид Вашего устройства.<br />б) Крепление на
стену изготовлено из высококачественной стали, что обеспечивает его
прочность.<br />в) Пластиковые накладки скроют всевозможные монтажные
крепления, добавив эстетичности образу Вашего устройства.<br />г) Вы
можете занимать любое удобное положение при просмотре ТВ за счет широких
возможностей регулировки угла наклона от -5° до +8°. Эти
возможности позволят получать удовольствие от просмотра.<br />д)
Подходит практически всем современным телевизорам - LCD, LED, OLED,
Ultra HD, plasma, с выгнутыми и плоскими мониторами. Поддерживает
стандарты VESA в диапазоне от 100x100 мм до 200x200 мм.</p><p>Приятным
удивлением станет стоимость подставки для телевизора – ценовое
решение можно назвать максимально выгодным, учитывая заявленные
технические характеристики продукта, особенно возможности наклона и
поворота.</p><p><strong>Совместимость</strong>: кронштейн подходит для
большинства телевизоров популярных брендов, среди которых Samsung, LG,
Sony, KIVI, Tcl, Xiaomi Mi, SUPRA, Panasonic, Hyundai, Erisson, Asano,
Horizont, JVC, Thomson, HARTENS, Sharp, Toshiba, Skyworth, BBK, AVEL,
Витязь, Веко, BQ, DEXP, SkyLine, Pioneer, Rolsen, Harper, Hisense,
Hitachi, Polarline, Prestigio, Telefunken и
других.</p><p><strong>Комплектация</strong>: кронштейн для телевизора,
комплект ключей и крепежа для установки ТВ, подробная инструкция на
русском языке.</p>', 'rating': 4.94, 'review_count': 434}
- >-
{'long_web_name': 'Смарт-часы Huawei Watch GT 4 черный', 'price':
19999.0, 'url':
'https://megamarket.ru/catalog/details/smart-chasy-gt-4-chernyy-chernyy-3215416-600013640661/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/415/122/331/011/232/7/600013640661b0.jpeg',
'id': '600013640661_99804', 'description': 'Мода не стоит на месте, как
и технологии. Вперед к достижениям и новым открытиям! Носимые устройства
HUAWEI. Опережая тренды. Культовый восьмиугольный дизайн.
Сбалансированные пропорции в сочетании с ровным гранями — воплощение
незаурядной классики часового искусства. Завораживающая игра света.
Благодаря инновационному креплению и изящному безелю часы выглядят более
воздушными. Сочетание эргономичности и стиля Легкий корпус и на 13%
более высокая полезная площадь экрана2, обрамленного узким безелем,
создают идеальный баланс между эстетикой и функциональностью.
ДлинаxШиринаxВысота (мм): PNX-B19: 46 x 46 x 10,9 Время зарядки: Около
100 минут (при температуре окружающей среды +25°C) Напряжение и сила
тока зарядного устройства 5 В /2 А Теоретическое время работы 14 дней
(PNX-B19)/7 дней (ARA-B19) в обычных сценариях использования (зависит от
привычек пользователя, и интенсивности использования устройства).
Bluetooth BT5.2, поддержка BLE/BR/EDR NFC Поддерживается Навигация
Поддерживается Wi-Fi Поддерживается (только 2,4 ГГц) Вибромотор Линейный
мотор Микрофон Поддерживается Динамик Поддерживается Физические кнопки
Кнопка питания, функциональная кнопка, поддержка таких операций, как
нажатие, нажатие и удержание и поворот кнопки часов Водонепроницаемость
5 АТМ, IP68', 'rating': 4.92, 'review_count': 541}
- >-
{'long_web_name': 'Сменная панель для мультипекаря Redmond RAMB-07',
'price': 1499.0, 'url':
'https://megamarket.ru/catalog/details/paneli-dlya-multipekarya-redmond-ramb-07-treugolnik-100000404418/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/1516661/100000404418b0.jpg',
'id': '100000404418_3333', 'description': 'Универсальные съемные панели
для любого мультипекаря REDMOND серии 6! Позволят приготовить сладкое
печенье, бисквитные пирожные, небольшие пирожки с разнообразными
начинками или сырники для завтрака. Панели изготовлены из металла с
антипригарным покрытием - они долговечны и легки в уходе.', 'rating':
4.88, 'review_count': 31}
- source_sentence: >-
Здравствуйте! Мне нужна техника для выпечки, а именно хлебопечка. Ищу
недорогую модель для использования дома. Вы могли бы мне порекомендовать
что-то подходящее?
sentences:
- >-
{'long_web_name': 'Кабель Perfeo TV - TV 2м White (T5002)', 'price':
223.0, 'url':
'https://megamarket.ru/catalog/details/kabel-perfeo-rca-rca-2m-white-t5002-600002644126/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-2/13/97/02/45/51/16/600002644126b0.jpeg',
'id': '600002644126_44832', 'description': 'Высококачественный и
недорогой антенный кабель ТВ вилка - ТВ розетка. Предназначен для
передачи аналоговых стереозвуковых сигналов между аудио и аудио-видео
устройствами или их компонентами', 'rating': 4.8, 'review_count': 5}
- >-
{'long_web_name': 'Хлебопечка Kitfort KT-304', 'price': 11990.0,
'description': '<p>Хлебопечь Kitfort КТ-304 мощностью 550 Вт позволяет
готовить хлеб весом до 750 г. Модель оснащена таймером, который дает
возможность отсрочить старт программы на срок до 13
часов.</p>\n<h2>Простая готовка вкусного хлеба</h2>\n<p>Прибор имеет 16
автоматических программ, среди которых есть режимы для приготовления
джема, йогурта, варенья, плова, каши, кекса, пирога, пасты, лазаньи,
пиццы, а также для замеса теста. Есть функция поддержания температуры.
Корпус выполнен из металла — прочного материала, устойчивого к
механическим повреждениям. Основные параметры
устройства:</p>\n<ul>\n<li>вес 4,9 кг — удобно
перемещать;</li>\n<li>дисплей — отображает время, номер выбранной
программы, оставшееся время до конца работы;</li>\n<li>звуковая
индикация — оповещает об окончании программы и этапах ее
выполнения.</li>\n</ul>\n<p>К прибору прилагаются мерный стаканчик,
лопатка и крюк. Длина сетевого шнура составляет 1 м — удобно
пользоваться даже на значительном расстоянии от розетки.</p>', 'rating':
4.88, 'review_count': 177}
- >-
{'long_web_name': 'Беспроводная мышь Logitech MX Master 3S Black
(910-006565)', 'price': 9499.0, 'url':
'https://megamarket.ru/catalog/details/besprovodnaya-igrovaya-mysh-logitech-910-006565-black-910-006565-100047346008/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/224/876/611/226/162/0/100047346008b0.png',
'id': '100047346008_99804', 'description': '', 'rating': 4.88,
'review_count': 63}
- source_sentence: >-
Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может,
что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть
варианты?
sentences:
- >-
{'long_web_name': 'Смарт браслет HUAWEI Band 8 (ASK-B19) розовый',
'price': 3383.0, 'description': '<p>Смарт-браслет Huawei Band 8 розового
цвета (ASK-B19) — это устройство, которое поможет контролировать
физическую активность и состояние здоровья.</p>\n<h2>Компактная
модель</h2>\n<p>Браслет оснащен цветным экраном AMOLED диагональю 1,47
дюйма. На нем отображается информация о количестве пройденных шагов,
частоте сердечных сокращений, уровне кислорода в крови и другие данные.
Устройство имеет следующие параметры:</p>\n<ul>\n<li>встроенный динамик
позволяет принимать и отклонять звонки;</li>\n<li>сенсорный дисплей
обеспечивает удобную навигацию;</li>\n<li>ремешок из силикона не
вызывает аллергических реакций и раздражений кожи;</li>\n<li>корпус
выполнен из пластика, который защищает внутренние детали от
повреждений.</li>\n</ul>\n<p>Благодаря водонепроницаемости можно плавать
в бассейне или море, не снимая гаджет. Также есть функция поиска
смартфона.</p>', 'rating': 4.95, 'review_count': 211}
- >-
{'long_web_name': 'Наушники Beyerdynamic DT 770 Pro (250 Ohm) Black',
'price': 33281.0, 'description': '<p>Наушники Beyerdynamic DT 770 Pro
Black закрытого динамического типа с диапазоном частот от 5 до 35000.
Особенность модели заключается в наличии специального велюрового
амбушюра и пружинного изголовья из высокопрочной стали, которое
сохраняет первозданную форму в течение продолжительного
времени.</p>\r\n<h2>Технический потенциал и отсутствие
помех</h2>\r\n<p>Конструкция наушников предполагает встроенную систему
Bass Reflex, которая позволяет достичь более качественных звуков на
низкой и высокой частоте. Модель характеризуется улучшенной
шумоизоляцией, предотвращающей возникновение помех во время
использования аксессуара. Наушникам свойственны такие
особенности:</p>\r\n<ul>\r\n<li>сопротивление – 250
Ом;</li>\r\n<li>уровень SPL – 96 дБ;</li>\r\n<li>чувствительность – 96
дБ.</li>\r\n</ul>\r\n<p>Наивысший показатель мощности составляет 100 мВ,
а искажение во время эксплуатации не превышает 0,05%. Также имеется
адаптер, позволяющий подключать технику к любому типу
предусилителя.</p>', 'rating': 4.92, 'review_count': 85}
- >-
{'long_web_name': 'Внешний аккумулятор Xiaomi Power Bank 3 30000 mAh
White', 'price': 1699.0, 'url':
'https://megamarket.ru/catalog/details/xiaomi-power-bank-3-30000-mah-vneshniy-akkumulyator-white-600002354850/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/211/585/306/791/613/7/600002354850b0.jpeg',
'id': '600002354850_148061', 'description': 'Xiaomi Mi Power Bank 3
30000mAh позволит вам зарядить как минимум 10 раз подряд любой
современный смартфон. Внешний аккумулятор подходит для всех мобильных
устройств. Корпус белого цвета приятен на ощупь, он устойчив к
царапинам, истиранию. Благодаря светодиодным лампочкам на панели, вы с
легкостью можете отслеживать уровень заряда аккумулятора.', 'rating':
4.08, 'review_count': 1001}
- source_sentence: >-
Здравствуйте! Подскажите, пожалуйста, у вас есть наушники, которые
подходят для профессионального использования при ремонте и тестировании
техники? Желательно мониторные и с хорошим качеством звука.
sentences:
- >-
{'long_web_name': 'Внешний аккумулятор Xiaomi Mi Power Bank 3 PLM18ZM
20000 mAh Type-C White', 'price': 1315.0, 'url':
'https://megamarket.ru/catalog/details/vneshniy-akkumulyator-xiaomi-mi-power-bank-3-20000-mah-type-c-white-600000977913/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/15118561227/600000977913b0.jpeg',
'id': '600000977913_58978', 'description': '<p>Внешний аккумулятор
Xiaomi Mi Power Bank 3 20000 mAh Type-C White обеспечит зарядку
мобильных телефонов, планшетов, ноутбуков или микротоковых электронных
девайсов (смарт-часов, фитнес-браслетов) при отсутствии сети.
Допускается двусторонняя зарядка (подключение к сети и мобильному
гаджету). Производителем предусмотрена защита от перегрева, скачков
напряжения, перегрузок, коротких замыканий.</p> \n<h2>Компактность и
производительность</h2> \n<p>Батарея Li-Pol защищена от воздействия
внешней среды, механических повреждений пластиковым корпусом размерами
153,5х73,5х27,5 мм. На нижней торцевой стороне корпуса размещаются
разъемы USB Тype С для подключения разряженных портативных устройств и
micro-USB для подключения к сети самого повербанка. Сверху находится
кнопка включения и световые индикаторы, которые сигнализируют об уровне
заряда аккумулятора. Ключевые показатели работы:</p> \n<ul>
\n<li>напряжение на выходе – 12 В;</li> \n<li>выходная мощность
– 45 Вт;</li> \n<li>зарядка аккумулятора проводится в течение 4,5
часов при подключении к сети.</li> \n</ul> \n<p>Полного заряда
аккумулятора достаточно для подзарядки 4-7 смартфонов, в зависимости от
модели. Срок службы Power Bank составляет в среднем 8 лет (500 рабочих
циклов).</p>', 'rating': 4.45, 'review_count': 2237}
- >-
{'long_web_name': 'Холодильник Haier C4F740CDBGU1 черный', 'price':
94999.0, 'description': '', 'rating': 4.77, 'review_count': 21}
- >-
{'long_web_name': 'Смарт-часы Samsung Galaxy Watch4 40 мм Rose Gold
(SM-R860NZDACIS)', 'price': 18790.0, 'url':
'https://megamarket.ru/catalog/details/smart-chasy-samsung-fresh-small-rose-gold-sm-r860nzdacis-100029004579/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-89/034/461/791/922/42/100029004579b0.jpg',
'id': '100029004579_146899', 'description': 'Совместимость с IOS
отсутствует.', 'rating': 4.76, 'review_count': 87}
- source_sentence: >-
Здравствуйте! Подскажите, пожалуйста, у вас есть наушники, которые
подходят для профессионального использования при ремонте и тестировании
техники? Желательно мониторные и с хорошим качеством звука.
sentences:
- >-
{'long_web_name': 'Картридж для матричного принтера CACTUS CS-ERC27
(CS-ERC27) черный, совместимый', 'price': 263.0, 'url':
'https://megamarket.ru/catalog/details/kartridzh-dlya-matrichnogo-printera-cactus-cs-erc27-cs-erc27-chernyy-sovmestimyy-100030714541/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/974/600/623/515/38/100030714541b0.jpg',
'id': '100030714541_14154', 'description': '', 'rating': 5.0,
'review_count': 1}
- >-
{'long_web_name': 'SSD накопитель Samsung 980 PRO M.2 2280 1 ТБ
(MZ-V8P1T0BW) подходит для PS5', 'price': 13100.0, 'url':
'https://megamarket.ru/catalog/details/vnutrenniy-ssd-nakopitel-samsung-980-pro-1tb-mz-v8p1t0bw-100028165060/',
'image_link':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-58/101/921/992/616/31/100028165060b0.jpg',
'id': '100028165060_90492', 'description': 'Накопитель M.2 SSD Samsung
980 PRO MZ-V8P1T0BW со скоростью до 7000 Мбит/сек в режиме
последовательного чтения обеспечивает высокий уровень производительности
аппаратной платформы при рендеринге, визуализации, в программах с 3D
графикой, а также при обработке игровых ресурсов. Подключается к
материнской плате через разъем M.2. Интерфейс PCI-E 4.0 x4 с поддержкой
NVMe и структурой памяти 3D TLC NAND — диск отличается высокой
пропускной способностью передачи данных. Объем памяти 1000 ГБ —
позволяет хранить большой объем информации. Алгоритм термоконтроля
Dynamic Thermal Guard автоматически управляет температурой и регулирует
энергопотребление для повышения стабильности. При помощи фирменного
программного обеспечения Samsung Magician можно контролировать состояние
диска, объем, температуру и другие параметры.', 'rating': 4.85,
'review_count': 1056}
- >-
{'id': '9628c865-82ac-4c81-817d-5c414715af2d', 'externalId':
'100052027418_149597', 'title': 'Проводные наушники Samsung EO-IC100
White', 'price': 1440.0, 'url':
'https://megamarket.ru/catalog/details/naushniki-mic-samsung-eo-ic100bwegru-white-type-c-100052027418_149597',
'imageLink':
'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/147/185/808/101/812/4/100052027418b0.jpg',
'description': '<p>Проводные наушники Samsung EO-IC100 White – это
стильное устройство, которое обеспечивает качественное звучание любимых
композиций.</p>\n<h2>Погружение в музыку</h2>\n<p>С помощью наушников
пользователь может наслаждаться любимыми треками в любое время. Они
оснащены встроенным микрофоном, который позволяет отвечать на звонки
прямо во время прогулки или поездки. Другие технические
параметры:</p>\n<ul>\n<li>Встроенный аккумулятор обеспечивает автономную
работу устройства в течение восьми часов.</li>\n<li>Закрытая конструкция
наушников создает эффект полного погружения в
музыку.</li>\n<li>Динамические излучатели воспроизводят чистый и
детализированный звук.</li>\n</ul>\n<p>Корпус выполнен из прочного
пластика, а амбушюры – из мягкого силикона. Устройство удобно носить
длительное время, оно не вызывает дискомфорта даже при активных
движениях.</p>', 'rating': 4.4, 'reviewCount': 30, 'extraInfo': ''}
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- cosine_accuracy
- cosine_accuracy_threshold
- cosine_f1
- cosine_f1_threshold
- cosine_precision
- cosine_recall
- cosine_ap
- cosine_mcc
model-index:
- name: SentenceTransformer based on sergeyzh/rubert-tiny-turbo
results:
- task:
type: binary-classification
name: Binary Classification
dataset:
name: item classification
type: item-classification
metrics:
- type: cosine_accuracy
value: 0.946987951807229
name: Cosine Accuracy
- type: cosine_accuracy_threshold
value: 0.776970386505127
name: Cosine Accuracy Threshold
- type: cosine_f1
value: 0.8654895666131622
name: Cosine F1
- type: cosine_f1_threshold
value: 0.7680637836456299
name: Cosine F1 Threshold
- type: cosine_precision
value: 0.7823563551944284
name: Cosine Precision
- type: cosine_recall
value: 0.9683908045977011
name: Cosine Recall
- type: cosine_ap
value: 0.7985956006356972
name: Cosine Ap
- type: cosine_mcc
value: 0.8402021557690131
name: Cosine Mcc
SentenceTransformer based on sergeyzh/rubert-tiny-turbo
This is a sentence-transformers model finetuned from sergeyzh/rubert-tiny-turbo. It maps sentences & paragraphs to a 312-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: sergeyzh/rubert-tiny-turbo
- Maximum Sequence Length: 2048 tokens
- Output Dimensionality: 312 dimensions
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 312, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("denis-gordeev/reranker_dialog_items_biencoder_rubert-tiny-turbo-7")
# Run inference
sentences = [
'Здравствуйте! Подскажите, пожалуйста, у вас есть наушники, которые подходят для профессионального использования при ремонте и тестировании техники? Желательно мониторные и с хорошим качеством звука.',
"{'id': '9628c865-82ac-4c81-817d-5c414715af2d', 'externalId': '100052027418_149597', 'title': 'Проводные наушники Samsung EO-IC100 White', 'price': 1440.0, 'url': 'https://megamarket.ru/catalog/details/naushniki-mic-samsung-eo-ic100bwegru-white-type-c-100052027418_149597', 'imageLink': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/147/185/808/101/812/4/100052027418b0.jpg', 'description': '<p>Проводные наушники Samsung EO-IC100 White – это стильное устройство, которое обеспечивает качественное звучание любимых композиций.</p>\\n<h2>Погружение в музыку</h2>\\n<p>С помощью наушников пользователь может наслаждаться любимыми треками в любое время. Они оснащены встроенным микрофоном, который позволяет отвечать на звонки прямо во время прогулки или поездки. Другие технические параметры:</p>\\n<ul>\\n<li>Встроенный аккумулятор обеспечивает автономную работу устройства в течение восьми часов.</li>\\n<li>Закрытая конструкция наушников создает эффект полного погружения в музыку.</li>\\n<li>Динамические излучатели воспроизводят чистый и детализированный звук.</li>\\n</ul>\\n<p>Корпус выполнен из прочного пластика, а амбушюры – из мягкого силикона. Устройство удобно носить длительное время, оно не вызывает дискомфорта даже при активных движениях.</p>', 'rating': 4.4, 'reviewCount': 30, 'extraInfo': ''}",
"{'long_web_name': 'Картридж для матричного принтера CACTUS CS-ERC27 (CS-ERC27) черный, совместимый', 'price': 263.0, 'url': 'https://megamarket.ru/catalog/details/kartridzh-dlya-matrichnogo-printera-cactus-cs-erc27-cs-erc27-chernyy-sovmestimyy-100030714541/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/974/600/623/515/38/100030714541b0.jpg', 'id': '100030714541_14154', 'description': '', 'rating': 5.0, 'review_count': 1}",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 312]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Binary Classification
- Dataset:
item-classification
- Evaluated with
BinaryClassificationEvaluator
Metric | Value |
---|---|
cosine_accuracy | 0.947 |
cosine_accuracy_threshold | 0.777 |
cosine_f1 | 0.8655 |
cosine_f1_threshold | 0.7681 |
cosine_precision | 0.7824 |
cosine_recall | 0.9684 |
cosine_ap | 0.7986 |
cosine_mcc | 0.8402 |
Training Details
Training Dataset
Unnamed Dataset
- Size: 49,285 training samples
- Columns:
anchor
,text
, andlabel
- Approximate statistics based on the first 1000 samples:
anchor text label type string string int details - min: 19 tokens
- mean: 35.78 tokens
- max: 56 tokens
- min: 55 tokens
- mean: 352.41 tokens
- max: 1356 tokens
- 0: ~85.90%
- 1: ~14.10%
- Samples:
anchor text label Здравствуйте! Я хочу купить Smart-TV приставку для просмотра фильмов и видео. Можете посоветовать какие-то модели? Желательно, чтобы приставка была быстрая и поддерживала 4K.
{'long_web_name': 'Смарт-приставка Xiaomi TV Box S 2nd Gen 2/8 черная (PFJ4167RU)', 'price': 6290.0, 'description': 'НОВИНКА 2023 ГОДА! 2-е поколение потокового медиаплеера Xiaomi TV Box S. ТВ приставка Xiaomi TV Box S 2nd Gen (PFJ4167RU). 4х ядерный процессор Cortex-A55 Графический процессор-ARM Mali G31 MP2 Dolby Vision 4K Ultra HDR 10+ Встроены Google TV и Google Assistant 360° Bluetooth и ИК-пульт дистанционного управления Двухдиапазонный Wi-Fi Качество изображения 4K Ultra HD Беспроводное дублирование экрана Улучшенный угол обзора', 'rating': 4.86, 'review_count': 919}
1
Здравствуйте! Я хочу купить Smart-TV приставку для просмотра фильмов и видео. Можете посоветовать какие-то модели? Желательно, чтобы приставка была быстрая и поддерживала 4K.
{'long_web_name': 'Смартфон Honor Honor 90 12/512GB изумрудный зеленый (5109ATRU)', 'price': 40890.0, 'url': 'https://megamarket.ru/catalog/details/smartfon-honor-honor-90-12-512gb-izumrudnyy-zelenyy-5109atru-100063902396/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-97/523/126/541/612/13/100063902396b0.jpg', 'id': '100063902396_126519', 'description': '', 'rating': 4.86, 'review_count': 27}
0
Здравствуйте! Я хочу купить Smart-TV приставку для просмотра фильмов и видео. Можете посоветовать какие-то модели? Желательно, чтобы приставка была быстрая и поддерживала 4K.
{'long_web_name': 'Видеокарта MSI NVIDIA GeForce RTX 3060 Gaming X LHR', 'price': 39330.0, 'url': 'https://megamarket.ru/catalog/details/videokarta-msi-geforce-rtx-3060-gaming-x-12g-100028302832/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/179/595/992/532/211/22/100028302832b0.png', 'id': '100028302832_40440', 'description': '
Видеокарта MSI NVIDIA GeForce RTX 3060 Gaming X (LHR) (RTX 3060 GAMING X 12G) - это мощное графическое решение для настоящих геймеров. Современный дизайн и передовые технологии позволяют вам наслаждаться потрясающими игровыми впечатлениями и запускать самые требовательные игры без затруднений.
\n\nПотрясающая графика и высокая производительность
\n\nС видеокартой MSI NVIDIA GeForce RTX 3060 Gaming X вы сможете наслаждаться невероятно реалистичными и проработанными изображениями. Благодаря новейшему графическому процессору GA106 и объему видеопамяти 12 ГБ игры будут работать плавно и без лагов, а поддержка трассировки лучей ...
0
- Loss:
ContrastiveLoss
with these parameters:{ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE", "margin": 0.5, "size_average": true }
Evaluation Dataset
Unnamed Dataset
- Size: 7,885 evaluation samples
- Columns:
anchor
,text
, andlabel
- Approximate statistics based on the first 1000 samples:
anchor text label type string string int details - min: 7 tokens
- mean: 23.9 tokens
- max: 37 tokens
- min: 56 tokens
- mean: 365.94 tokens
- max: 1356 tokens
- 0: ~85.70%
- 1: ~14.30%
- Samples:
anchor text label Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть варианты?
{'long_web_name': 'Фитнес-браслет HUAWEI Band 8, черный матовый', 'price': 2555.0, 'description': '
Фитнес-браслет Huawei Band 8 (черный) — это устройство, которое помогает следить за здоровьем и физической активностью.
\nПомогает контролировать состояние организма
\nБраслет оснащен датчиком SpO2, который отслеживает уровень кислорода в крови. Также он имеет встроенный пульсометр, который позволяет узнать частоту сердцебиения. Другие параметры:
\n- \n
- дисплей AMOLED — отображает время, количество пройденных шагов, сожженные калории; \n
- 100 спортивных режимов — можно выбрать подходящий для тренировки; \n
- гироскоп и акселерометр — определяют положение тела в пространстве и скорость движения. \n
Благодаря водонепроницаемости браслет можно носить во время плавания. Корпус защищен от попадания влаги и пыли. Ремешок выполнен из силикона — мягкий и приятный на ощупь. Есть возможность регулировать длину.
', 'rating': 4.94, 'review_count': 7...1
Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть варианты?
{'long_web_name': 'Видеокарта ASUS NVIDIA GeForce RTX 4090 TUF Gaming OC Edition (TUF-RTX4090-O24G-GAMING)', 'price': 296368.0, 'url': 'https://megamarket.ru/catalog/details/videokarta-asus-tuf-rtx4090-o24g-gaming-rtx4090-100044516044/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/228/133/388/117/192/3/100044516044b9.jpg', 'id': '100044516044_59182', 'description': '
Видеокарта ASUS NVIDIA GeForce RTX 4090 TUF Gaming OC Edition (90YV0IE0-M0NA00) - высокопроизводительное графическое решение, которое обеспечивает невероятно реалистичную визуализацию игровых миров.
\nМаксимальная производительность для настоящих игроков
\nASUS NVIDIA GeForce RTX 4090 TUF Gaming OC Edition - это явный лидер среди видеокарт нового поколения. Она оснащена мощным графическим процессором GeForce RTX 4090 и имеет объем видеопамяти 24 ГБ GDDR6X, что обеспечивает потрясающую детализацию и плавность изображения.
\nУлучшенная поддержка трассировки лучей предоставля...
\n
0
Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть варианты?
{'long_web_name': 'Встраиваемая варочная панель газовая Weissgauff HGG 640 BG черный', 'price': 16790.0, 'url': 'https://megamarket.ru/catalog/details/vstraivaemaya-gazovaya-panel-weissgauff-hgg-640-bg-100026765438/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/609/462/228/514/151/3/100026765438b0.jpg', 'id': '100026765438_6061', 'description': 'Встраиваемая независимая газовая панель Weissgauff шириной 60 см, исполненная в закалённом чёрном стекле - это стильное и компактное решение для вашей кухни!
*Ширина 60 см это европейский стандарт качества, признанный миллионами довольных покупателей по всему миру!
*Чёрное закаленное стекло не только роскошно выглядит, подчеркивая великолепный внешний вид данной модели, но и отлично справляется с механическими воздействиями и температурными перегрузками!
*Решетки из высококачественного чугуна это неизменное качество, надежность и долговечность, воплощенные в каждой детали! А особая элегантность их дизайна не тольк...0
- Loss:
ContrastiveLoss
with these parameters:{ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE", "margin": 0.5, "size_average": true }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: stepsper_device_train_batch_size
: 16per_device_eval_batch_size
: 16num_train_epochs
: 1warmup_ratio
: 0.1fp16
: Trueload_best_model_at_end
: Truebatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 16per_device_eval_batch_size
: 16per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 5e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 1max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Truefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Trueignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Nonehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseinclude_for_metrics
: []eval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falseaverage_tokens_across_devices
: Falseprompts
: Nonebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Epoch | Step | Training Loss | Validation Loss | item-classification_cosine_ap |
---|---|---|---|---|
0 | 0 | - | 0.0237 | 0.4047 |
0.0649 | 100 | 0.0132 | - | - |
0.1298 | 200 | 0.0062 | - | - |
0.1622 | 250 | - | 0.0037 | 0.7734 |
0.1947 | 300 | 0.0053 | - | - |
0.2596 | 400 | 0.0053 | - | - |
0.3245 | 500 | 0.004 | 0.0043 | 0.7855 |
0.3894 | 600 | 0.0049 | - | - |
0.4543 | 700 | 0.0044 | - | - |
0.4867 | 750 | - | 0.0039 | 0.7641 |
0.5191 | 800 | 0.0039 | - | - |
0.5840 | 900 | 0.0043 | - | - |
0.6489 | 1000 | 0.0036 | 0.0035 | 0.7709 |
0.7138 | 1100 | 0.0042 | - | - |
0.7787 | 1200 | 0.0036 | - | - |
0.8112 | 1250 | - | 0.0036 | 0.7956 |
0.8436 | 1300 | 0.0038 | - | - |
0.9085 | 1400 | 0.0038 | - | - |
0.9734 | 1500 | 0.0032 | 0.0035 | 0.7986 |
1.0 | 1541 | - | 0.0035 | 0.7986 |
- The bold row denotes the saved checkpoint.
Framework Versions
- Python: 3.10.16
- Sentence Transformers: 3.4.0.dev0
- Transformers: 4.47.1
- PyTorch: 2.5.1+cu124
- Accelerate: 1.2.1
- Datasets: 3.2.0
- Tokenizers: 0.21.0
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
ContrastiveLoss
@inproceedings{hadsell2006dimensionality,
author={Hadsell, R. and Chopra, S. and LeCun, Y.},
booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
title={Dimensionality Reduction by Learning an Invariant Mapping},
year={2006},
volume={2},
number={},
pages={1735-1742},
doi={10.1109/CVPR.2006.100}
}