denis-gordeev's picture
Add new SentenceTransformer model
84368b4 verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:49285
  - loss:ContrastiveLoss
base_model: sergeyzh/rubert-tiny-turbo
widget:
  - source_sentence: >-
      Здравствуйте! Подскажите, пожалуйста, у вас есть смарт-часы Samsung Gear?
      И какие модели сейчас в наличии?
    sentences:
      - >-
        {'long_web_name': 'Кронштейн для телевизора 17"-43" ONKRON M4S
        наклонно-поворотный, чёрный', 'price': 2300.0, 'url':
        'https://megamarket.ru/catalog/details/kronshteyn-dlya-televizora-onkron-m4s-100024214080/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-36/944/630/271/712/55/100024214080b0.jpg',
        'id': '100024214080_16245', 'description': '<p>Настенный
        наклонно-поворотный кронштейн для телевизора&nbsp;<strong>ONKRON
        M4S</strong>&nbsp;предназначен для экранов с диагональю от 17 до 43
        дюймов (43,18-109,2 см).</p><p>Крепление для ТВ подходит для маленьких и
        средних телевизоров весом до 35 кг. Крепкий и надежный, при этом
        элегантный кронштейн для ТВ станет стильным дополнением домашнего
        интерьера.</p><p><strong>Преимущества:</strong></p><p>а) Предусмотренная
        производителем система держателей проводов позволит закрепить их в
        нужном положении &ndash; это придаст дополнительное удобство и сделает
        более аккуратным внешний вид Вашего устройства.<br />б) Крепление на
        стену изготовлено из высококачественной стали, что обеспечивает его
        прочность.<br />в) Пластиковые накладки скроют всевозможные монтажные
        крепления, добавив эстетичности образу Вашего устройства.<br />г) Вы
        можете занимать любое удобное положение при просмотре ТВ за счет широких
        возможностей регулировки угла наклона от -5&deg; до +8&deg;. Эти
        возможности позволят получать удовольствие от просмотра.<br />д)
        Подходит практически всем современным телевизорам - LCD, LED, OLED,
        Ultra HD, plasma, с выгнутыми и плоскими мониторами. Поддерживает
        стандарты VESA в диапазоне от 100x100 мм до 200x200 мм.</p><p>Приятным
        удивлением станет стоимость подставки для телевизора &ndash; ценовое
        решение можно назвать максимально выгодным, учитывая заявленные
        технические характеристики продукта, особенно возможности наклона и
        поворота.</p><p><strong>Совместимость</strong>: кронштейн подходит для
        большинства телевизоров популярных брендов, среди которых Samsung, LG,
        Sony, KIVI, Tcl, Xiaomi Mi, SUPRA, Panasonic, Hyundai, Erisson, Asano,
        Horizont, JVC, Thomson, HARTENS, Sharp, Toshiba, Skyworth, BBK, AVEL,
        Витязь, Веко, BQ, DEXP, SkyLine, Pioneer, Rolsen, Harper, Hisense,
        Hitachi, Polarline, Prestigio, Telefunken и
        других.</p><p><strong>Комплектация</strong>: кронштейн для телевизора,
        комплект ключей и крепежа для установки ТВ, подробная инструкция на
        русском языке.</p>', 'rating': 4.94, 'review_count': 434}
      - >-
        {'long_web_name': 'Смарт-часы Huawei Watch GT 4 черный', 'price':
        19999.0, 'url':
        'https://megamarket.ru/catalog/details/smart-chasy-gt-4-chernyy-chernyy-3215416-600013640661/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/415/122/331/011/232/7/600013640661b0.jpeg',
        'id': '600013640661_99804', 'description': 'Мода не стоит на месте, как
        и технологии. Вперед к достижениям и новым открытиям! Носимые устройства
        HUAWEI. Опережая тренды.  Культовый восьмиугольный дизайн.
        Сбалансированные пропорции в сочетании с ровным гранями — воплощение
        незаурядной классики часового искусства.  Завораживающая игра света.
        Благодаря инновационному креплению и изящному безелю часы выглядят более
        воздушными.  Сочетание эргономичности и стиля Легкий корпус и на 13%
        более высокая полезная площадь экрана2, обрамленного узким безелем,
        создают идеальный баланс между эстетикой и функциональностью. 
        ДлинаxШиринаxВысота (мм): PNX-B19: 46 x 46 x 10,9  Время зарядки: Около
        100 минут (при температуре окружающей среды +25°C) Напряжение и сила
        тока зарядного устройства 5 В /2 А Теоретическое время работы 14 дней
        (PNX-B19)/7 дней (ARA-B19) в обычных сценариях использования (зависит от
        привычек пользователя, и интенсивности использования устройства).
        Bluetooth BT5.2, поддержка BLE/BR/EDR NFC Поддерживается Навигация
        Поддерживается Wi-Fi Поддерживается (только 2,4 ГГц) Вибромотор Линейный
        мотор Микрофон Поддерживается Динамик Поддерживается Физические кнопки
        Кнопка питания, функциональная кнопка, поддержка таких операций, как
        нажатие, нажатие и удержание и поворот кнопки часов Водонепроницаемость
        5 АТМ, IP68', 'rating': 4.92, 'review_count': 541}
      - >-
        {'long_web_name': 'Сменная панель для мультипекаря Redmond RAMB-07',
        'price': 1499.0, 'url':
        'https://megamarket.ru/catalog/details/paneli-dlya-multipekarya-redmond-ramb-07-treugolnik-100000404418/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/1516661/100000404418b0.jpg',
        'id': '100000404418_3333', 'description': 'Универсальные съемные панели
        для любого мультипекаря REDMOND серии 6! Позволят приготовить сладкое
        печенье, бисквитные пирожные, небольшие пирожки с разнообразными
        начинками или сырники для завтрака. Панели изготовлены из металла с
        антипригарным покрытием - они долговечны и легки в уходе.', 'rating':
        4.88, 'review_count': 31}
  - source_sentence: >-
      Здравствуйте! Мне нужна техника для выпечки, а именно хлебопечка. Ищу
      недорогую модель для использования дома. Вы могли бы мне порекомендовать
      что-то подходящее?
    sentences:
      - >-
        {'long_web_name': 'Кабель Perfeo TV - TV 2м White (T5002)', 'price':
        223.0, 'url':
        'https://megamarket.ru/catalog/details/kabel-perfeo-rca-rca-2m-white-t5002-600002644126/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-2/13/97/02/45/51/16/600002644126b0.jpeg',
        'id': '600002644126_44832', 'description': 'Высококачественный и
        недорогой антенный кабель ТВ вилка - ТВ розетка. Предназначен для
        передачи аналоговых стереозвуковых сигналов между аудио и аудио-видео
        устройствами или их компонентами', 'rating': 4.8, 'review_count': 5}
      - >-
        {'long_web_name': 'Хлебопечка Kitfort KT-304', 'price': 11990.0,
        'description': '<p>Хлебопечь Kitfort КТ-304 мощностью 550 Вт позволяет
        готовить хлеб весом до 750 г. Модель оснащена таймером, который дает
        возможность отсрочить старт программы на срок до 13
        часов.</p>\n<h2>Простая готовка вкусного хлеба</h2>\n<p>Прибор имеет 16
        автоматических программ, среди которых есть режимы для приготовления
        джема, йогурта, варенья, плова, каши, кекса, пирога, пасты, лазаньи,
        пиццы, а также для замеса теста. Есть функция поддержания температуры.
        Корпус выполнен из металла — прочного материала, устойчивого к
        механическим повреждениям. Основные параметры
        устройства:</p>\n<ul>\n<li>вес 4,9 кг — удобно
        перемещать;</li>\n<li>дисплей — отображает время, номер выбранной
        программы, оставшееся время до конца работы;</li>\n<li>звуковая
        индикация — оповещает об окончании программы и этапах ее
        выполнения.</li>\n</ul>\n<p>К прибору прилагаются мерный стаканчик,
        лопатка и крюк. Длина сетевого шнура составляет 1 м — удобно
        пользоваться даже на значительном расстоянии от розетки.</p>', 'rating':
        4.88, 'review_count': 177}
      - >-
        {'long_web_name': 'Беспроводная мышь Logitech MX Master 3S Black
        (910-006565)', 'price': 9499.0, 'url':
        'https://megamarket.ru/catalog/details/besprovodnaya-igrovaya-mysh-logitech-910-006565-black-910-006565-100047346008/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/224/876/611/226/162/0/100047346008b0.png',
        'id': '100047346008_99804', 'description': '', 'rating': 4.88,
        'review_count': 63}
  - source_sentence: >-
      Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может,
      что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть
      варианты?
    sentences:
      - >-
        {'long_web_name': 'Смарт браслет HUAWEI Band 8 (ASK-B19) розовый',
        'price': 3383.0, 'description': '<p>Смарт-браслет Huawei Band 8 розового
        цвета (ASK-B19) — это устройство, которое поможет контролировать
        физическую активность и состояние здоровья.</p>\n<h2>Компактная
        модель</h2>\n<p>Браслет оснащен цветным экраном AMOLED диагональю 1,47
        дюйма. На нем отображается информация о количестве пройденных шагов,
        частоте сердечных сокращений, уровне кислорода в крови и другие данные.
        Устройство имеет следующие параметры:</p>\n<ul>\n<li>встроенный динамик
        позволяет принимать и отклонять звонки;</li>\n<li>сенсорный дисплей
        обеспечивает удобную навигацию;</li>\n<li>ремешок из силикона не
        вызывает аллергических реакций и раздражений кожи;</li>\n<li>корпус
        выполнен из пластика, который защищает внутренние детали от
        повреждений.</li>\n</ul>\n<p>Благодаря водонепроницаемости можно плавать
        в бассейне или море, не снимая гаджет. Также есть функция поиска
        смартфона.</p>', 'rating': 4.95, 'review_count': 211}
      - >-
        {'long_web_name': 'Наушники Beyerdynamic DT 770 Pro (250 Ohm) Black',
        'price': 33281.0, 'description': '<p>Наушники Beyerdynamic DT 770 Pro
        Black закрытого динамического типа с диапазоном частот от 5 до 35000.
        Особенность модели заключается в наличии специального велюрового
        амбушюра и пружинного изголовья из высокопрочной стали, которое
        сохраняет первозданную форму в течение продолжительного
        времени.</p>\r\n<h2>Технический потенциал и отсутствие
        помех</h2>\r\n<p>Конструкция наушников предполагает встроенную систему
        Bass Reflex, которая позволяет достичь более качественных звуков на
        низкой и высокой частоте. Модель характеризуется улучшенной
        шумоизоляцией, предотвращающей возникновение помех во время
        использования аксессуара. Наушникам свойственны такие
        особенности:</p>\r\n<ul>\r\n<li>сопротивление – 250
        Ом;</li>\r\n<li>уровень SPL – 96 дБ;</li>\r\n<li>чувствительность – 96
        дБ.</li>\r\n</ul>\r\n<p>Наивысший показатель мощности составляет 100 мВ,
        а искажение во время эксплуатации не превышает 0,05%. Также имеется
        адаптер, позволяющий подключать технику к любому типу
        предусилителя.</p>', 'rating': 4.92, 'review_count': 85}
      - >-
        {'long_web_name': 'Внешний аккумулятор Xiaomi Power Bank 3 30000 mAh
        White', 'price': 1699.0, 'url':
        'https://megamarket.ru/catalog/details/xiaomi-power-bank-3-30000-mah-vneshniy-akkumulyator-white-600002354850/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/211/585/306/791/613/7/600002354850b0.jpeg',
        'id': '600002354850_148061', 'description': 'Xiaomi Mi Power Bank 3
        30000mAh позволит вам зарядить как минимум 10 раз подряд любой
        современный смартфон. Внешний аккумулятор подходит для всех мобильных
        устройств. Корпус белого цвета приятен на ощупь, он устойчив к
        царапинам, истиранию. Благодаря светодиодным лампочкам на панели, вы с
        легкостью можете отслеживать уровень заряда аккумулятора.', 'rating':
        4.08, 'review_count': 1001}
  - source_sentence: >-
      Здравствуйте! Подскажите, пожалуйста, у вас есть наушники, которые
      подходят для профессионального использования при ремонте и тестировании
      техники? Желательно мониторные и с хорошим качеством звука.
    sentences:
      - >-
        {'long_web_name': 'Внешний аккумулятор Xiaomi Mi Power Bank 3 PLM18ZM
        20000 mAh Type-C White', 'price': 1315.0, 'url':
        'https://megamarket.ru/catalog/details/vneshniy-akkumulyator-xiaomi-mi-power-bank-3-20000-mah-type-c-white-600000977913/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/15118561227/600000977913b0.jpeg',
        'id': '600000977913_58978', 'description': '<p>Внешний аккумулятор
        Xiaomi Mi Power Bank 3 20000 mAh Type-C White обеспечит зарядку
        мобильных телефонов, планшетов, ноутбуков или микротоковых электронных
        девайсов (смарт-часов, фитнес-браслетов) при отсутствии сети.
        Допускается двусторонняя зарядка (подключение к сети и мобильному
        гаджету). Производителем предусмотрена защита от перегрева, скачков
        напряжения, перегрузок, коротких замыканий.</p> \n<h2>Компактность и
        производительность</h2> \n<p>Батарея Li-Pol защищена от воздействия
        внешней среды, механических повреждений пластиковым корпусом размерами
        153,5х73,5х27,5 мм. На нижней торцевой стороне корпуса размещаются
        разъемы USB Тype С для подключения разряженных портативных устройств и
        micro-USB для подключения к сети самого повербанка. Сверху находится
        кнопка включения и световые индикаторы, которые сигнализируют об уровне
        заряда аккумулятора. Ключевые показатели работы:</p> \n<ul>
        \n<li>напряжение на выходе &ndash; 12 В;</li> \n<li>выходная мощность
        &ndash; 45 Вт;</li> \n<li>зарядка аккумулятора проводится в течение 4,5
        часов при подключении к сети.</li> \n</ul> \n<p>Полного заряда
        аккумулятора достаточно для подзарядки 4-7 смартфонов, в зависимости от
        модели. Срок службы Power Bank составляет в среднем 8 лет (500 рабочих
        циклов).</p>', 'rating': 4.45, 'review_count': 2237}
      - >-
        {'long_web_name': 'Холодильник Haier C4F740CDBGU1 черный', 'price':
        94999.0, 'description': '', 'rating': 4.77, 'review_count': 21}
      - >-
        {'long_web_name': 'Смарт-часы Samsung Galaxy Watch4 40 мм Rose Gold
        (SM-R860NZDACIS)', 'price': 18790.0, 'url':
        'https://megamarket.ru/catalog/details/smart-chasy-samsung-fresh-small-rose-gold-sm-r860nzdacis-100029004579/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-89/034/461/791/922/42/100029004579b0.jpg',
        'id': '100029004579_146899', 'description': 'Совместимость с IOS
        отсутствует.', 'rating': 4.76, 'review_count': 87}
  - source_sentence: >-
      Здравствуйте! Подскажите, пожалуйста, у вас есть наушники, которые
      подходят для профессионального использования при ремонте и тестировании
      техники? Желательно мониторные и с хорошим качеством звука.
    sentences:
      - >-
        {'long_web_name': 'Картридж для матричного принтера CACTUS CS-ERC27
        (CS-ERC27) черный, совместимый', 'price': 263.0, 'url':
        'https://megamarket.ru/catalog/details/kartridzh-dlya-matrichnogo-printera-cactus-cs-erc27-cs-erc27-chernyy-sovmestimyy-100030714541/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/974/600/623/515/38/100030714541b0.jpg',
        'id': '100030714541_14154', 'description': '', 'rating': 5.0,
        'review_count': 1}
      - >-
        {'long_web_name': 'SSD накопитель Samsung 980 PRO M.2 2280 1 ТБ
        (MZ-V8P1T0BW) подходит для PS5', 'price': 13100.0, 'url':
        'https://megamarket.ru/catalog/details/vnutrenniy-ssd-nakopitel-samsung-980-pro-1tb-mz-v8p1t0bw-100028165060/',
        'image_link':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-58/101/921/992/616/31/100028165060b0.jpg',
        'id': '100028165060_90492', 'description': 'Накопитель M.2 SSD Samsung
        980 PRO MZ-V8P1T0BW со скоростью до 7000 Мбит/сек в режиме
        последовательного чтения обеспечивает высокий уровень производительности
        аппаратной платформы при рендеринге, визуализации, в программах с 3D
        графикой, а также при обработке игровых ресурсов. Подключается к
        материнской плате через разъем M.2. Интерфейс PCI-E 4.0 x4 с поддержкой
        NVMe и структурой памяти 3D TLC NAND — диск отличается высокой
        пропускной способностью передачи данных. Объем памяти 1000 ГБ —
        позволяет хранить большой объем информации. Алгоритм термоконтроля
        Dynamic Thermal Guard автоматически управляет температурой и регулирует
        энергопотребление для повышения стабильности. При помощи фирменного
        программного обеспечения Samsung Magician можно контролировать состояние
        диска, объем, температуру и другие параметры.', 'rating': 4.85,
        'review_count': 1056}
      - >-
        {'id': '9628c865-82ac-4c81-817d-5c414715af2d', 'externalId':
        '100052027418_149597', 'title': 'Проводные наушники Samsung EO-IC100
        White', 'price': 1440.0, 'url':
        'https://megamarket.ru/catalog/details/naushniki-mic-samsung-eo-ic100bwegru-white-type-c-100052027418_149597',
        'imageLink':
        'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/147/185/808/101/812/4/100052027418b0.jpg',
        'description': '<p>Проводные наушники Samsung EO-IC100 White – это
        стильное устройство, которое обеспечивает качественное звучание любимых
        композиций.</p>\n<h2>Погружение в музыку</h2>\n<p>С помощью наушников
        пользователь может наслаждаться любимыми треками в любое время. Они
        оснащены встроенным микрофоном, который позволяет отвечать на звонки
        прямо во время прогулки или поездки. Другие технические
        параметры:</p>\n<ul>\n<li>Встроенный аккумулятор обеспечивает автономную
        работу устройства в течение восьми часов.</li>\n<li>Закрытая конструкция
        наушников создает эффект полного погружения в
        музыку.</li>\n<li>Динамические излучатели воспроизводят чистый и
        детализированный звук.</li>\n</ul>\n<p>Корпус выполнен из прочного
        пластика, а амбушюры – из мягкого силикона. Устройство удобно носить
        длительное время, оно не вызывает дискомфорта даже при активных
        движениях.</p>', 'rating': 4.4, 'reviewCount': 30, 'extraInfo': ''}
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy
  - cosine_accuracy_threshold
  - cosine_f1
  - cosine_f1_threshold
  - cosine_precision
  - cosine_recall
  - cosine_ap
  - cosine_mcc
model-index:
  - name: SentenceTransformer based on sergeyzh/rubert-tiny-turbo
    results:
      - task:
          type: binary-classification
          name: Binary Classification
        dataset:
          name: item classification
          type: item-classification
        metrics:
          - type: cosine_accuracy
            value: 0.946987951807229
            name: Cosine Accuracy
          - type: cosine_accuracy_threshold
            value: 0.776970386505127
            name: Cosine Accuracy Threshold
          - type: cosine_f1
            value: 0.8654895666131622
            name: Cosine F1
          - type: cosine_f1_threshold
            value: 0.7680637836456299
            name: Cosine F1 Threshold
          - type: cosine_precision
            value: 0.7823563551944284
            name: Cosine Precision
          - type: cosine_recall
            value: 0.9683908045977011
            name: Cosine Recall
          - type: cosine_ap
            value: 0.7985956006356972
            name: Cosine Ap
          - type: cosine_mcc
            value: 0.8402021557690131
            name: Cosine Mcc

SentenceTransformer based on sergeyzh/rubert-tiny-turbo

This is a sentence-transformers model finetuned from sergeyzh/rubert-tiny-turbo. It maps sentences & paragraphs to a 312-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: sergeyzh/rubert-tiny-turbo
  • Maximum Sequence Length: 2048 tokens
  • Output Dimensionality: 312 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 312, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("denis-gordeev/reranker_dialog_items_biencoder_rubert-tiny-turbo-7")
# Run inference
sentences = [
    'Здравствуйте! Подскажите, пожалуйста, у вас есть наушники, которые подходят для профессионального использования при ремонте и тестировании техники? Желательно мониторные и с хорошим качеством звука.',
    "{'id': '9628c865-82ac-4c81-817d-5c414715af2d', 'externalId': '100052027418_149597', 'title': 'Проводные наушники Samsung EO-IC100 White', 'price': 1440.0, 'url': 'https://megamarket.ru/catalog/details/naushniki-mic-samsung-eo-ic100bwegru-white-type-c-100052027418_149597', 'imageLink': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/147/185/808/101/812/4/100052027418b0.jpg', 'description': '<p>Проводные наушники Samsung EO-IC100 White – это стильное устройство, которое обеспечивает качественное звучание любимых композиций.</p>\\n<h2>Погружение в музыку</h2>\\n<p>С помощью наушников пользователь может наслаждаться любимыми треками в любое время. Они оснащены встроенным микрофоном, который позволяет отвечать на звонки прямо во время прогулки или поездки. Другие технические параметры:</p>\\n<ul>\\n<li>Встроенный аккумулятор обеспечивает автономную работу устройства в течение восьми часов.</li>\\n<li>Закрытая конструкция наушников создает эффект полного погружения в музыку.</li>\\n<li>Динамические излучатели воспроизводят чистый и детализированный звук.</li>\\n</ul>\\n<p>Корпус выполнен из прочного пластика, а амбушюры – из мягкого силикона. Устройство удобно носить длительное время, оно не вызывает дискомфорта даже при активных движениях.</p>', 'rating': 4.4, 'reviewCount': 30, 'extraInfo': ''}",
    "{'long_web_name': 'Картридж для матричного принтера CACTUS CS-ERC27 (CS-ERC27) черный, совместимый', 'price': 263.0, 'url': 'https://megamarket.ru/catalog/details/kartridzh-dlya-matrichnogo-printera-cactus-cs-erc27-cs-erc27-chernyy-sovmestimyy-100030714541/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/974/600/623/515/38/100030714541b0.jpg', 'id': '100030714541_14154', 'description': '', 'rating': 5.0, 'review_count': 1}",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 312]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Binary Classification

Metric Value
cosine_accuracy 0.947
cosine_accuracy_threshold 0.777
cosine_f1 0.8655
cosine_f1_threshold 0.7681
cosine_precision 0.7824
cosine_recall 0.9684
cosine_ap 0.7986
cosine_mcc 0.8402

Training Details

Training Dataset

Unnamed Dataset

  • Size: 49,285 training samples
  • Columns: anchor, text, and label
  • Approximate statistics based on the first 1000 samples:
    anchor text label
    type string string int
    details
    • min: 19 tokens
    • mean: 35.78 tokens
    • max: 56 tokens
    • min: 55 tokens
    • mean: 352.41 tokens
    • max: 1356 tokens
    • 0: ~85.90%
    • 1: ~14.10%
  • Samples:
    anchor text label
    Здравствуйте! Я хочу купить Smart-TV приставку для просмотра фильмов и видео. Можете посоветовать какие-то модели? Желательно, чтобы приставка была быстрая и поддерживала 4K. {'long_web_name': 'Смарт-приставка Xiaomi TV Box S 2nd Gen 2/8 черная (PFJ4167RU)', 'price': 6290.0, 'description': 'НОВИНКА 2023 ГОДА! 2-е поколение потокового медиаплеера Xiaomi TV Box S. ТВ приставка Xiaomi TV Box S 2nd Gen (PFJ4167RU). 4х ядерный процессор Cortex-A55 Графический процессор-ARM Mali G31 MP2 Dolby Vision 4K Ultra HDR 10+ Встроены Google TV и Google Assistant 360° Bluetooth и ИК-пульт дистанционного управления Двухдиапазонный Wi-Fi Качество изображения 4K Ultra HD Беспроводное дублирование экрана Улучшенный угол обзора', 'rating': 4.86, 'review_count': 919} 1
    Здравствуйте! Я хочу купить Smart-TV приставку для просмотра фильмов и видео. Можете посоветовать какие-то модели? Желательно, чтобы приставка была быстрая и поддерживала 4K. {'long_web_name': 'Смартфон Honor Honor 90 12/512GB изумрудный зеленый (5109ATRU)', 'price': 40890.0, 'url': 'https://megamarket.ru/catalog/details/smartfon-honor-honor-90-12-512gb-izumrudnyy-zelenyy-5109atru-100063902396/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-97/523/126/541/612/13/100063902396b0.jpg', 'id': '100063902396_126519', 'description': '', 'rating': 4.86, 'review_count': 27} 0
    Здравствуйте! Я хочу купить Smart-TV приставку для просмотра фильмов и видео. Можете посоветовать какие-то модели? Желательно, чтобы приставка была быстрая и поддерживала 4K. {'long_web_name': 'Видеокарта MSI NVIDIA GeForce RTX 3060 Gaming X LHR', 'price': 39330.0, 'url': 'https://megamarket.ru/catalog/details/videokarta-msi-geforce-rtx-3060-gaming-x-12g-100028302832/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/179/595/992/532/211/22/100028302832b0.png', 'id': '100028302832_40440', 'description': '

    Видеокарта MSI NVIDIA GeForce RTX 3060 Gaming X (LHR) (RTX 3060 GAMING X 12G) - это мощное графическое решение для настоящих геймеров. Современный дизайн и передовые технологии позволяют вам наслаждаться потрясающими игровыми впечатлениями и запускать самые требовательные игры без затруднений.

    \n\n

    Потрясающая графика и высокая производительность

    \n\n

    С видеокартой MSI NVIDIA GeForce RTX 3060 Gaming X вы сможете наслаждаться невероятно реалистичными и проработанными изображениями. Благодаря новейшему графическому процессору GA106 и объему видеопамяти 12 ГБ игры будут работать плавно и без лагов, а поддержка трассировки лучей ...

    0
  • Loss: ContrastiveLoss with these parameters:
    {
        "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
        "margin": 0.5,
        "size_average": true
    }
    

Evaluation Dataset

Unnamed Dataset

  • Size: 7,885 evaluation samples
  • Columns: anchor, text, and label
  • Approximate statistics based on the first 1000 samples:
    anchor text label
    type string string int
    details
    • min: 7 tokens
    • mean: 23.9 tokens
    • max: 37 tokens
    • min: 56 tokens
    • mean: 365.94 tokens
    • max: 1356 tokens
    • 0: ~85.70%
    • 1: ~14.30%
  • Samples:
    anchor text label
    Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть варианты? {'long_web_name': 'Фитнес-браслет HUAWEI Band 8, черный матовый', 'price': 2555.0, 'description': '

    Фитнес-браслет Huawei Band 8 (черный) — это устройство, которое помогает следить за здоровьем и физической активностью.

    \n

    Помогает контролировать состояние организма

    \n

    Браслет оснащен датчиком SpO2, который отслеживает уровень кислорода в крови. Также он имеет встроенный пульсометр, который позволяет узнать частоту сердцебиения. Другие параметры:

    \n
      \n
    • дисплей AMOLED — отображает время, количество пройденных шагов, сожженные калории;
    • \n
    • 100 спортивных режимов — можно выбрать подходящий для тренировки;
    • \n
    • гироскоп и акселерометр — определяют положение тела в пространстве и скорость движения.
    • \n
    \n

    Благодаря водонепроницаемости браслет можно носить во время плавания. Корпус защищен от попадания влаги и пыли. Ремешок выполнен из силикона — мягкий и приятный на ощупь. Есть возможность регулировать длину.

    ', 'rating': 4.94, 'review_count': 7...
    1
    Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть варианты? {'long_web_name': 'Видеокарта ASUS NVIDIA GeForce RTX 4090 TUF Gaming OC Edition (TUF-RTX4090-O24G-GAMING)', 'price': 296368.0, 'url': 'https://megamarket.ru/catalog/details/videokarta-asus-tuf-rtx4090-o24g-gaming-rtx4090-100044516044/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/228/133/388/117/192/3/100044516044b9.jpg', 'id': '100044516044_59182', 'description': '

    Видеокарта ASUS NVIDIA GeForce RTX 4090 TUF Gaming OC Edition (90YV0IE0-M0NA00) - высокопроизводительное графическое решение, которое обеспечивает невероятно реалистичную визуализацию игровых миров.

    \n

    Максимальная производительность для настоящих игроков

    \n

    ASUS NVIDIA GeForce RTX 4090 TUF Gaming OC Edition - это явный лидер среди видеокарт нового поколения. Она оснащена мощным графическим процессором GeForce RTX 4090 и имеет объем видеопамяти 24 ГБ GDDR6X, что обеспечивает потрясающую детализацию и плавность изображения.

    \n
      \n
    1. Улучшенная поддержка трассировки лучей предоставля...
    0
    Привет! Хочу купить фитнес-браслет для отслеживания шагов и сна. Может, что-то недорогое, но с хорошей функциональностью? Подскажете, какие есть варианты? {'long_web_name': 'Встраиваемая варочная панель газовая Weissgauff HGG 640 BG черный', 'price': 16790.0, 'url': 'https://megamarket.ru/catalog/details/vstraivaemaya-gazovaya-panel-weissgauff-hgg-640-bg-100026765438/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/609/462/228/514/151/3/100026765438b0.jpg', 'id': '100026765438_6061', 'description': 'Встраиваемая независимая газовая панель Weissgauff шириной 60 см, исполненная в закалённом чёрном стекле - это стильное и компактное решение для вашей кухни!
    *Ширина 60 см это европейский стандарт качества, признанный миллионами довольных покупателей по всему миру!
    *Чёрное закаленное стекло не только роскошно выглядит, подчеркивая великолепный внешний вид данной модели, но и отлично справляется с механическими воздействиями и температурными перегрузками!
    *Решетки из высококачественного чугуна это неизменное качество, надежность и долговечность, воплощенные в каждой детали! А особая элегантность их дизайна не тольк...
    0
  • Loss: ContrastiveLoss with these parameters:
    {
        "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
        "margin": 0.5,
        "size_average": true
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • num_train_epochs: 1
  • warmup_ratio: 0.1
  • fp16: True
  • load_best_model_at_end: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss Validation Loss item-classification_cosine_ap
0 0 - 0.0237 0.4047
0.0649 100 0.0132 - -
0.1298 200 0.0062 - -
0.1622 250 - 0.0037 0.7734
0.1947 300 0.0053 - -
0.2596 400 0.0053 - -
0.3245 500 0.004 0.0043 0.7855
0.3894 600 0.0049 - -
0.4543 700 0.0044 - -
0.4867 750 - 0.0039 0.7641
0.5191 800 0.0039 - -
0.5840 900 0.0043 - -
0.6489 1000 0.0036 0.0035 0.7709
0.7138 1100 0.0042 - -
0.7787 1200 0.0036 - -
0.8112 1250 - 0.0036 0.7956
0.8436 1300 0.0038 - -
0.9085 1400 0.0038 - -
0.9734 1500 0.0032 0.0035 0.7986
1.0 1541 - 0.0035 0.7986
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.10.16
  • Sentence Transformers: 3.4.0.dev0
  • Transformers: 4.47.1
  • PyTorch: 2.5.1+cu124
  • Accelerate: 1.2.1
  • Datasets: 3.2.0
  • Tokenizers: 0.21.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

ContrastiveLoss

@inproceedings{hadsell2006dimensionality,
    author={Hadsell, R. and Chopra, S. and LeCun, Y.},
    booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
    title={Dimensionality Reduction by Learning an Invariant Mapping},
    year={2006},
    volume={2},
    number={},
    pages={1735-1742},
    doi={10.1109/CVPR.2006.100}
}