sergeyzh
/

rubert-mini-sts

@@ -29,12 +29,18 @@ base_model: cointegrated/rubert-tiny2
 На STS и близких задачах (PI, NLI, SA, TI) для русского языка превосходит по качеству [sergeyzh/rubert-tiny-sts](https://huggingface.co/sergeyzh/rubert-tiny-sts). Для работы с контекстом свыше 512 токенов требует дообучения под целевой домен.
 ## Лучшая модель для использования в составе RAG LLMs при инференсе на CPU:
-- отличный метрики на задачах STS, PI, NLI обеспечивают высокое качество при нечетких запросах;
-- средние показатели на задачах SA, TI снижают влияние авторского стиля и личного отношения автора на ембединг;
-- высокая скорость работы на CPU (> 500 предложений в секунду) позволяет легко расширять базу текстовых документов;
-- пониженная размерность эмбединга (312) ускоряет дальнейшую работу алгоритмов knn при поиске соответствий;
-- совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers).
 ## Использование модели с библиотекой `transformers`:

 На STS и близких задачах (PI, NLI, SA, TI) для русского языка превосходит по качеству [sergeyzh/rubert-tiny-sts](https://huggingface.co/sergeyzh/rubert-tiny-sts). Для работы с контекстом свыше 512 токенов требует дообучения под целевой домен.
+## Выбор модели из серии BERT-STS  (качество/скорость)
+| Рекомендуемая модель                      | CPU  <br> (STS; snt/s) | GPU  <br> (STS; snt/s) |
+|:---------------------------------|:---------:|:---------:|
+| Быстрая модель (скорость) | [rubert-tiny-sts](https://huggingface.co/sergeyzh/rubert-tiny-sts) <br> (0.797; 1190) | - |
+| Базовая модель  (качество) | **rubert-mini-sts <br> (0.815; 539)** | [LaBSE-ru-sts](https://huggingface.co/sergeyzh/LaBSE-ru-sts) <br> (0.845; 1894) |
 ## Лучшая модель для использования в составе RAG LLMs при инференсе на CPU:
+- высокое качество при нечетких запросах (отличный метрики на задачах STS, PI, NLI);
+- низкое влияение эмоциональной окраски текста на ембединг (средние показатели на задачах SA, TI);
+- легкое расширение базы текстовых документов (скорость работы на CPU > 500 предложений в секунду);
+- ускорение алгоритмов knn при поиске соответствий (низкая размерность эмбединга 312);
+- простота использования (совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers)).
 ## Использование модели с библиотекой `transformers`: