sergeyzh commited on
Commit
a390b5b
1 Parent(s): 4d73c5d

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +11 -5
README.md CHANGED
@@ -29,12 +29,18 @@ base_model: cointegrated/rubert-tiny2
29
 
30
  На STS и близких задачах (PI, NLI, SA, TI) для русского языка превосходит по качеству [sergeyzh/rubert-tiny-sts](https://huggingface.co/sergeyzh/rubert-tiny-sts). Для работы с контекстом свыше 512 токенов требует дообучения под целевой домен.
31
 
 
 
 
 
 
 
32
  ## Лучшая модель для использования в составе RAG LLMs при инференсе на CPU:
33
- - отличный метрики на задачах STS, PI, NLI обеспечивают высокое качество при нечетких запросах;
34
- - средние показатели на задачах SA, TI снижают влияние авторского стиля и личного отношения автора на ембединг;
35
- - высокая скорость работы на CPU (> 500 предложений в секунду) позволяет легко расширять базу текстовых документов;
36
- - пониженная размерность эмбединга (312) ускоряет дальнейшую работу алгоритмов knn при поиске соответствий;
37
- - совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers).
38
 
39
  ## Использование модели с библиотекой `transformers`:
40
 
 
29
 
30
  На STS и близких задачах (PI, NLI, SA, TI) для русского языка превосходит по качеству [sergeyzh/rubert-tiny-sts](https://huggingface.co/sergeyzh/rubert-tiny-sts). Для работы с контекстом свыше 512 токенов требует дообучения под целевой домен.
31
 
32
+ ## Выбор модели из серии BERT-STS (качество/скорость)
33
+ | Рекомендуемая модель | CPU <br> (STS; snt/s) | GPU <br> (STS; snt/s) |
34
+ |:---------------------------------|:---------:|:---------:|
35
+ | Быстрая модель (скорость) | [rubert-tiny-sts](https://huggingface.co/sergeyzh/rubert-tiny-sts) <br> (0.797; 1190) | - |
36
+ | Базовая модель (качество) | **rubert-mini-sts <br> (0.815; 539)** | [LaBSE-ru-sts](https://huggingface.co/sergeyzh/LaBSE-ru-sts) <br> (0.845; 1894) |
37
+
38
  ## Лучшая модель для использования в составе RAG LLMs при инференсе на CPU:
39
+ - высокое качество при нечетких запросах (отличный метрики на задачах STS, PI, NLI);
40
+ - низкое влияение эмоциональной окраски текста на ембединг (средние показатели на задачах SA, TI);
41
+ - легкое расширение базы текстовых документов (скорость работы на CPU > 500 предложений в секунду);
42
+ - ускорение алгоритмов knn при поиске соответствий (низкая размерность эмбединга 312);
43
+ - простота использования (совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers)).
44
 
45
  ## Использование модели с библиотекой `transformers`:
46