Sentence Similarity
sentence-transformers
Safetensors
English
German
modernbert
feature-extraction
Generated from Trainer
dataset_size:933246
loss:MatryoshkaLoss
loss:MultipleNegativesRankingLoss
text-embeddings-inference
Instructions to use avemio-digital/German-RAG_ModernBERT_base_pairs_embedding with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- sentence-transformers
How to use avemio-digital/German-RAG_ModernBERT_base_pairs_embedding with sentence-transformers:
from sentence_transformers import SentenceTransformer model = SentenceTransformer("avemio-digital/German-RAG_ModernBERT_base_pairs_embedding") sentences = [ "Was sind einige bemerkenswerte Ereignisse im Leben von Andrea Sawatzki, die in diesem Textausschnitt erwähnt werden?", "Die \"White Galloways\" sind ebenfalls hornlose schottische Rinder, die zur ganzjährigen Freilandhaltung geeignet sind und zu den extensiven, robusten Fleischrinderrassen gehören. Der Hauptanteil ihres Fells ist nahezu weiß, es gibt aber meist schwarze, mitunter auch blonde oder rot-braune Pigmentierung an Ohren, Maul, Füßen und um die Augen.", "2003 stand Sawatzki für eine erotische Fotoserie in der April-Ausgabe des \"Playboy\" vor der Kamera. 2007 war sie Patin des Deutschen Kinderpreises. 2011 tanzte sie in der 4. Staffel der RTL-Tanzshow \"Let’s Dance\" mit dem italienischen Profitänzer Stefano Terrazzino und belegte den achten Platz.", "Die Elektroejakulation ist eine in der Human- und Veterinärmedizin sowie in der Tierzucht eingesetzte Methode zur Spermiengewinnung, wenn die Gewinnung auf natürlichem Wege aufgrund von besonderen Umständen oder Erkrankungen nicht möglich ist, und unterscheidet sich in der Art der Durchführung sowie in der Wirkungsweise erheblich von der erotischen Elektrostimulation." ] embeddings = model.encode(sentences) similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [4, 4] - Notebooks
- Google Colab
- Kaggle
| { | |
| "word_embedding_dimension": 768, | |
| "pooling_mode_cls_token": false, | |
| "pooling_mode_mean_tokens": true, | |
| "pooling_mode_max_tokens": false, | |
| "pooling_mode_mean_sqrt_len_tokens": false, | |
| "pooling_mode_weightedmean_tokens": false, | |
| "pooling_mode_lasttoken": false, | |
| "include_prompt": true | |
| } |