---
base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
datasets: []
language: []
library_name: sentence-transformers
pipeline_tag: sentence-similarity
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:1800
- loss:ContrastiveLoss
widget:
- source_sentence: ' हैरतअंगेज... अद्भुत, नामुमकिन के बराबर है क्रिकेट की दुनिया के
इन 6 वर्ल्ड रिकॉर्ड्स को तोड़ना '
sentences:
- हैरतअंगेज... अद्भुत, नामुमकिन के बराबर है क्रिकेट की दुनिया के इन 6 वर्ल्ड रिकॉर्ड्स
को तोड़ना
- 'Gajendra Singh Shekhawat: 53 की उम्र में गजेंद्र सिंह शेखावत का दिखा अनोखा जज्बा,
12 हजार मीटर की ऊंचाई से लगाई छलांग'
- ब्रह्मांड की शुरुआत में प्रकाश कहां से आया? क्या भगवान ने स्विच दबाया? विज्ञान
ने खोला राज
- source_sentence: ' बिना बाजू की ड्रेस, कंधे तक के इयरिंग और अदाएं भर-भरकर...शमा
सिकंदर का फोटोशूट है बवाल '
sentences:
- एक दिन में ही 'बिग बॉस' के घर से बेघर हुए वाइल्ड कार्ड कंटेस्टेंट अदनान शेख? तोड़ा
शो का एक बड़ा नियम
- बिना बाजू की ड्रेस, कंधे तक के इयरिंग और अदाएं भर-भरकर...शमा सिकंदर का फोटोशूट
है बवाल
- 'Joe Biden Address: ‘अमेरिका इस रास्ते पर नहीं चल सकता’- ट्रंप पर हमले के बाद
राष्ट्रपति बाइडेन का राष्ट्र के नाम संबोधन'
- source_sentence: ' GK Quiz: भारत के वो कौन से राज्य हैं, जिनकी दो राजधानी हैं? '
sentences:
- 'Vastu Tips: घर के मुख्य दरवाजे पर ये एक चीज लटकाने से दौड़ी आएंगी मां लक्ष्मी,
पैसों की तंगी से मिलेगा छुटकारा'
- 'GK Quiz: भारत के वो कौन से राज्य हैं, जिनकी दो राजधानी हैं?'
- बारिश के मौसम में हाजमा बिगाड़ देते हैं ये दाल, जानें मानसून के लिए कौन-से Pulses
हैं बेस्ट
- source_sentence: ' Devshayani Ekadashi 2024: देवशयनी एकादशी पर किए ये 5 काम करते
हैं चुंबक का काम, चौतरफा होगा धन आगमन '
sentences:
- 'Devshayani Ekadashi 2024: देवशयनी एकादशी पर किए ये 5 काम करते हैं चुंबक का काम,
चौतरफा होगा धन आगमन'
- अनंत-राधिका की शादी में अनन्या पांडे संग जमकर नाचे हार्दिक पंड्या, VIDEO हो रहा
खूब वायरल
- सचिन के करियर का सबसे बड़ा दर्द, मास्टर ब्लास्टर ने इस वजह से खुद को ही कप्तानी
से हटा दिया
- source_sentence: ' Team India : पूरा भरोसा हम चैंपियन बनेंगे... अब चैंपियंस ट्रॉफी
और WTC की बारी, जय शाह का बड़ा बयान; कौन होगा कप्तान? '
sentences:
- 'Team India : कौन होगा टीम इंडिया का नया बॉलिंग कोच? विनय कुमार नहीं! इस वर्ल्ड
कप विनर की खुल सकती है किस्मत'
- 'MPPSC Vacancy 2024: एमपी में निकली 690 पदों पर भर्ती, 40 साल तक के कैंडिडेट्स
कर सकते हैं आवेदन'
- Samsung Galaxy Ring हुई लॉन्च, 9 साइज और 3 कलर ऑप्शन में मिलेगी, जानें फीचर्स
---
# SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2). It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2)
- **Maximum Sequence Length:** 128 tokens
- **Output Dimensionality:** 384 tokens
- **Similarity Function:** Cosine Similarity
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("amorfati/custom-hindi-emb-model-contrastive")
# Run inference
sentences = [
' Team India : पूरा भरोसा हम चैंपियन बनेंगे... अब चैंपियंस ट्रॉफी और WTC की बारी, जय शाह का बड़ा बयान; कौन होगा कप्तान? ',
'Team India : कौन होगा टीम इंडिया का नया बॉलिंग कोच? विनय कुमार नहीं! इस वर्ल्ड कप विनर की खुल सकती है किस्मत',
'Samsung Galaxy Ring हुई लॉन्च, 9 साइज और 3 कलर ऑप्शन में मिलेगी, जानें फीचर्स',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 384]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 1,800 training samples
* Columns: premise
, hypothesis
, and label
* Approximate statistics based on the first 1000 samples:
| | premise | hypothesis | label |
|:--------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|:-----------------------------|
| type | string | string | int |
| details |
पति से छिपकर पत्नी का करना चाहिए ये काम, सुधा मूर्ति की ये बात संवार देगी आपकी शादी
| Bangladeshi Hindus: 'हिंदू बन गए हैं आसान टारेगट' - ढाका में हमलों के बाद बांग्लादेशी हिंदू ने बताया देश का 'काला सच'
| 0
|
| फर्जी कॉल, SMS से लेकर WhatsApp मैसेज तक, Chakshu पोर्टल पर करें हर फ्रॉड की शिकायत, होगी कार्रवाई
| विदेशी Trucks में ड्राइवर को सिर्फ AC ही नहीं बल्कि, मिलती हैं ये लग्जरी सुविधाएं
| 0
|
| GK Quiz: कौन सा जीव है जिसे अपनी मौत आने से पहले उसे पता चल जाता है?
| Indian Army Recruitment 2024: इंडियन आर्मी में निकली डायरेक्ट भर्ती, हवलदार समेत इन पदों पर मिलेगी नौकरी
| 0
|
* Loss: [ContrastiveLoss
](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
```json
{
"distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
"margin": 0.5,
"size_average": true
}
```
### Evaluation Dataset
#### Unnamed Dataset
* Size: 200 evaluation samples
* Columns: premise
, hypothesis
, and label
* Approximate statistics based on the first 1000 samples:
| | premise | hypothesis | label |
|:--------|:-----------------------------------------------------------------------------------|:----------------------------------------------------------------------------------|:-----------------------------|
| type | string | string | int |
| details | Vastu Tips: घर के मुख्य दरवाजे पर ये एक चीज लटकाने से दौड़ी आएंगी मां लक्ष्मी, पैसों की तंगी से मिलेगा छुटकारा
| Vastu Tips: घर के मुख्य दरवाजे पर ये एक चीज लटकाने से दौड़ी आएंगी मां लक्ष्मी, पैसों की तंगी से मिलेगा छुटकारा
| 1
|
| CLAT 2025: कल से शुरू हो रही रजिस्ट्रेशन प्रक्रिया, अप्लाई करने के लिए क्या योग्यता चाहिए; क्या होगा एग्जाम पैटर्न और कितनी होगी फीस जानें
| CLAT 2025: कल से शुरू हो रही रजिस्ट्रेशन प्रक्रिया, अप्लाई करने के लिए क्या योग्यता चाहिए; क्या होगा एग्जाम पैटर्न और कितनी होगी फीस जानें
| 1
|
| XAT 2025: 15 जुलाई से शुरू होंगे रजिस्ट्रेशन, जानें कैसे भरें एप्लिकेशन फॉर्म
| XAT 2025: 15 जुलाई से शुरू होंगे रजिस्ट्रेशन, जानें कैसे भरें एप्लिकेशन फॉर्म
| 1
|
* Loss: [ContrastiveLoss
](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
```json
{
"distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
"margin": 0.5,
"size_average": true
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: steps
- `per_device_train_batch_size`: 16
- `per_device_eval_batch_size`: 16
- `learning_rate`: 2e-05
- `num_train_epochs`: 20
- `warmup_ratio`: 0.1
#### All Hyperparameters