Muennighoff
/

SGPT-2.7B-weightedmean-msmarco-specb-bitfit

@@ -13,6 +13,8 @@ model-index:
     dataset:
       type: mteb/amazon_counterfactual
       name: MTEB AmazonCounterfactualClassification (en)
     metrics:
     - type: accuracy
       value: 67.56716417910448
@@ -25,6 +27,8 @@ model-index:
     dataset:
       type: mteb/amazon_polarity
       name: MTEB AmazonPolarityClassification
     metrics:
     - type: accuracy
       value: 71.439575
@@ -37,6 +41,8 @@ model-index:
     dataset:
       type: mteb/amazon_reviews_multi
       name: MTEB AmazonReviewsClassification (en)
     metrics:
     - type: accuracy
       value: 35.748000000000005
@@ -47,6 +53,8 @@ model-index:
     dataset:
       type: arguana
       name: MTEB ArguAna
     metrics:
     - type: map_at_1
       value: 25.96
@@ -113,6 +121,8 @@ model-index:
     dataset:
       type: mteb/arxiv-clustering-p2p
       name: MTEB ArxivClusteringP2P
     metrics:
     - type: v_measure
       value: 44.72125714642202
@@ -121,6 +131,8 @@ model-index:
     dataset:
       type: mteb/arxiv-clustering-s2s
       name: MTEB ArxivClusteringS2S
     metrics:
     - type: v_measure
       value: 35.081451519142064
@@ -129,6 +141,8 @@ model-index:
     dataset:
       type: mteb/askubuntudupquestions-reranking
       name: MTEB AskUbuntuDupQuestions
     metrics:
     - type: map
       value: 59.634661990392054
@@ -139,6 +153,8 @@ model-index:
     dataset:
       type: mteb/biosses-sts
       name: MTEB BIOSSES
     metrics:
     - type: cos_sim_pearson
       value: 87.42754550496836
@@ -157,6 +173,8 @@ model-index:
     dataset:
       type: mteb/banking77
       name: MTEB Banking77Classification
     metrics:
     - type: accuracy
       value: 83.21753246753246
@@ -167,6 +185,8 @@ model-index:
     dataset:
       type: mteb/biorxiv-clustering-p2p
       name: MTEB BiorxivClusteringP2P
     metrics:
     - type: v_measure
       value: 34.41414219680629
@@ -175,6 +195,8 @@ model-index:
     dataset:
       type: mteb/biorxiv-clustering-s2s
       name: MTEB BiorxivClusteringS2S
     metrics:
     - type: v_measure
       value: 30.533275862270028
@@ -183,6 +205,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackAndroidRetrieval
     metrics:
     - type: map_at_1
       value: 30.808999999999997
@@ -249,6 +273,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackEnglishRetrieval
     metrics:
     - type: map_at_1
       value: 26.962000000000003
@@ -315,6 +341,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackGamingRetrieval
     metrics:
     - type: map_at_1
       value: 36.318
@@ -381,6 +409,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackGisRetrieval
     metrics:
     - type: map_at_1
       value: 22.167
@@ -447,6 +477,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackMathematicaRetrieval
     metrics:
     - type: map_at_1
       value: 12.033000000000001
@@ -513,6 +545,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackPhysicsRetrieval
     metrics:
     - type: map_at_1
       value: 26.651000000000003
@@ -579,6 +613,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackProgrammersRetrieval
     metrics:
     - type: map_at_1
       value: 22.589000000000002
@@ -645,6 +681,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackRetrieval
     metrics:
     - type: map_at_1
       value: 23.190833333333334
@@ -711,6 +749,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackStatsRetrieval
     metrics:
     - type: map_at_1
       value: 20.409
@@ -777,6 +817,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackTexRetrieval
     metrics:
     - type: map_at_1
       value: 14.549000000000001
@@ -843,6 +885,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackUnixRetrieval
     metrics:
     - type: map_at_1
       value: 23.286
@@ -909,6 +953,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackWebmastersRetrieval
     metrics:
     - type: map_at_1
       value: 23.962
@@ -975,6 +1021,8 @@ model-index:
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackWordpressRetrieval
     metrics:
     - type: map_at_1
       value: 18.555
@@ -1041,6 +1089,8 @@ model-index:
     dataset:
       type: climate-fever
       name: MTEB ClimateFEVER
     metrics:
     - type: map_at_1
       value: 10.366999999999999
@@ -1107,6 +1157,8 @@ model-index:
     dataset:
       type: dbpedia-entity
       name: MTEB DBPedia
     metrics:
     - type: map_at_1
       value: 8.246
@@ -1173,6 +1225,8 @@ model-index:
     dataset:
       type: mteb/emotion
       name: MTEB EmotionClassification
     metrics:
     - type: accuracy
       value: 49.214999999999996
@@ -1183,6 +1237,8 @@ model-index:
     dataset:
       type: fever
       name: MTEB FEVER
     metrics:
     - type: map_at_1
       value: 56.769000000000005
@@ -1249,6 +1305,8 @@ model-index:
     dataset:
       type: fiqa
       name: MTEB FiQA2018
     metrics:
     - type: map_at_1
       value: 15.753
@@ -1315,6 +1373,8 @@ model-index:
     dataset:
       type: hotpotqa
       name: MTEB HotpotQA
     metrics:
     - type: map_at_1
       value: 32.153999999999996
@@ -1381,6 +1441,8 @@ model-index:
     dataset:
       type: mteb/imdb
       name: MTEB ImdbClassification
     metrics:
     - type: accuracy
       value: 63.5316
@@ -1393,6 +1455,8 @@ model-index:
     dataset:
       type: msmarco
       name: MTEB MSMARCO
     metrics:
     - type: map_at_1
       value: 20.566000000000003
@@ -1459,6 +1523,8 @@ model-index:
     dataset:
       type: mteb/mtop_domain
       name: MTEB MTOPDomainClassification (en)
     metrics:
     - type: accuracy
       value: 92.56269949840402
@@ -1469,6 +1535,8 @@ model-index:
     dataset:
       type: mteb/mtop_intent
       name: MTEB MTOPIntentClassification (en)
     metrics:
     - type: accuracy
       value: 71.8467852257182
@@ -1479,6 +1547,8 @@ model-index:
     dataset:
       type: mteb/amazon_massive_intent
       name: MTEB MassiveIntentClassification (en)
     metrics:
     - type: accuracy
       value: 69.00806993947546
@@ -1489,6 +1559,8 @@ model-index:
     dataset:
       type: mteb/amazon_massive_scenario
       name: MTEB MassiveScenarioClassification (en)
     metrics:
     - type: accuracy
       value: 75.90114324142569
@@ -1499,6 +1571,8 @@ model-index:
     dataset:
       type: mteb/medrxiv-clustering-p2p
       name: MTEB MedrxivClusteringP2P
     metrics:
     - type: v_measure
       value: 31.350109978273395
@@ -1507,6 +1581,8 @@ model-index:
     dataset:
       type: mteb/medrxiv-clustering-s2s
       name: MTEB MedrxivClusteringS2S
     metrics:
     - type: v_measure
       value: 28.768923695767327
@@ -1515,6 +1591,8 @@ model-index:
     dataset:
       type: mteb/mind_small
       name: MTEB MindSmallReranking
     metrics:
     - type: map
       value: 31.716396735210754
@@ -1525,6 +1603,8 @@ model-index:
     dataset:
       type: nfcorpus
       name: MTEB NFCorpus
     metrics:
     - type: map_at_1
       value: 5.604
@@ -1591,6 +1671,8 @@ model-index:
     dataset:
       type: nq
       name: MTEB NQ
     metrics:
     - type: map_at_1
       value: 25.881
@@ -1657,6 +1739,8 @@ model-index:
     dataset:
       type: quora
       name: MTEB QuoraRetrieval
     metrics:
     - type: map_at_1
       value: 67.553
@@ -1723,6 +1807,8 @@ model-index:
     dataset:
       type: mteb/reddit-clustering
       name: MTEB RedditClustering
     metrics:
     - type: v_measure
       value: 46.46887711230235
@@ -1731,6 +1817,8 @@ model-index:
     dataset:
       type: mteb/reddit-clustering-p2p
       name: MTEB RedditClusteringP2P
     metrics:
     - type: v_measure
       value: 54.166876298246926
@@ -1739,6 +1827,8 @@ model-index:
     dataset:
       type: scidocs
       name: MTEB SCIDOCS
     metrics:
     - type: map_at_1
       value: 4.053
@@ -1805,6 +1895,8 @@ model-index:
     dataset:
       type: mteb/sickr-sts
       name: MTEB SICK-R
     metrics:
     - type: cos_sim_pearson
       value: 77.7548748519677
@@ -1823,6 +1915,8 @@ model-index:
     dataset:
       type: mteb/sts12-sts
       name: MTEB STS12
     metrics:
     - type: cos_sim_pearson
       value: 75.91051402657887
@@ -1841,6 +1935,8 @@ model-index:
     dataset:
       type: mteb/sts13-sts
       name: MTEB STS13
     metrics:
     - type: cos_sim_pearson
       value: 77.23835466417793
@@ -1859,6 +1955,8 @@ model-index:
     dataset:
       type: mteb/sts14-sts
       name: MTEB STS14
     metrics:
     - type: cos_sim_pearson
       value: 77.91692485139602
@@ -1877,6 +1975,8 @@ model-index:
     dataset:
       type: mteb/sts15-sts
       name: MTEB STS15
     metrics:
     - type: cos_sim_pearson
       value: 82.13422113617578
@@ -1895,6 +1995,8 @@ model-index:
     dataset:
       type: mteb/sts16-sts
       name: MTEB STS16
     metrics:
     - type: cos_sim_pearson
       value: 79.07989542843826
@@ -1913,6 +2015,8 @@ model-index:
     dataset:
       type: mteb/sts17-crosslingual-sts
       name: MTEB STS17 (en-en)
     metrics:
     - type: cos_sim_pearson
       value: 87.0420983224933
@@ -1931,6 +2035,8 @@ model-index:
     dataset:
       type: mteb/sts22-crosslingual-sts
       name: MTEB STS22 (en)
     metrics:
     - type: cos_sim_pearson
       value: 68.47031320016424
@@ -1949,6 +2055,8 @@ model-index:
     dataset:
       type: mteb/stsbenchmark-sts
       name: MTEB STSBenchmark
     metrics:
     - type: cos_sim_pearson
       value: 80.79514366062675
@@ -1967,6 +2075,8 @@ model-index:
     dataset:
       type: mteb/scidocs-reranking
       name: MTEB SciDocsRR
     metrics:
     - type: map
       value: 77.71580844366375
@@ -1977,6 +2087,8 @@ model-index:
     dataset:
       type: scifact
       name: MTEB SciFact
     metrics:
     - type: map_at_1
       value: 56.39999999999999
@@ -2043,6 +2155,8 @@ model-index:
     dataset:
       type: mteb/sprintduplicatequestions-pairclassification
       name: MTEB SprintDuplicateQuestions
     metrics:
     - type: cos_sim_accuracy
       value: 99.76831683168317
@@ -2095,6 +2209,8 @@ model-index:
     dataset:
       type: mteb/stackexchange-clustering
       name: MTEB StackExchangeClustering
     metrics:
     - type: v_measure
       value: 59.194098673976484
@@ -2103,6 +2219,8 @@ model-index:
     dataset:
       type: mteb/stackexchange-clustering-p2p
       name: MTEB StackExchangeClusteringP2P
     metrics:
     - type: v_measure
       value: 32.5744032578115
@@ -2111,6 +2229,8 @@ model-index:
     dataset:
       type: mteb/stackoverflowdupquestions-reranking
       name: MTEB StackOverflowDupQuestions
     metrics:
     - type: map
       value: 49.61186384154483
@@ -2121,6 +2241,8 @@ model-index:
     dataset:
       type: mteb/summeval
       name: MTEB SummEval
     metrics:
     - type: cos_sim_pearson
       value: 26.047224542079068
@@ -2135,6 +2257,8 @@ model-index:
     dataset:
       type: trec-covid
       name: MTEB TRECCOVID
     metrics:
     - type: map_at_1
       value: 0.22300000000000003
@@ -2201,6 +2325,8 @@ model-index:
     dataset:
       type: webis-touche2020
       name: MTEB Touche2020
     metrics:
     - type: map_at_1
       value: 3.047
@@ -2267,6 +2393,8 @@ model-index:
     dataset:
       type: mteb/toxic_conversations_50k
       name: MTEB ToxicConversationsClassification
     metrics:
     - type: accuracy
       value: 68.84080000000002
@@ -2279,6 +2407,8 @@ model-index:
     dataset:
       type: mteb/tweet_sentiment_extraction
       name: MTEB TweetSentimentExtractionClassification
     metrics:
     - type: accuracy
       value: 56.68647425014149
@@ -2289,6 +2419,8 @@ model-index:
     dataset:
       type: mteb/twentynewsgroups-clustering
       name: MTEB TwentyNewsgroupsClustering
     metrics:
     - type: v_measure
       value: 40.8911707239219
@@ -2297,6 +2429,8 @@ model-index:
     dataset:
       type: mteb/twittersemeval2015-pairclassification
       name: MTEB TwitterSemEval2015
     metrics:
     - type: cos_sim_accuracy
       value: 83.04226023722954
@@ -2349,6 +2483,8 @@ model-index:
     dataset:
       type: mteb/twitterurlcorpus-pairclassification
       name: MTEB TwitterURLCorpus
     metrics:
     - type: cos_sim_accuracy
       value: 88.56871191834517
@@ -2461,4 +2597,4 @@ SentenceTransformer(
   journal={arXiv preprint arXiv:2202.08904},
   year={2022}
 }
-```

     dataset:
       type: mteb/amazon_counterfactual
       name: MTEB AmazonCounterfactualClassification (en)
+      config: en
+      split: test
     metrics:
     - type: accuracy
       value: 67.56716417910448
     dataset:
       type: mteb/amazon_polarity
       name: MTEB AmazonPolarityClassification
+      config: default
+      split: test
     metrics:
     - type: accuracy
       value: 71.439575
     dataset:
       type: mteb/amazon_reviews_multi
       name: MTEB AmazonReviewsClassification (en)
+      config: en
+      split: test
     metrics:
     - type: accuracy
       value: 35.748000000000005
     dataset:
       type: arguana
       name: MTEB ArguAna
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 25.96
     dataset:
       type: mteb/arxiv-clustering-p2p
       name: MTEB ArxivClusteringP2P
+      config: default
+      split: test
     metrics:
     - type: v_measure
       value: 44.72125714642202
     dataset:
       type: mteb/arxiv-clustering-s2s
       name: MTEB ArxivClusteringS2S
+      config: default
+      split: test
     metrics:
     - type: v_measure
       value: 35.081451519142064
     dataset:
       type: mteb/askubuntudupquestions-reranking
       name: MTEB AskUbuntuDupQuestions
+      config: default
+      split: test
     metrics:
     - type: map
       value: 59.634661990392054
     dataset:
       type: mteb/biosses-sts
       name: MTEB BIOSSES
+      config: default
+      split: test
     metrics:
     - type: cos_sim_pearson
       value: 87.42754550496836
     dataset:
       type: mteb/banking77
       name: MTEB Banking77Classification
+      config: default
+      split: test
     metrics:
     - type: accuracy
       value: 83.21753246753246
     dataset:
       type: mteb/biorxiv-clustering-p2p
       name: MTEB BiorxivClusteringP2P
+      config: default
+      split: test
     metrics:
     - type: v_measure
       value: 34.41414219680629
     dataset:
       type: mteb/biorxiv-clustering-s2s
       name: MTEB BiorxivClusteringS2S
+      config: default
+      split: test
     metrics:
     - type: v_measure
       value: 30.533275862270028
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackAndroidRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 30.808999999999997
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackEnglishRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 26.962000000000003
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackGamingRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 36.318
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackGisRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 22.167
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackMathematicaRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 12.033000000000001
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackPhysicsRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 26.651000000000003
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackProgrammersRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 22.589000000000002
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 23.190833333333334
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackStatsRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 20.409
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackTexRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 14.549000000000001
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackUnixRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 23.286
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackWebmastersRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 23.962
     dataset:
       type: BeIR/cqadupstack
       name: MTEB CQADupstackWordpressRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 18.555
     dataset:
       type: climate-fever
       name: MTEB ClimateFEVER
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 10.366999999999999
     dataset:
       type: dbpedia-entity
       name: MTEB DBPedia
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 8.246
     dataset:
       type: mteb/emotion
       name: MTEB EmotionClassification
+      config: default
+      split: test
     metrics:
     - type: accuracy
       value: 49.214999999999996
     dataset:
       type: fever
       name: MTEB FEVER
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 56.769000000000005
     dataset:
       type: fiqa
       name: MTEB FiQA2018
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 15.753
     dataset:
       type: hotpotqa
       name: MTEB HotpotQA
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 32.153999999999996
     dataset:
       type: mteb/imdb
       name: MTEB ImdbClassification
+      config: default
+      split: test
     metrics:
     - type: accuracy
       value: 63.5316
     dataset:
       type: msmarco
       name: MTEB MSMARCO
+      config: default
+      split: validation
     metrics:
     - type: map_at_1
       value: 20.566000000000003
     dataset:
       type: mteb/mtop_domain
       name: MTEB MTOPDomainClassification (en)
+      config: en
+      split: test
     metrics:
     - type: accuracy
       value: 92.56269949840402
     dataset:
       type: mteb/mtop_intent
       name: MTEB MTOPIntentClassification (en)
+      config: en
+      split: test
     metrics:
     - type: accuracy
       value: 71.8467852257182
     dataset:
       type: mteb/amazon_massive_intent
       name: MTEB MassiveIntentClassification (en)
+      config: en
+      split: test
     metrics:
     - type: accuracy
       value: 69.00806993947546
     dataset:
       type: mteb/amazon_massive_scenario
       name: MTEB MassiveScenarioClassification (en)
+      config: en
+      split: test
     metrics:
     - type: accuracy
       value: 75.90114324142569
     dataset:
       type: mteb/medrxiv-clustering-p2p
       name: MTEB MedrxivClusteringP2P
+      config: default
+      split: test
     metrics:
     - type: v_measure
       value: 31.350109978273395
     dataset:
       type: mteb/medrxiv-clustering-s2s
       name: MTEB MedrxivClusteringS2S
+      config: default
+      split: test
     metrics:
     - type: v_measure
       value: 28.768923695767327
     dataset:
       type: mteb/mind_small
       name: MTEB MindSmallReranking
+      config: default
+      split: test
     metrics:
     - type: map
       value: 31.716396735210754
     dataset:
       type: nfcorpus
       name: MTEB NFCorpus
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 5.604
     dataset:
       type: nq
       name: MTEB NQ
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 25.881
     dataset:
       type: quora
       name: MTEB QuoraRetrieval
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 67.553
     dataset:
       type: mteb/reddit-clustering
       name: MTEB RedditClustering
+      config: default
+      split: test
     metrics:
     - type: v_measure
       value: 46.46887711230235
     dataset:
       type: mteb/reddit-clustering-p2p
       name: MTEB RedditClusteringP2P
+      config: default
+      split: test
     metrics:
     - type: v_measure
       value: 54.166876298246926
     dataset:
       type: scidocs
       name: MTEB SCIDOCS
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 4.053
     dataset:
       type: mteb/sickr-sts
       name: MTEB SICK-R
+      config: default
+      split: test
     metrics:
     - type: cos_sim_pearson
       value: 77.7548748519677
     dataset:
       type: mteb/sts12-sts
       name: MTEB STS12
+      config: default
+      split: test
     metrics:
     - type: cos_sim_pearson
       value: 75.91051402657887
     dataset:
       type: mteb/sts13-sts
       name: MTEB STS13
+      config: default
+      split: test
     metrics:
     - type: cos_sim_pearson
       value: 77.23835466417793
     dataset:
       type: mteb/sts14-sts
       name: MTEB STS14
+      config: default
+      split: test
     metrics:
     - type: cos_sim_pearson
       value: 77.91692485139602
     dataset:
       type: mteb/sts15-sts
       name: MTEB STS15
+      config: default
+      split: test
     metrics:
     - type: cos_sim_pearson
       value: 82.13422113617578
     dataset:
       type: mteb/sts16-sts
       name: MTEB STS16
+      config: default
+      split: test
     metrics:
     - type: cos_sim_pearson
       value: 79.07989542843826
     dataset:
       type: mteb/sts17-crosslingual-sts
       name: MTEB STS17 (en-en)
+      config: en-en
+      split: test
     metrics:
     - type: cos_sim_pearson
       value: 87.0420983224933
     dataset:
       type: mteb/sts22-crosslingual-sts
       name: MTEB STS22 (en)
+      config: en
+      split: test
     metrics:
     - type: cos_sim_pearson
       value: 68.47031320016424
     dataset:
       type: mteb/stsbenchmark-sts
       name: MTEB STSBenchmark
+      config: default
+      split: test
     metrics:
     - type: cos_sim_pearson
       value: 80.79514366062675
     dataset:
       type: mteb/scidocs-reranking
       name: MTEB SciDocsRR
+      config: default
+      split: test
     metrics:
     - type: map
       value: 77.71580844366375
     dataset:
       type: scifact
       name: MTEB SciFact
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 56.39999999999999
     dataset:
       type: mteb/sprintduplicatequestions-pairclassification
       name: MTEB SprintDuplicateQuestions
+      config: default
+      split: test
     metrics:
     - type: cos_sim_accuracy
       value: 99.76831683168317
     dataset:
       type: mteb/stackexchange-clustering
       name: MTEB StackExchangeClustering
+      config: default
+      split: test
     metrics:
     - type: v_measure
       value: 59.194098673976484
     dataset:
       type: mteb/stackexchange-clustering-p2p
       name: MTEB StackExchangeClusteringP2P
+      config: default
+      split: test
     metrics:
     - type: v_measure
       value: 32.5744032578115
     dataset:
       type: mteb/stackoverflowdupquestions-reranking
       name: MTEB StackOverflowDupQuestions
+      config: default
+      split: test
     metrics:
     - type: map
       value: 49.61186384154483
     dataset:
       type: mteb/summeval
       name: MTEB SummEval
+      config: default
+      split: test
     metrics:
     - type: cos_sim_pearson
       value: 26.047224542079068
     dataset:
       type: trec-covid
       name: MTEB TRECCOVID
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 0.22300000000000003
     dataset:
       type: webis-touche2020
       name: MTEB Touche2020
+      config: default
+      split: test
     metrics:
     - type: map_at_1
       value: 3.047
     dataset:
       type: mteb/toxic_conversations_50k
       name: MTEB ToxicConversationsClassification
+      config: default
+      split: test
     metrics:
     - type: accuracy
       value: 68.84080000000002
     dataset:
       type: mteb/tweet_sentiment_extraction
       name: MTEB TweetSentimentExtractionClassification
+      config: default
+      split: test
     metrics:
     - type: accuracy
       value: 56.68647425014149
     dataset:
       type: mteb/twentynewsgroups-clustering
       name: MTEB TwentyNewsgroupsClustering
+      config: default
+      split: test
     metrics:
     - type: v_measure
       value: 40.8911707239219
     dataset:
       type: mteb/twittersemeval2015-pairclassification
       name: MTEB TwitterSemEval2015
+      config: default
+      split: test
     metrics:
     - type: cos_sim_accuracy
       value: 83.04226023722954
     dataset:
       type: mteb/twitterurlcorpus-pairclassification
       name: MTEB TwitterURLCorpus
+      config: default
+      split: test
     metrics:
     - type: cos_sim_accuracy
       value: 88.56871191834517
   journal={arXiv preprint arXiv:2202.08904},
   year={2022}
 }
+```