cl-nagoya
/

unsup-simcse-ja-large

Feature Extraction

sentence-transformers

sentence-similarity

Model card Files Files and versions Community

hpprc commited on Oct 4, 2023

Commit

eb21c06

•

1 Parent(s): 6727455

Update README.md

Files changed (1) hide show

README.md +21 -1

README.md CHANGED Viewed

@@ -1,5 +1,4 @@
 ---
-pipeline_tag: sentence-similarity
 tags:
 - sentence-transformers
 - feature-extraction
@@ -10,6 +9,9 @@ datasets:
 license: cc-by-sa-4.0
 language:
 - ja
 ---
 # unsup-simcse-ja-large
@@ -77,6 +79,24 @@ SentenceTransformer(
 )
 ```
 ## Citing & Authors
 ```

 ---
 tags:
 - sentence-transformers
 - feature-extraction
 license: cc-by-sa-4.0
 language:
 - ja
+metrics:
+- spearmanr
+library_name: sentence-transformers
 ---
 # unsup-simcse-ja-large
 )
 ```
+## Model Summary
+- Fine-tuning method: Unsupervised SimCSE
+- Base model: [cl-tohoku/bert-large-japanese-v2](https://huggingface.co/cl-tohoku/bert-large-japanese-v2)
+- Training dataset: [Wiki40B](https://huggingface.co/datasets/wiki40b)
+- Pooling strategy: cls (with an extra MLP layer only during training)
+- Hidden size: 1024
+- Learning rate: 3e-5
+- Batch size: 64
+- Temperature: 0.05
+- Max sequence length: 64
+- Number of training examples: 2^20
+- Validation interval (steps): 2^6
+- Warmup ratio: 0.1
+- Dtype: BFloat16
+See the [GitHub repository](https://github.com/hppRC/simple-simcse-ja) for a detailed experimental setup.
 ## Citing & Authors
 ```