smartmind
/

roberta-ko-small-tsdae

@@ -29,16 +29,17 @@ sentence-similarity를 구하는 용도로 바로 사용할 수도 있고, 목
 ## Usage (Sentence-Transformers)
-Using this model becomes easy when you have [sentence-transformers](https://www.SBERT.net) installed:
 ```
 pip install -U sentence-transformers
 ```
-Then you can use the model like this:
 ```python
 from sentence_transformers import SentenceTransformer
 sentences = ["This is an example sentence", "Each sentence is converted"]
 model = SentenceTransformer('smartmind/roberta-ko-small-tsdae')
@@ -46,10 +47,41 @@ embeddings = model.encode(sentences)
 print(embeddings)
 ```
 ## Usage (HuggingFace Transformers)
-Without [sentence-transformers](https://www.SBERT.net), you can use the model like this: First, you pass your input through the transformer model, then you have to apply the right pooling-operation on-top of the contextualized word embeddings.
 ```python
 from transformers import AutoTokenizer, AutoModel
@@ -103,4 +135,4 @@ SentenceTransformer(
 ## Citing & Authors
-<!--- Describe where people can find more information -->

 ## Usage (Sentence-Transformers)
+[sentence-transformers](https://www.SBERT.net)를 설치한 뒤, 모델을 바로 불러올 수 있습니다.
 ```
 pip install -U sentence-transformers
 ```
+이후 다음처럼 모델을 사용할 수 있습니다.
 ```python
 from sentence_transformers import SentenceTransformer
 sentences = ["This is an example sentence", "Each sentence is converted"]
 model = SentenceTransformer('smartmind/roberta-ko-small-tsdae')
 print(embeddings)
 ```
+다음은 sentence-transformers의 기능을 사용하여 여러 문장의 유사도를 구하는 예시입니다.
+```python
+from sentence_transformers import util
+sentences = [
+    "대한민국의 수도는 서울입니다.",
+    "미국의 수도는 뉴욕이 아닙니다.",
+    "대한민국의 수도 요금은 저렴한 편입니다.",
+    "서울은 대한민국의 수도입니다.",
+    "오늘 서울은 하루종일 맑음",
+]
+paraphrase = util.paraphrase_mining(model, sentences)
+for score, i, j in paraphrase:
+    print(f"{sentences[i]}\t\t{sentences[j]}\t\t{score:.4f}")
+```
+```
+대한민국의 수도는 서울입니다.		서울은 대한민국의 수도입니다.		0.7616
+대한민국의 수도는 서울입니다.		미국의 수도는 뉴욕이 아닙니다.		0.7031
+대한민국의 수도는 서울입니다.		대한민국의 수도 요금은 저렴한 편입니다.		0.6594
+미국의 수도는 뉴욕이 아닙니다.		서울은 대한민국의 수도입니다.		0.6445
+대한민국의 수도 요금은 저렴한 편입니다.		서울은 대한민국의 수도입니다.		0.4915
+미국의 수도는 뉴욕이 아닙니다.		대한민국의 수도 요금은 저렴한 편입니다.		0.4785
+서울은 대한민국의 수도입니다.		오늘 서울은 하루종일 맑음		0.4119
+대한민국의 수도는 서울입니다.		오늘 서울은 하루종일 맑음		0.3520
+미국의 수도는 뉴욕이 아닙니다.		오늘 서울은 하루종일 맑음		0.2550
+대한민국의 수도 요금은 저렴한 편입니다.		오늘 서울은 하루종일 맑음		0.1896
+```
 ## Usage (HuggingFace Transformers)
+[sentence-transformers](https://www.SBERT.net)를 설치하지 않은 상태로는 다음처럼 사용할 수 있습니다.
 ```python
 from transformers import AutoTokenizer, AutoModel
 ## Citing & Authors
+<!--- Describe where people can find more information -->