vitus9988 commited on
Commit
42a0449
1 Parent(s): 999b75c

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +27 -2
README.md CHANGED
@@ -36,7 +36,7 @@ It achieves the following results on the evaluation set:
36
 
37
  아래 항목에 대한 개체명 인식을 제공합니다.
38
 
39
- - 사람이름 [PS]
40
  - 주소 (구 주소 및 도로명 주소) [AD]
41
  - 카드번호 [CN]
42
  - 계좌번호 [BN]
@@ -76,4 +76,29 @@ The following hyperparameters were used during training:
76
  - Transformers 4.40.2
77
  - Pytorch 2.3.0+cu118
78
  - Datasets 2.19.1
79
- - Tokenizers 0.19.1
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
36
 
37
  아래 항목에 대한 개체명 인식을 제공합니다.
38
 
39
+ - 사람이름 [PS] - 낮은 인식률
40
  - 주소 (구 주소 및 도로명 주소) [AD]
41
  - 카드번호 [CN]
42
  - 계좌번호 [BN]
 
76
  - Transformers 4.40.2
77
  - Pytorch 2.3.0+cu118
78
  - Datasets 2.19.1
79
+ - Tokenizers 0.19.1
80
+
81
+ ### Use
82
+ ```python
83
+ from transformers import AutoTokenizer, AutoModelForTokenClassification
84
+ from transformers import pipeline
85
+
86
+ tokenizer = AutoTokenizer.from_pretrained("vitus9988/klue_roberta_small_ner_identified")
87
+ model = AutoModelForTokenClassification.from_pretrained("vitus9988/klue_roberta_small_ner_identified")
88
+
89
+ nlp = pipeline("ner", model=model, tokenizer=tokenizer, aggregation_strategy="simple")
90
+ example = """
91
+ 저는 서울특별시 강남대로 56길 100호에 삽니다. 전화번호는 010-1234-5678이고 주민등록번호는 123456-1234567입니다. 메일주소는 hugging@face.com입니다.
92
+ """
93
+
94
+ ner_results = nlp(example)
95
+ for i in ner_results:
96
+ print(i)
97
+
98
+ #{'entity_group': 'AD', 'score': 0.79996574, 'word': '서울특별시 강남대로 56길 100호', 'start': 4, 'end': 23}
99
+ #{'entity_group': 'PH', 'score': 0.948794, 'word': '010 - 1234 - 5678', 'start': 36, 'end': 49}
100
+ #{'entity_group': 'RN', 'score': 0.90686846, 'word': '123456 - 1234567', 'start': 60, 'end': 74}
101
+ #{'entity_group': 'EM', 'score': 0.935588, 'word': 'hugging @ face. com', 'start': 85, 'end': 101}
102
+
103
+ ```
104
+