File size: 13,445 Bytes
5afb8ae
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
---
base_model: mini1013/master_domain
library_name: setfit
metrics:
- metric
pipeline_tag: text-classification
tags:
- setfit
- sentence-transformers
- text-classification
- generated_from_setfit_trainer
widget:
- text: 잔디엣지 화단 경계 가든 정원 마당 잔디 분리대 테두리 그린 15cm x 50m 블랙_15cm x 50m 엔비스토어
- text: 마늘부직포 20g 160cm x 400m 냉해 서리방지 농업용 양파 월동 비닐하우스 보온 서리방지 부직포 20g_210cmX400m
    케이eng
- text: 단열 온실재배기 홈가드닝 정원  식물재배 월동준비 1.5x2x2m 2m폭5m길이2m높이(골격미포함) 달담상사
- text: 목단묘목 2-3 겹꽃 노지월동 모란 개화주 오리지널 목단 46.동팡진 농업회사법인 세종식물원 주식회사
- text: 원형 동그라미 사각 타원형 화분받침 물받이 화분 받침대 민자  원형 민자_브라운_4호 영농사
inference: true
model-index:
- name: SetFit with mini1013/master_domain
  results:
  - task:
      type: text-classification
      name: Text Classification
    dataset:
      name: Unknown
      type: unknown
      split: test
    metrics:
    - type: metric
      value: 0.9584072003272877
      name: Metric
---

# SetFit with mini1013/master_domain

This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
2. Training a classification head with features from the fine-tuned Sentence Transformer.

## Model Details

### Model Description
- **Model Type:** SetFit
- **Sentence Transformer body:** [mini1013/master_domain](https://huggingface.co/mini1013/master_domain)
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
- **Maximum Sequence Length:** 512 tokens
- **Number of Classes:** 11 classes
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit)
- **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)

### Model Labels
| Label | Examples                                                                                                                                                                                                                                           |
|:------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 0.0   | <ul><li>'손펌프 미니 물조리개 500ml  에이치앤엠'</li><li>'심플 파스텔 화분 물조리개 1.8L 가드닝 물조루 원예 JH15 파스텔 핑크 (주)엔티렉스'</li><li>'2L 물 엔틱실린더 물뿌리개 옐로우 준모NJM'</li></ul>                                                                                                      |
| 4.0   | <ul><li>'초대형 개오지 조개 껍데기 바다의 소리 듣기 선물 컬렉션 소라 표본 1. AB 약 11-13cm 7. Y 약 14cm 지와이 실크로드'</li><li>'식물이름표 T형(소2미니) 100장묶음 흰라벨 화분이름표 식물라벨 4.T형(특대8)30장 무지개원예자재'</li><li>'색동나무 시트타입 그래피티니팅 가로수월동 SNW-04-90CM 마루온조경 주식회사'</li></ul>                         |
| 8.0   | <ul><li>'아임랙 슬림랙라인 2단 화분선반 철제 화분 받침대 플렌트 정리대 400x300x900 600x400_분리형1500(기본3단)_무드블랙 호레이몰(Hooray mall)'</li><li>'코팅 난대 10구 난분 화분걸이 난화분 정리 화분대 진열 코팅난대 10구 大 다온디포'</li><li>'라우 다육이 식물 화분 선반 베란다 선반대 거치대 철제 스탠드 받침대 진열대 거실 정리대 마칸 화분대 JS무역'</li></ul> |
| 9.0   | <ul><li>'플라스틱 화분받침대 동그라미 5호 내경140mm 황토(토기색) 베스트하우스'</li><li>'원형 동그라미 사각 타원형 화분받침 물받이 화분 받침대 민자 소 원형 민자_화이트_2호 영농사'</li><li>'이동식 원형 1호 화분받침대 바퀴 물받이 1_2원형물받침(바퀴미포함)_블랙_5호(32cm)(바퀴미포함) 주식회사 플라팜'</li></ul>                                          |
| 6.0   | <ul><li>'음나무 가시없는 민엄나무 묘목 엄나무 2년 20-30cm 민엄나무 2년생 20-30cm 한밭농원'</li><li>'사철나무 1m 울타리나무 묘목 생울타리 개나리나무 1M 에버팜'</li><li>'넝쿨 장미나무 덩굴 사계장미 묘목 1-2지 영국장미 독일 04.독일고급정원장미_12. 노발리스 에버팜'</li></ul>                                                          |
| 1.0   | <ul><li>'옹기수반 돌확 고양이 분수 자동 스테인리스 스틸 더블 볼 먹이 식수 개 물 초저소음 Smart Sensor Set 드림월드'</li><li>'돌확 사각수반 인조 잔디 미끄럼 방지 야외 러그 매트 방향 출입구 0.5x2m 19.7X78.6in 에스유09'</li><li>'백년옹기 무공해 옴팽이옹기수반 항아리어항 중 백년옹기'</li></ul>                                           |
| 3.0   | <ul><li>'썬킴 코코칩 압축형 3개 멀칭 분갈이흙 파충류바닥재 코코넛칩 코코넛바크 세척훈증처리  썬킴글로벌코리아'</li><li>'백 자갈 콩자갈 강자갈 백자갈_백자갈 20-27mm 10kg 주식회사 금'</li><li>'경인소재 규사 3호 4호 5호 6호 7호 25kg 반품불가 5호사(0.2~0.4mm) 한양피앤씨'</li></ul>                                                    |
| 7.0   | <ul><li>'화분 무광플레인 원형 화이트 소 인테리어 플라스틱화분 대형 도자기 분갈이 340~350(플라스틱화분)_349]낮은육각그레이(대) 그린데이'</li><li>'베하몰 표준형 토분 독일 키큰 21x25cm 클래식(황토색) 독일키큰 17x20cm_그래니트(크림화이트) 베스트하우스'</li><li>'슬릿화분 일본 플라스틱화분 젠가든 슬릿분 플분 eu06 [화이트]EU09 젠아파트먼트'</li></ul>             |
| 10.0  | <ul><li>'네마크린 200g 딸기 작은 뿌리파리 방제 나방 유충 천적 방제  보밍'</li><li>'발효계분 20L 퇴비 거름 가축분  메리머치(Merry Merch)'</li><li>'심폐소생 250g/원예/비료/영양제  시네캠퍼스'</li></ul>                                                                                                   |
| 2.0   | <ul><li>'천 폐기물 마당 PE 핸들 가방 더블 환경 퇴비 조립식비닐하우스 유기 주방 45 80cm 와이드캘리샾'</li><li>'관수상자 베이스 트레이 100장 플러그 모종 저면 모종판 삽목상자 육묘  푸른봄센터'</li><li>'농업용 서리방지 부직포 20g 1.7m x 400m 보온 못자리 덮개 양마 마늘  청년 농자재'</li></ul>                                               |
| 5.0   | <ul><li>'크리스마스 와인 커버 인테리어 장식 선물 파티 데코 소품 병 니트 양말 물병 산타 루돌프 용품 산타 김양스토리(kimyang-story)'</li><li>'LED줄전구 컬러 트리 USB 투명선 300구 조명 리모컨  잇템직구'</li><li>'그물전구 조명 장식 네트 녹색선 200구 LED 백색 지니  홈픽마켓'</li></ul>                                                 |

## Evaluation

### Metrics
| Label   | Metric |
|:--------|:-------|
| **all** | 0.9584 |

## Uses

### Direct Use for Inference

First install the SetFit library:

```bash
pip install setfit
```

Then you can load this model and run inference.

```python
from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_lh22")
# Run inference
preds = model("원형 동그라미 사각 타원형 화분받침 물받이 화분 받침대 민자 소 원형 민자_브라운_4호 영농사")
```

<!--
### Downstream Use

*List how someone could finetune this model on their own dataset.*
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Set Metrics
| Training set | Min | Median  | Max |
|:-------------|:----|:--------|:----|
| Word count   | 4   | 11.5982 | 25  |

| Label | Training Sample Count |
|:------|:----------------------|
| 0.0   | 50                    |
| 1.0   | 50                    |
| 2.0   | 50                    |
| 3.0   | 50                    |
| 4.0   | 50                    |
| 5.0   | 50                    |
| 6.0   | 50                    |
| 7.0   | 50                    |
| 8.0   | 50                    |
| 9.0   | 50                    |
| 10.0  | 50                    |

### Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False

### Training Results
| Epoch   | Step | Training Loss | Validation Loss |
|:-------:|:----:|:-------------:|:---------------:|
| 0.0116  | 1    | 0.4612        | -               |
| 0.5814  | 50   | 0.3432        | -               |
| 1.1628  | 100  | 0.1133        | -               |
| 1.7442  | 150  | 0.0601        | -               |
| 2.3256  | 200  | 0.0364        | -               |
| 2.9070  | 250  | 0.0199        | -               |
| 3.4884  | 300  | 0.0272        | -               |
| 4.0698  | 350  | 0.01          | -               |
| 4.6512  | 400  | 0.0023        | -               |
| 5.2326  | 450  | 0.0118        | -               |
| 5.8140  | 500  | 0.0097        | -               |
| 6.3953  | 550  | 0.0098        | -               |
| 6.9767  | 600  | 0.0128        | -               |
| 7.5581  | 650  | 0.003         | -               |
| 8.1395  | 700  | 0.0002        | -               |
| 8.7209  | 750  | 0.0001        | -               |
| 9.3023  | 800  | 0.0           | -               |
| 9.8837  | 850  | 0.0           | -               |
| 10.4651 | 900  | 0.0           | -               |
| 11.0465 | 950  | 0.0           | -               |
| 11.6279 | 1000 | 0.0           | -               |
| 12.2093 | 1050 | 0.0           | -               |
| 12.7907 | 1100 | 0.0           | -               |
| 13.3721 | 1150 | 0.0           | -               |
| 13.9535 | 1200 | 0.0001        | -               |
| 14.5349 | 1250 | 0.0           | -               |
| 15.1163 | 1300 | 0.0           | -               |
| 15.6977 | 1350 | 0.0           | -               |
| 16.2791 | 1400 | 0.0           | -               |
| 16.8605 | 1450 | 0.0           | -               |
| 17.4419 | 1500 | 0.0           | -               |
| 18.0233 | 1550 | 0.0           | -               |
| 18.6047 | 1600 | 0.0           | -               |
| 19.1860 | 1650 | 0.0           | -               |
| 19.7674 | 1700 | 0.0           | -               |

### Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0

## Citation

### BibTeX
```bibtex
@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->