File size: 15,846 Bytes
6b42de6
 
 
 
 
 
 
 
 
 
 
 
e415b97
 
 
 
 
 
6b42de6
 
 
 
 
 
 
 
 
 
 
 
 
e415b97
6b42de6
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
e415b97
6b42de6
 
 
 
 
 
 
 
 
 
 
e415b97
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
6b42de6
 
 
 
 
 
e415b97
6b42de6
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
e415b97
6b42de6
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
e415b97
6b42de6
 
 
 
 
e415b97
6b42de6
e415b97
 
6b42de6
e415b97
6b42de6
 
e415b97
6b42de6
e415b97
6b42de6
 
e415b97
 
6b42de6
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
e415b97
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
6b42de6
e415b97
6b42de6
e415b97
 
 
 
 
6b42de6
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
---
base_model: mini1013/master_domain
library_name: setfit
metrics:
- metric
pipeline_tag: text-classification
tags:
- setfit
- sentence-transformers
- text-classification
- generated_from_setfit_trainer
widget:
- text: '[그린스토어] 고슬림 다이어트 팩 (칼로컷) 700mg X 112정 (하루 4정복용, 28일분) /2022.02.23  뉴그린팜'
- text: 한끼곤약젤리 버라이어티팩 150ml x 30개입  지유인터내셔널
- text: '[라이틀리] 곤약볶음밥 8종 4개+4개+1개 4. 닭가슴살200g x 5개_8. 잡채200g x 4개 메가글로벌001'
- text: 오리히로 일본 곤약젤리 제로칼로리 4 8 골라담기 잇츠킷 02. 샤인머스캣 130g 3팩_02. 샤인머스캣 130g 3팩_02.
    샤인머스캣 130g 2 (주) 행복을 파는 사람들
- text: 뉴트리원 비비랩  콜라겐 파우더S 2g x 30  주식회사 나르샤
inference: true
model-index:
- name: SetFit with mini1013/master_domain
  results:
  - task:
      type: text-classification
      name: Text Classification
    dataset:
      name: Unknown
      type: unknown
      split: test
    metrics:
    - type: metric
      value: 0.7886439320490664
      name: Metric
---

# SetFit with mini1013/master_domain

This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
2. Training a classification head with features from the fine-tuned Sentence Transformer.

## Model Details

### Model Description
- **Model Type:** SetFit
- **Sentence Transformer body:** [mini1013/master_domain](https://huggingface.co/mini1013/master_domain)
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
- **Maximum Sequence Length:** 512 tokens
- **Number of Classes:** 17 classes
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit)
- **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)

### Model Labels
| Label | Examples                                                                                                                                                                                                          |
|:------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1.0   | <ul><li>'사노셀 사라처럼 콤부차 다이어트 1박스(2주분) 체지방 감소 유기산 [사노셀] 사라처럼 2주(14포) 주식회사 뉴솔바이오'</li><li>'스키니랩 가르시니아 1000mg x 2정 x 14포  스윗퀸비'</li><li>'그린스토어 슬림 라인컷 다이어트 112정(28일분) 가르시니아 캄보지아추출물 체지방감소  프레스밀(Press Mill)'</li></ul> |
| 16.0  | <ul><li>'네추럴라이즈 더퍼펙트 스킨 히알루론산 먹는 피부 콜라겐 영양제 1박스 2개월분  (주)엔라이즈'</li><li>'이너비 아쿠아리치 더블업 600mg x 56캡슐  주식회사 제이더블유트레이드'</li><li>'웰릿 웰릿 아쿠아필름 저분자 히알루론산 고함량 콜라겐 엘라스틴 14매 2box  모던알'</li></ul>                          |
| 12.0  | <ul><li>'바로푸드 와일드망고씨앗 20배 추출분말가루 200g 1통  믿을수있는친구들'</li><li>'와일드망고 씨앗 가루 분말  (주)메디앤케어'</li><li>'프롬바이오 아프리카망고 1개월 30정x1박스 아프리카망고 1개월 주식회사 프롬바이오'</li></ul>                                                         |
| 8.0   | <ul><li>'레몬밤차 레몬밤 추출물 티 잎 허브차 티백  주식회사 수명원'</li><li>'[Solaray] 솔라레이 레몬 밤 475 mg, 100 베지캡슐  엘엔제이인터내셔널'</li><li>'순수한집 레몬밤차 티백 50개입 33. 국화차 50티백x2개 (총100개입) (주)순수코퍼레이션'</li></ul>                                   |
| 9.0   | <ul><li>'시네트롤 슬림 자몽 오렌지 추출물 60정 나린진 더 바디슬림 로얄캐네디언  라임마켓'</li><li>'캐나다 시네트롤 슬림 60베지캡슐 고함량 로얄캐네디언 씨네트롤 효능  한스생활건강'</li><li>'스키니랩 마시는 시네트롤 자몽 다이어트 4g x 14포  에이(A)'</li></ul>                                        |
| 3.0   | <ul><li>'졸러 래보래토리즈 잔트랙스 잰트렉스 블루, 84소프트젤 84소프트젤 아하몰'</li><li>'졸러 잔트렉스 블루 84캡슐 Zantrex Blue 2-잔트렉스 블랙 엘케이스토어'</li><li>'톡스웰 정 600mg x 60정 60정x1개 더 나누다 인터내셔널(The nanuda international)'</li></ul>                    |
| 5.0   | <ul><li>'건레몬 건조레몬 말린레몬 50g 연금술차 레몬티 건레몬 건조레몬 50g 현우공업사'</li><li>'그라비올라 300g 1팩  시간벌기'</li><li>'대상 청정원 홍초 석류 900ML x 2개  리인터내셔널'</li></ul>                                                                         |
| 14.0  | <ul><li>'판텐투컷 420mg x 90정 1개월분  잡(Job)상인'</li><li>'센트럴포뮬러 써큐레드 120정  바른건강몰'</li><li>'[NEW]메타그린 슬림업 리필형 420mg x 120정(2개월분) 2정소포장×60포 하나네트워크'</li></ul>                                                             |
| 4.0   | <ul><li>'오리온 닥터유 에너지바 40g 닥터유 호두에너지바40g 화진유통'</li><li>'랩노쉬 단백쿠키 5종 20개입 (맛 선택)/ 수제 르뱅 단백질과자 프로틴쿠키 초코칩 피넛버터 10개입 2박스 (총 20개입) 메가글로벌001'</li><li>'오리온 닥터유 에너지바 40g 오리온 닥터유 에너지바 40g 1개 (주) 굿 드림'</li></ul>          |
| 13.0  | <ul><li>'비비랩 잔티젠 에스 600mg x 14캡슐  판다친구'</li><li>'뉴트리디데이 다이어트 잔티젠 올뉴 600 30캡슐 1병 체중 체지방 감소 03_잔티젠 올뉴 3병 주식회사 더베이글'</li><li>'슈퍼잔티젠 원 캡슐 다이어트 650mg x 14캡슐  이너뷰티(Inner Beauty)'</li></ul>                            |
| 10.0  | <ul><li>'로얄 캐네디언 시서스 파우더 300G  녹돌 이'</li><li>'로얄케네디언 캐나다 시서스 분말 가루 파우더 300g  녹돌 씨'</li><li>'스키니랩 행복한 시서스 다이어트 600mg x 28정 동의 조이앤존'</li></ul>                                                                      |
| 15.0  | <ul><li>'캘리포니아 골드 뉴트리션 저분자 콜라겐 업 464g 마린콜라겐 펩타이드 히알루론산 1팩 조이제이몰'</li><li>'트루엔 듀얼액상콜라겐 18ml x 30포  주식회사 제이제이몰'</li><li>'지웨이 슈가 먹는 저분자 피쉬콜라겐 펩타이드 300달톤 150g 1통 슈가 피쉬 콜라겐 6통 (주)지웨이'</li></ul>                      |
| 0.0   | <ul><li>'CMG제약 슬림부스터02 800mg 42캡슐  건강청년'</li><li>'악마다이어트 cla 프리미엄 60캡슐 160년 전통 독일산 체지방감소 기초대사량 증가  스몰케어'</li><li>'인테로 CLA 공액리놀레산 공액리놀렌산 체지방감소 다이어트 식품 보조제 단기 8주분 2+1 (24주분) 주식회사 인테로'</li></ul>                   |
| 6.0   | <ul><li>'오리온 단백질칩 칠리살사맛 60g 닥터유 신상 프로틴 다이어트 과자 스낵  향기좋은날'</li><li>'엑스텐트 오리지널 BCAA 레몬 라임 스퀴즈 1.4kg 망고 매드니스 어스몰원'</li><li>'뉴트리코스트 베타-알라닌 언플레이버드 글루텐 프리 500g × 1개 와이에스 트레이딩'</li></ul>                               |
| 11.0  | <ul><li>'일동제약 비오비타 우리아이 쾌변젤리  월촌마트'</li><li>'미궁365 대장사랑 오리지널 5g x 30포 1박스  위너스마일'</li><li>'미궁365 대장사랑 오리지널 5g x 30포  제이컴퍼니'</li></ul>                                                                             |
| 2.0   | <ul><li>'국내산 도라지 환 국산  셋그라운드'</li><li>'[허닭] 닭가슴살 곤약볶음밥 250g 10종 1팩 01.닭가슴살 닭갈비 곤약 볶음밥 1팩 에이케이에스앤디 (주) AK인터넷쇼핑몰'</li><li>'[라이틀리] 참치김치 곤약볶음밥 200g  대상주식회사'</li></ul>                                                |
| 7.0   | <ul><li>'락토페린 2개월분 모로오렌지 시너지 c3g 모로실  활력포션 공식몰'</li><li>'락토페린 글루타치온 모로오렌지 18000 1박스 베르가못 이너뷰티 그래스페드 뷰티영양제  한국생활건강연구소'</li><li>'뉴트럴플랜 모로오렌지 레몬밤 락토페린 600mg x 120정  디에트데이'</li></ul>                                |

## Evaluation

### Metrics
| Label   | Metric |
|:--------|:-------|
| **all** | 0.7886 |

## Uses

### Direct Use for Inference

First install the SetFit library:

```bash
pip install setfit
```

Then you can load this model and run inference.

```python
from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_fd6")
# Run inference
preds = model("한끼곤약젤리 버라이어티팩 150ml x 30개입  지유인터내셔널")
```

<!--
### Downstream Use

*List how someone could finetune this model on their own dataset.*
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Set Metrics
| Training set | Min | Median  | Max |
|:-------------|:----|:--------|:----|
| Word count   | 3   | 10.0988 | 23  |

| Label | Training Sample Count |
|:------|:----------------------|
| 0.0   | 50                    |
| 1.0   | 50                    |
| 2.0   | 50                    |
| 3.0   | 50                    |
| 4.0   | 50                    |
| 5.0   | 50                    |
| 6.0   | 50                    |
| 7.0   | 23                    |
| 8.0   | 50                    |
| 9.0   | 50                    |
| 10.0  | 50                    |
| 11.0  | 50                    |
| 12.0  | 27                    |
| 13.0  | 50                    |
| 14.0  | 50                    |
| 15.0  | 50                    |
| 16.0  | 50                    |

### Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False

### Training Results
| Epoch | Step | Training Loss | Validation Loss |
|:-----:|:----:|:-------------:|:---------------:|
| 0.008 | 1    | 0.4244        | -               |
| 0.4   | 50   | 0.357         | -               |
| 0.8   | 100  | 0.201         | -               |
| 1.2   | 150  | 0.1331        | -               |
| 1.6   | 200  | 0.0757        | -               |
| 2.0   | 250  | 0.0294        | -               |
| 2.4   | 300  | 0.0338        | -               |
| 2.8   | 350  | 0.0214        | -               |
| 3.2   | 400  | 0.0108        | -               |
| 3.6   | 450  | 0.0059        | -               |
| 4.0   | 500  | 0.0046        | -               |
| 4.4   | 550  | 0.0065        | -               |
| 4.8   | 600  | 0.0023        | -               |
| 5.2   | 650  | 0.0004        | -               |
| 5.6   | 700  | 0.0002        | -               |
| 6.0   | 750  | 0.0022        | -               |
| 6.4   | 800  | 0.0021        | -               |
| 6.8   | 850  | 0.0022        | -               |
| 7.2   | 900  | 0.0021        | -               |
| 7.6   | 950  | 0.004         | -               |
| 8.0   | 1000 | 0.0002        | -               |
| 8.4   | 1050 | 0.0003        | -               |
| 8.8   | 1100 | 0.0002        | -               |
| 9.2   | 1150 | 0.0013        | -               |
| 9.6   | 1200 | 0.003         | -               |
| 10.0  | 1250 | 0.0015        | -               |
| 10.4  | 1300 | 0.0002        | -               |
| 10.8  | 1350 | 0.0001        | -               |
| 11.2  | 1400 | 0.0001        | -               |
| 11.6  | 1450 | 0.0001        | -               |
| 12.0  | 1500 | 0.0001        | -               |
| 12.4  | 1550 | 0.0001        | -               |
| 12.8  | 1600 | 0.0001        | -               |
| 13.2  | 1650 | 0.0001        | -               |
| 13.6  | 1700 | 0.0001        | -               |
| 14.0  | 1750 | 0.0001        | -               |
| 14.4  | 1800 | 0.0001        | -               |
| 14.8  | 1850 | 0.0001        | -               |
| 15.2  | 1900 | 0.0001        | -               |
| 15.6  | 1950 | 0.0001        | -               |
| 16.0  | 2000 | 0.0001        | -               |
| 16.4  | 2050 | 0.0001        | -               |
| 16.8  | 2100 | 0.0001        | -               |
| 17.2  | 2150 | 0.0001        | -               |
| 17.6  | 2200 | 0.0001        | -               |
| 18.0  | 2250 | 0.0001        | -               |
| 18.4  | 2300 | 0.0001        | -               |
| 18.8  | 2350 | 0.0001        | -               |
| 19.2  | 2400 | 0.0001        | -               |
| 19.6  | 2450 | 0.0001        | -               |
| 20.0  | 2500 | 0.0001        | -               |

### Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0

## Citation

### BibTeX
```bibtex
@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->