File size: 17,980 Bytes
b107de7 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 |
---
base_model: mini1013/master_domain
library_name: setfit
metrics:
- metric
pipeline_tag: text-classification
tags:
- setfit
- sentence-transformers
- text-classification
- generated_from_setfit_trainer
widget:
- text: 필립스 퍼펙트케어 파워라이프 스팀 다리미 GC3929/68 실크부터 청바지까지 온도 조절 NO! 타지 않는 다림질 웰컴마켓2
- text: 보랄 UV 침구 청소기 침대 소파 진공 BR-V603BC 홈니즈 보랄 UV 침구 진공청소기 더웰
- text: NEW 필립스160 다이나글라이드 열판 건식 전기다리미 제이엘코
- text: DG-TOK 넥밴드 타입 디지털 생활무전기 나노Q3/ nano-Q3 블랙 컴피시스템 (comfy system)
- text: ALLNEW29000 파워메이드_그레이(GRAY) 나성민
inference: true
model-index:
- name: SetFit with mini1013/master_domain
results:
- task:
type: text-classification
name: Text Classification
dataset:
name: Unknown
type: unknown
split: test
metrics:
- type: metric
value: 0.7946213453148402
name: Metric
---
# SetFit with mini1013/master_domain
This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.
The model has been trained using an efficient few-shot learning technique that involves:
1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
2. Training a classification head with features from the fine-tuned Sentence Transformer.
## Model Details
### Model Description
- **Model Type:** SetFit
- **Sentence Transformer body:** [mini1013/master_domain](https://huggingface.co/mini1013/master_domain)
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
- **Maximum Sequence Length:** 512 tokens
- **Number of Classes:** 18 classes
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit)
- **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
### Model Labels
| Label | Examples |
|:------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 | <ul><li>'보만 대용량 1단 LED터치 핸디 스팀다리미 DB8640G 바이 마르코 (by MARCO)'</li><li>'[구매확정시 N포인트 5% 적립]필립스 핸디형 스팀다리미 7000시리즈 STH7030/18 베르수니코리아 주식회사'</li><li>'테팔 클래시컬 플러스 논슬립 초경량 건식다리미 FS3120K0 주식회사 코스니크'</li></ul> |
| 4 | <ul><li>'보풀제거기 세탁소용 FX-200 유선 아이프리 옷 제거 보푸라기 이불 FX-200 교체용 6중칼날 플라이비(FLY BEE)'</li><li>'[IFREE] 아이프리 6중날 보풀제거기 FX-814 주식회사 더루츠'</li><li>'NEW 아이프리 세탁소 보풀제거기 가디건 니트 옷 FX-714 (주)클릭나라'</li></ul> |
| 16 | <ul><li>'번개표 신형 넉다운 KKD-2200 세트 + 램프1개 추가 (총 램프 2개) KKD-2200 최신형+램프 1개 세트 (주)강남대흥'</li><li>'CAS 카스 360도 절루가 야생동물퇴치기 고라니 멧돼지 두더지 뱀 조류 퇴치기 CLAR-100 (주)지오쇼핑'</li><li>'[스마토] 벅킬러 CF-BK06(블랙) 캠핑/벌레퇴치기/해충/모기 포에버툴'</li></ul> |
| 14 | <ul><li>'Coms 전화선 꼬임방지 White/NT874/전화선정리 [KF] 주식회사 케이에프컴퍼니'</li><li>'전화선 꼬임방지 White/NT874/전화선정리 주식회사 지엔비커뮤니케이션즈'</li><li>'지엔텔 GS-872 2라인(국선) 사무용전화기/단축메모리(12개)/재다이얼/온후크/벨음 리버앤오빌 주식회사'</li></ul> |
| 11 | <ul><li>'지니큐 다용도 UV-C 살균 소독기 무선 자외선 살균기 스마트폰 마스크 UV-500ST 블랙 주식회사 한국전산오피스'</li><li>'텔로 UV 살균기 미니 자외선 소독기 휴대용 책 멸균기 UVCLED 변기 멸균 TUV10 (주)모닝아트'</li><li>"휴대용 마스크 살균소독기 유비세이프 C'Shell MLS-100 그레이 주식회사 유비세이프"</li></ul> |
| 3 | <ul><li>'[잘텍] JX-220 ,JX220 생활무전기 1대 풀세트 블랙 플림스텔레콤주식회사'</li><li>'민영 MYT-0033 MYT0033 고성능 생활무전기 정품이어마이크 3개 주식회사 오토플렉스'</li><li>'PD508/PD-508/무전기 용 경호용 이어마이크/리시버/국산/JM8000T 클럽데님'</li></ul> |
| 13 | <ul><li>'바이마르 바디 건조기 드라이어 VMK-21A30D030 전신 에어 샤워 냉온풍 빠르고 깔끔한 건조 터치 스마트센서 드라이기 자동 몸말리는기계 욕실 따뜻한 시원한 바람 임산부 집들이 바이마르 바디 건조기 VMK-21A30D030 팬텀파트너스'</li><li>'제크롤 바디 스킨 케어 에어샤워 전신건조기 JK-1WBD101 바디드라이어 (주)세중통상'</li><li>'대림도비도스 바디건조기 DLB-700W 국내생산 바디 드라이어 DLB-700W (주) 더수바스'</li></ul> |
| 15 | <ul><li>'다이슨 국내 정품 옴니 글라이드 컴플리트 (퍼플/니켈) 정품스텐딩거치대 포함 이루 이루 스토어'</li><li>'로보락 다이애드 브러쉬 거치대 세트 팅크웨어모바일 주식회사'</li><li>'JCP 에브리봇 EDGE 주식회사 제이씨엠컴퍼니'</li></ul> |
| 6 | <ul><li>'한국타올기산업 자동 손소독기계 HTM-620 자동 1개 (주)서브원'</li><li>'티에스 자바코리아 자동 손소독기 THS2500T 전기식 건전지식 겸용 아름상사몰'</li><li>'HDTOP 비접촉 휴대용 자동 디스펜서 스프레이 손소독기 HT-A600 YGPJ-NJ0042 윤 미디어'</li></ul> |
| 2 | <ul><li>'베스틴 지문방지 푸시풀 도어락 IDL-300 블랙헤어라인 2WAY 현관 아파트 도어락 블랙 유광 (IDL-300SWNK) 키넷'</li><li>'셀프시공 삼성 IOT 푸시풀 디지털도어락 SHP-DR700+보강판 현관문 현관문도어락 하우스플러스(주)'</li><li>'무료설치 에버넷 샷시문도어락 상가번호키 패션문도어록 가마찌도어샤시 EN250-N A지역무료설치 진흥피닉스(주)'</li></ul> |
| 9 | <ul><li>'[하이마트] LG 스타일러 오브제컬렉션 S3BOF [3벌/미스트베이지] 롯데하이마트(주)'</li><li>'엘지 트롬 스타일러 린넨 블랙 S3BF 의류관리 코스트코 갱이점빵'</li><li>'[삼성] 에어드레서 상의 5~9 벌 + 하의 1 벌,코타차콜 DF24CG5100HR 배송은 주문 후 2~4주이상 소요 주식회사 위링크'</li></ul> |
| 5 | <ul><li>'신일 스텐 탈수기 SDM-T77H 가정용 수영장 캠핑장 펜션 콜드림'</li><li>'삼성전자 아가사랑 WA30T2101EE 동의 선우에이치앤비(SUNWOO H&B)'</li><li>'한일전기 W-110 미니 짤순이 다용도 음식물 야채 오이지 두부 탈수기 1kg 탈수기 짤순이(신형) (주)씨앤제이글로벌'</li></ul> |
| 12 | <ul><li>'싱거 8280(단품+수강증+보증서1년)+ 프리모션노루발+노루발3종+말아박이 랍바세트 태양에스엠주식회사'</li><li>'부라더미싱 이노비스A16 (Innovis-A16) NV-A16 부라더미싱'</li><li>'부라더미싱 이노비스 A80, innovis a80, 브라더미싱 팀에이에이 Team AA'</li></ul> |
| 7 | <ul><li>'LED스탠드 브로드윙X (LSP-9700) 베이스 화이트 멜라토닌 학습용 학생 스탠드 MinSellAmount (주)프리즘'</li><li>'듀플렉스 DP-910LS 시력보호 면조명 LED 스탠드 책상 학생용 코지인터내셔널'</li><li>'LED스탠드 책상 학생 독서등 학습용 스텐드 NXL-3000 /스마일배송 오트빌'</li></ul> |
| 0 | <ul><li>'스마트소닉 1000 음파칫솔 단품 [화이트] + 칫솔모 1팩 블루 에스에이치 인터내셔날'</li><li>'프리쉐 PA-TS3000 골프_위탁 업체로 공급사나 배달업체에 개인정보 동의 도라에몽상회'</li><li>'알로코리아 덴픽션 바람건조 고온히팅 UV-C 무선 휴대용 칫솔살균기 ATS1G 단품 1+1 세트_크림+블루 알로이비즈 주식회사'</li></ul> |
| 17 | <ul><li>'[아메리칸스탠다드] 핸드 드라이어 삽입형 FG8901(고속형), FG8984(일반형) 화장실 상업용 편의품 FG8901(고속형) 대일도기사 주식회사'</li><li>'대림 도비도스 DX-1000,DX1000 핸드드라이어 (아이보리) 준트레이딩(JUN Trading)'</li><li>'TS자바 핸드드라이어 TH350ST 스테인레스 핸드드라이기 TSJAVA 화장실 강풍 프럼바디'</li></ul> |
| 8 | <ul><li>'쿠쿠 버블클렌저 연수기 CWS-AO201W 주식회사 제이홀딩스'</li><li>'프렐 연수기 마이크로버블 클렌저 녹물 염소 제거 버블수기 무광 화이트 그레이 투톤색상 (주)로보터스'</li><li>'[렌탈] [셀프형] 현대큐밍 샤워기필터 연수기 더클린 워터케어 (HQS20100W0) 실버 (주)현대렌탈케어'</li></ul> |
| 10 | <ul><li>'[특별 ] 세라젬 밸런스 알칼리 이온수 생성기 의료기기 (주) 세라젬'</li><li>'뉴랜드올네이처 알칼리이온수기 셀터치프리미엄 뉴랜드올네이처비전'</li><li>'뉴랜드올네이처 알칼리이온수기 셀터치필터 복합중공사(UF Membrane) 뉴랜드올네이처비전'</li></ul> |
## Evaluation
### Metrics
| Label | Metric |
|:--------|:-------|
| **all** | 0.7946 |
## Uses
### Direct Use for Inference
First install the SetFit library:
```bash
pip install setfit
```
Then you can load this model and run inference.
```python
from setfit import SetFitModel
# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_el11")
# Run inference
preds = model("ALLNEW29000 파워메이드_그레이(GRAY) 나성민")
```
<!--
### Downstream Use
*List how someone could finetune this model on their own dataset.*
-->
<!--
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->
<!--
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->
<!--
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->
## Training Details
### Training Set Metrics
| Training set | Min | Median | Max |
|:-------------|:----|:-------|:----|
| Word count | 3 | 9.3700 | 32 |
| Label | Training Sample Count |
|:------|:----------------------|
| 0 | 50 |
| 1 | 50 |
| 2 | 50 |
| 3 | 50 |
| 4 | 50 |
| 5 | 50 |
| 6 | 50 |
| 7 | 50 |
| 8 | 5 |
| 9 | 50 |
| 10 | 3 |
| 11 | 50 |
| 12 | 50 |
| 13 | 50 |
| 14 | 50 |
| 15 | 50 |
| 16 | 50 |
| 17 | 50 |
### Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False
### Training Results
| Epoch | Step | Training Loss | Validation Loss |
|:-------:|:----:|:-------------:|:---------------:|
| 0.0079 | 1 | 0.4968 | - |
| 0.3937 | 50 | 0.3206 | - |
| 0.7874 | 100 | 0.1406 | - |
| 1.1811 | 150 | 0.0735 | - |
| 1.5748 | 200 | 0.0518 | - |
| 1.9685 | 250 | 0.0242 | - |
| 2.3622 | 300 | 0.006 | - |
| 2.7559 | 350 | 0.0102 | - |
| 3.1496 | 400 | 0.0088 | - |
| 3.5433 | 450 | 0.0082 | - |
| 3.9370 | 500 | 0.0062 | - |
| 4.3307 | 550 | 0.012 | - |
| 4.7244 | 600 | 0.0021 | - |
| 5.1181 | 650 | 0.002 | - |
| 5.5118 | 700 | 0.0049 | - |
| 5.9055 | 750 | 0.0043 | - |
| 6.2992 | 800 | 0.006 | - |
| 6.6929 | 850 | 0.0002 | - |
| 7.0866 | 900 | 0.0004 | - |
| 7.4803 | 950 | 0.0002 | - |
| 7.8740 | 1000 | 0.0002 | - |
| 8.2677 | 1050 | 0.0002 | - |
| 8.6614 | 1100 | 0.0001 | - |
| 9.0551 | 1150 | 0.0001 | - |
| 9.4488 | 1200 | 0.0002 | - |
| 9.8425 | 1250 | 0.0002 | - |
| 10.2362 | 1300 | 0.0001 | - |
| 10.6299 | 1350 | 0.0001 | - |
| 11.0236 | 1400 | 0.0001 | - |
| 11.4173 | 1450 | 0.0001 | - |
| 11.8110 | 1500 | 0.0001 | - |
| 12.2047 | 1550 | 0.0001 | - |
| 12.5984 | 1600 | 0.0001 | - |
| 12.9921 | 1650 | 0.0001 | - |
| 13.3858 | 1700 | 0.0001 | - |
| 13.7795 | 1750 | 0.0001 | - |
| 14.1732 | 1800 | 0.0001 | - |
| 14.5669 | 1850 | 0.0001 | - |
| 14.9606 | 1900 | 0.0001 | - |
| 15.3543 | 1950 | 0.0001 | - |
| 15.7480 | 2000 | 0.0001 | - |
| 16.1417 | 2050 | 0.0001 | - |
| 16.5354 | 2100 | 0.0001 | - |
| 16.9291 | 2150 | 0.0001 | - |
| 17.3228 | 2200 | 0.0001 | - |
| 17.7165 | 2250 | 0.0001 | - |
| 18.1102 | 2300 | 0.0001 | - |
| 18.5039 | 2350 | 0.0001 | - |
| 18.8976 | 2400 | 0.0001 | - |
| 19.2913 | 2450 | 0.0001 | - |
| 19.6850 | 2500 | 0.0001 | - |
### Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0
## Citation
### BibTeX
```bibtex
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}
```
<!--
## Glossary
*Clearly define terms in order to be accessible across audiences.*
-->
<!--
## Model Card Authors
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->
<!--
## Model Card Contact
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
--> |