SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
15
  • '내 폰도 시원하게!!! 루이트 스마트폰 쿨러 쿨링패드 접촉식 SNOW-3001 피닉스F&B'
  • '[브리츠 액세사리] 스마트폰 전용 쿨러 [BA-AMK3] (주)컴퓨존'
  • '브리츠 BA-AMK3 스마트폰 쿨러 거치대 쿨링패드 핸드폰쿨러 더드림 트레이딩(the dream trading)'
9
  • '갤럭시S22 울트라 갤럭시S23 울트라 필름 3매 S23 / S22 호환 주식회사 빅쏘코리아'
  • '닥터가드 아이폰15 프로 맥스 메탈 카메라 강화 필름 빛번짐 방지 렌즈 보호 15/15Plus_1+1_Black 2개 닥터가드샵'
  • '[갤러리아] 아이폰14/14 맥스 호환 링케 후면 카메라 보호 풀커버 스타일링 아이폰14/14맥스 호환 한화갤러리아(주)'
8
  • '로모스 SW20S Pro 20000mAh 보조배터리 효로로몰'
  • '모디스 일체형 미니 보조배터리 5000mAh 8핀 가볍고 휴대하기 편한 보조배터리 아이폰 8핀(민트) 마이미케이스'
  • '스마텍 SMARTEK 초슬림 맥세이프 마그네틱 고속충전 보조배터리 5100mAh STPB-SPS5 케이블포함 그레이(STPB-SPS5) 티제이컴퍼니'
11
  • '스마트폰 핸드폰 핑거 스트랩 에어루프[아이엠듀] 네이비 주식회사 웹이즈'
  • '[1300K] 신지모루 신지루프 스탠드 핸드폰 핑거스트랩 폰스트랩 핸드폰줄 신지루프 스탠드 핑거스트랩_핑크 엔에이치엔위투 주식회사'
  • '길이조절 분실방지 일체형 핸드폰 스트랩 목걸이 줄 길이조절 스트랩 - 블랙 주식회사 바라보고'
14
  • '[ 가성비 ] 카드수납 천연소가죽 갤럭시 다이어리 S928 케이스 지갑형 루이스 S24울트라 핸드폰 갤럭시 S24울트라 S928_그린 더조은유통센터9'
  • '리믹스 에어로드 소형 백팩 스마트폰 암밴드 스포츠 런닝 등산 배낭 주식회사 지니스'
  • '플라핏 갤럭시 S24플러스 젠틀리 천연가죽 다이어리 그레이 (주) 아이에스케이'
3
  • '로랜텍 애플워치 스트랩 밀레니즈 루프 시계줄 밴드 SE2 9 8 7 6 38,40,41mm호환 6 애플워치 네추럴 소가죽_38mm/40mm/41mm_로즈골드 건용지미'
  • '갤럭시워치4 클래식 42mm 이너 베젤링 링케 베젤 스타일링 갤럭시워치4 클래식_이너베젤링 (GW4C-42-IN-01) 주식회사 리어스'
  • 'Apple 49mm 트레일 루프 - 블루/블랙 S/M (MT613FE/A) 블루/블랙 S/M - MT613FE/A (주)블루박스 (Blue Box Co., Ltd)'
7
  • 'NEXT-16MM 스마트폰 셀카 렌즈 (주)시드아이엔씨'
  • 'NEXT-16MM 16mm 4K Wide Lens 120 주식회사 스토리지썬'
  • 'NEXT-16MM 스마트폰 광각렌즈 16mm 4K Wide 120도 주식회사 지엘플레이스'
4
  • '루이트 얼굴인식 360도 트래킹 짐벌 SR01 9시간연속 대용량 배터리 노다지(NODAJI)'
  • '루이트 스마트 얼굴인식 360도 트레킹 짐벌 SR01 오앤아이 주식회사(O&I)'
  • '캐논 HG-100TBR 블루투스 리모컨 포함 삼각대 그립 (캐논스토어 대구점) 주식회사디지탈캠프'
13
  • '넥시 차량용 Type-C to 3.5 AUX 케이블 NX-CAXM (NX1210) 1.5M 아이비엔'
  • 'C to C PD 타입 100W 5A USB 2.0 고속충전 케이블 플렉시블 30cm CtoC LED 100W 120cm_블랙 아이킨'
  • '아이엔조이 100W 마카롱 PD C to C 타입 고속 충전 케이블 초고속 2.0 크레비즈 코리아'
2
  • '[텐바이텐][ Fitbit 공식판매점 ] Fitbit Versa4 핏빗 버사4 스마트워치 블랙&그라파이트 알루미늄 (주)텐바이텐'
  • '애플 워치 SE2 GPS 40mm 실버 알루미늄 윈터블루 스포츠 루프 실버 스톰블루 스포츠밴드 (M/L) 주식회사 설빈'
  • 'JCP Apple 워치 SE 1세대 GPS Nike 44mm (실버 알루미늄) 주식회사 제이씨엠컴퍼니'
0
  • '삼성전자 갤럭시 S24 Ultra S Pen EJ-PS928 그레이 (주)유승씨앤씨'
  • '[ESR] ESR 할로락 지오 루프 2IN1 맥세이프 카드지갑 거치대 지오루프 2IN1 카드지갑:브라운 EC688 (주) 교보문고'
  • '매그 클립S 아이폰 맥세이프 카드지갑 마그네틱 카드슬롯 매그 클립 레더 맥세이프 카드슬롯-골드브라운 주식회사 요이치'
1
  • '주파집 4세대 블루투스 삼각대 셀카봉 JU-SS100 4세대 블루투스 삼각대 셀카봉 JU-SS100_블랙 주식회사 주파집'
  • '루이트 블루투스 셀카봉 RT-JS7 댕냥이집사몰'
  • '조명LED 블루투스 셀카봉 삼각대 SEL-LT860Z 블랙&레드 LED풀세트 주식회사 셀루미'
6
  • '[iRing] 정품 아이링 슬라이드 싱글 블랙 카미니(KAMINI)'
  • 'coloring heart 아이폰 맥세이프 그립 톡홀더 blue 주식회사 모먼트디자인'
  • '항공샷 수평 탑뷰 만능샷 침대 탁상용 스마트폰 수직 촬영 거치대 삼각대 촬영 거치대 투앤티'
10
  • 'Zizzy P-CAP 고리 이어캡 이어폰구멍 보호마개 레드하이브 '
  • 'Zizzy P-CAP 고리 이어캡 이어폰구멍 보호마개 레드하이브 '
  • '신지가토 / 큐빅 이어캡 Bambi (blue) 케이알트레이더스'
5
  • '케이블마트 NAB564 스마트폰 전화기 핸드셋(Green) 엠에이씨케이'
  • '[AB565] Coms 스마트폰 전화기 핸드셋(Blue) (주)라니아씨앤씨'
  • '[AB564] Coms 스마트폰 전화기 핸드셋(Green) (주)라니아씨앤씨'
12
  • '벨킨 15W 맥세이프 고속 무선 충전 패드 WIA004kr 화이트 나인스타컴퍼니'
  • '6IN1 애플워치 갤럭시워치 에어팟 버즈 무선충전기 나비 NV184-MWC10 블랙 초식공룡마켓'
  • '클레버 타키온 GaN PD PPS 접지형 83W 고속 멀티충전기 G224PQ 블랙 주식회사바이퍼럭스'

Evaluation

Metrics

Label Metric
all 0.9269

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_el25")
# Run inference
preds = model("갤럭시워치5 44mm 9H 액정보호 강화유리필름 2매 MinSellAmount 하이애드")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 4 11.0114 27
Label Training Sample Count
0 50
1 50
2 50
3 50
4 50
5 7
6 50
7 29
8 50
9 50
10 13
11 50
12 50
13 50
14 50
15 50

Training Hyperparameters

  • batch_size: (512, 512)
  • num_epochs: (20, 20)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 40
  • body_learning_rate: (2e-05, 2e-05)
  • head_learning_rate: 2e-05
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0091 1 0.4972 -
0.4545 50 0.2762 -
0.9091 100 0.1381 -
1.3636 150 0.0883 -
1.8182 200 0.0328 -
2.2727 250 0.0061 -
2.7273 300 0.0009 -
3.1818 350 0.0005 -
3.6364 400 0.0004 -
4.0909 450 0.0003 -
4.5455 500 0.0022 -
5.0 550 0.0002 -
5.4545 600 0.0002 -
5.9091 650 0.0002 -
6.3636 700 0.0002 -
6.8182 750 0.0002 -
7.2727 800 0.0001 -
7.7273 850 0.0021 -
8.1818 900 0.0001 -
8.6364 950 0.0001 -
9.0909 1000 0.0001 -
9.5455 1050 0.0001 -
10.0 1100 0.0001 -
10.4545 1150 0.0001 -
10.9091 1200 0.0001 -
11.3636 1250 0.0001 -
11.8182 1300 0.0001 -
12.2727 1350 0.002 -
12.7273 1400 0.0001 -
13.1818 1450 0.0001 -
13.6364 1500 0.0001 -
14.0909 1550 0.0001 -
14.5455 1600 0.0001 -
15.0 1650 0.0001 -
15.4545 1700 0.0001 -
15.9091 1750 0.0001 -
16.3636 1800 0.002 -
16.8182 1850 0.002 -
17.2727 1900 0.0001 -
17.7273 1950 0.0001 -
18.1818 2000 0.0001 -
18.6364 2050 0.0001 -
19.0909 2100 0.0001 -
19.5455 2150 0.0001 -
20.0 2200 0.0001 -

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.1.0.dev0
  • Sentence Transformers: 3.1.1
  • Transformers: 4.46.1
  • PyTorch: 2.4.0+cu121
  • Datasets: 2.20.0
  • Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
422
Safetensors
Model size
111M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for mini1013/master_cate_el25

Base model

klue/roberta-base
Finetuned
(182)
this model

Evaluation results