master_cate_lh8 / README.md
mini1013's picture
Push model using huggingface_hub.
4db72b3 verified
metadata
base_model: mini1013/master_domain
library_name: setfit
metrics:
  - metric
pipeline_tag: text-classification
tags:
  - setfit
  - sentence-transformers
  - text-classification
  - generated_from_setfit_trainer
widget:
  - text: 타공판닷컴 세계지도 대형 월드맵 세계지도03_600x900 (주)오빌
  - text: >-
      스프링 제본 PDF 흑백 고품질 레이저 출력 - 흑백 양면인쇄 모조지80g 50p 스프링 흑백양면●●_모조지100g_167~170
      page 도서출판 법현
  - text: '[달페이퍼] 달페이퍼 미니미니 6종 엽서 postcard 인테리어엽서 6 미니미니 일하는 주식회사 천유닷컴'
  - text: >-
      환갑 현수막 회갑 생신 잔치 플랜카드 C00 네임 소형100x70cm C22 얼쑤(남자)-자유문구포토형_소형 100x70cm
      (주)엔비웨일인터렉티브
  - text: >-
      스프링 제본 PDF 흑백 고품질 레이저 출력 - 흑백 양면인쇄 모조지80g 50p 스프링 흑백단면●_모조지80g_179~182
      page 도서출판 법현
inference: true
model-index:
  - name: SetFit with mini1013/master_domain
    results:
      - task:
          type: text-classification
          name: Text Classification
        dataset:
          name: Unknown
          type: unknown
          split: test
        metrics:
          - type: metric
            value: 0.964332367808258
            name: Metric

SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
6.0
  • '명함 당일제작 소량 심플한 고급 인쇄 카페쿠폰 예쁜 부동산 회사 단면 비코팅 200매 ==질감있는 재질(▼아래에서 선택▼)== 주식회사 오투디자인그룹'
  • '전단지 소량 인쇄 제작 A5 단면 컬러 스노우지150 팜플렛 리플렛 당일 B5양면(16절)_아트지200 프린팅팩토리'
  • '잉크젯 - 컬러 출력 제본 - A5 백색80g 양면 A3(420×297㎜) - 제본불가_백색 80g 복사지_컬러양면△△ (페이지X권수=전체 쪽수 입력) 임프레스'
2.0
  • '[3개부터 제작] 백색페트 와블러 댕글러 쇼카드 가격표 POP 자유모양 재단 100x100mm_A형(사각/원형/라운드)_260장 (주)여름기획'
  • '휴대용 다이어트 피팅 허리 옷 의류 신체 줄자 1.5m 이잡스2'
  • '편안해 데스크매트 책상매트 패드 가죽 덮개 깔개 깔판 S6030 L90X45_블랙 편안한오늘'
5.0
  • '카시오 계산기 MS-20UC 미니 귀여운 컬러 전자계산기 공식스토어 MS-20UC_퍼플 주식회사 행남통상'
  • '[팝콘게임즈] 프리미엄 포토카드 슬리브 하드 50매 56x87 포안'
  • '펠로우즈 문서 세단기 P-30C 4x34mm 꽃가루형 파쇄기 세절기 폐지함 15L 블랙 블랙 두레샵'
13.0
  • '에이든 세계지도 극세사 러그 100×150cm 사계절- 아이방 놀이방 키즈 매트 카페트 아이보리_100×150cm 주식회사 타블라라사'
  • '유럽지도 한글영문 코팅 - 영국 프랑스 여행 세계전도 포스터 대형(210x150cm) (주)나우맵소프트'
  • '한국 100대 명산 여권 대한민국 산림청 백대명산 정상석 수첩 등산여권 기록 여권+스탬프 추억거리'
11.0
  • '크리스마스 선물 커트러리 스푼 포크 세트 4 개/6 개, 엘크 트리 장식 디저트 과일 커피 01 A 성운물산'
  • '유어캔들 파티 케익촛불 생일초 대용량 벨류팩 싱글 100입 01.싱글 핑크 주식회사 조앤인터내셔널'
  • '[텐바이텐] 제기(색상랜덤발송) 제로찬스'
10.0
  • '라벨지 A4라벨지 스티커라벨 투명 방수 라벨 레이저용 1칸(전지) 20장 흰색방수(Laser)_8칸(2X4) 10장 (주)유퍼스트'
  • '종이나라 코팅필름 A3 100mic 100매 대진교육 주식회사'
  • '더블에이 A4 복사용지 75g 2000매 제이앤에스(J&S)'
4.0
  • '마그네틱 자석 보드 29cm x 56cm 주문제작 그레이_380x760 세운정밀'
  • '호이지보드 LCD전자노트 메모보드 드로잉패드 스마트 메모장 8.5인치(컬러글씨)_핑크 호이지보드(Howeasy Board)'
  • '노베젤 화이트유리칠판 1200x800mm 럭시 벽걸이 글라스보드 1200x800mm 일반 주식회사 럭시글라스'
0.0
  • '스누피 인덱스노트 그레이(도트) 뭉뭉방구'
  • '3M 포스트잇 653-20A 대용량팩 일반 점착 접착용 노트 51x38mm 정비공톡'
  • '임산부 손목보호대 손목아대 블랙_S 블루마켓'
14.0
  • '백광 검은색 검정봉투 흰색비닐봉투 검정_6호20리터 백광비닐산업'
  • '비닐닷컴 각대봉투 종이봉투 카페 크라프트 빵포장 180x110x350 200매 종이쇼핑백/플랫(납작끈)_백색 감광지_대/310x125x420/50매 비닐닷컴'
  • '[쿠베르] 감성 인테리어 엽서, 파리 A 미니 포스터 사진 촬영 소품 5.로마_로마 4장 쿠베르(COUVERT)'
7.0
  • '레드스탬프 인감 도장 가벽조레이저 십장생 띠 아기 이름 직인 단체 도장 만들기 한글고인체 선택 01 - 가벽조레이저_원앙_한자초서체 레드스탬프'
  • '자동 번호 넘버링 스탬프 마킹 날짜 가격표 찍는 도장 수동 3 자리 수 자동_4 LIN SHUZHEN'
  • '에이플렉스 씰링 스탬프 글루건 실링왁스 11mm 글루왁스1번(글루) 글루 왁스 34번(글루) 에이플렉스(Aflex)'
16.0
  • '블루칩 인형필통 폴리에스테르 대용량 14세이상사용 인형필통(오리디자인) 에이스 무역'
  • '모나미 매직 캡 적색 라인'
  • '모나미 보드마카 리퀴드 생잉크 220 흑 주식회사 에스에이치몰'
15.0
  • '프리미엄 악보 파일 10매~60매 밴드화일 메모 가능 40매_블루(뮤직)_추가 다다다기업'
  • 'A4파일 클립보드 A4파일철 결재판 세로형 가로형_그린 살림 마녀'
  • '[다나 코퍼레이션] A4 파일 철 파일케이스 그레이 다나 코퍼레이션'
9.0
  • '아워모티프 포카바인더 6공 포토카드 바인더 A5 A5_블랙_바인더 월간문구'
  • '마이러브 초음파앨범 꾸미기 뱀띠 아기 각인 사진정리 셀프포토북 앨범 단품 크림 앨범 + 꾸미기 세트_마이러브앨범: B급크림 / 주수스티커: 컬러_토끼띠 + 프로필 스티커 커플러스'
  • '아워모티프 포카바인더 6공 포토카드 바인더 A5 A6_올리브_바인더 월간문구'
12.0
  • '롤 트레싱지 롤 트레이싱지 idem 플로터 반투명종이 A1 하이비즈코리아'
  • '신한 삼원 트레싱지 A4 A3 80g 85g 트레이싱지 삼원 A3 100매 디포스타'
  • '롤 트레싱지 롤 트레이싱지 idem 플로터 반투명종이 A3 10. 12인치x50야드(흰색) 하이비즈코리아'
3.0
  • '종이나라 비비드 마블링물감 12색 (1개) 바이포비'
  • '네오디움 자석 원형 고리 막대 사각 네오디뮴 초강력자석 2 x 1mm 선택.4 네오디움 사각자석_★ 모든치수의 단위는 mm 입니다★ 유마그네트'
  • '도루코 S 커터날 10매 칼날 커터칼 사무용칼 S커터날 10입 에이치티비 트레이드'
1.0
  • '2025 양지 다이어리 유즈어리 25A 로고 인쇄 수첩&포켓다이어리_인스타일48_그레이 주식회사 제이에프샵'
  • '2025 아르디움 먼슬리 플래너 화이트 데이드림 지웨이컨텐츠(JIWAY Contents)'
  • '홍보용 새해 벽걸이 달력 특별2절 숫자판 70모조 1부 제작 숫자판 캘린더 주문 인쇄 벽걸이달력_2-1 2절숫자판70모조_200부 제작 1부 단가 총무나라 주식회사'
8.0
  • '신일 SINIL 박스테이프 경포장 투명 택배 포장 OPP 고점착 테이프 80m 40개 SINIL 중포장 투명_50M 50개 주식회사 신일'
  • '3M 스카치 투명양면테이프 리필 017R 017D 본품 좋은사람문구유통'
  • '우림 박스 테이프 L3 50M 50개 경포장 투명 OPP 포장용 러버테이프(겨울용/냉동용)S시리즈(겨울용)S1-러버(40Mx50개)황색 우림 강서지사'

Evaluation

Metrics

Label Metric
all 0.9643

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_lh8")
# Run inference
preds = model("타공판닷컴 세계지도 대형 월드맵 세계지도03_600x900 (주)오빌")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 4 11.1176 26
Label Training Sample Count
0.0 50
1.0 50
2.0 50
3.0 50
4.0 50
5.0 50
6.0 50
7.0 50
8.0 50
9.0 50
10.0 50
11.0 50
12.0 50
13.0 50
14.0 50
15.0 50
16.0 50

Training Hyperparameters

  • batch_size: (512, 512)
  • num_epochs: (20, 20)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 40
  • body_learning_rate: (2e-05, 2e-05)
  • head_learning_rate: 2e-05
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0075 1 0.4622 -
0.3759 50 0.3276 -
0.7519 100 0.2741 -
1.1278 150 0.167 -
1.5038 200 0.082 -
1.8797 250 0.0368 -
2.2556 300 0.0406 -
2.6316 350 0.0331 -
3.0075 400 0.0282 -
3.3835 450 0.0144 -
3.7594 500 0.005 -
4.1353 550 0.0036 -
4.5113 600 0.0036 -
4.8872 650 0.0005 -
5.2632 700 0.0003 -
5.6391 750 0.0003 -
6.0150 800 0.0002 -
6.3910 850 0.0003 -
6.7669 900 0.0002 -
7.1429 950 0.0002 -
7.5188 1000 0.0001 -
7.8947 1050 0.0001 -
8.2707 1100 0.0001 -
8.6466 1150 0.0001 -
9.0226 1200 0.0001 -
9.3985 1250 0.0001 -
9.7744 1300 0.0001 -
10.1504 1350 0.0001 -
10.5263 1400 0.0001 -
10.9023 1450 0.0001 -
11.2782 1500 0.0001 -
11.6541 1550 0.0001 -
12.0301 1600 0.0001 -
12.4060 1650 0.0001 -
12.7820 1700 0.0001 -
13.1579 1750 0.0001 -
13.5338 1800 0.0001 -
13.9098 1850 0.0001 -
14.2857 1900 0.0001 -
14.6617 1950 0.0001 -
15.0376 2000 0.0001 -
15.4135 2050 0.0001 -
15.7895 2100 0.0001 -
16.1654 2150 0.0001 -
16.5414 2200 0.0001 -
16.9173 2250 0.0001 -
17.2932 2300 0.0001 -
17.6692 2350 0.0001 -
18.0451 2400 0.0001 -
18.4211 2450 0.0001 -
18.7970 2500 0.0001 -
19.1729 2550 0.0001 -
19.5489 2600 0.0001 -
19.9248 2650 0.0001 -

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.1.0.dev0
  • Sentence Transformers: 3.1.1
  • Transformers: 4.46.1
  • PyTorch: 2.4.0+cu121
  • Datasets: 2.20.0
  • Tokenizers: 0.20.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}