Add SetFit model

Browse files

Files changed (5) hide show

README.md +95 -80
config.json +1 -1
model.safetensors +1 -1
model_head.pkl +1 -1
tokenizer_config.json +0 -7

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ widget:
 - text: 'Wie entsteht überhaupt eine Ausstellung und in diesem Fall: eine, die weniger
     auf den Wert des Originals als die Kreativität ihrer Besucher setzt?'
 pipeline_tag: text-classification
-inference: true
 ---
 # SetFit with sentence-transformers/paraphrase-mpnet-base-v2
@@ -126,85 +126,100 @@ preds = model("Grundlagen der Fachdidaktik Pädagogik")
 ### Training Results
 | Epoch  | Step | Training Loss | Validation Loss |
 |:------:|:----:|:-------------:|:---------------:|
-| 0.0003 | 1    | 0.4461        | -               |
-| 0.0127 | 50   | 0.517         | -               |
-| 0.0254 | 100  | 0.3178        | -               |
-| 0.0380 | 150  | 0.0591        | -               |
-| 0.0507 | 200  | 0.0278        | -               |
-| 0.0634 | 250  | 0.0319        | -               |
-| 0.0761 | 300  | 0.0175        | -               |
-| 0.0888 | 350  | 0.0148        | -               |
-| 0.1014 | 400  | 0.0181        | -               |
-| 0.1141 | 450  | 0.0116        | -               |
-| 0.1268 | 500  | 0.0297        | -               |
-| 0.1395 | 550  | 0.0164        | -               |
-| 0.1522 | 600  | 0.0152        | -               |
-| 0.1648 | 650  | 0.0133        | -               |
-| 0.1775 | 700  | 0.0156        | -               |
-| 0.1902 | 750  | 0.0102        | -               |
-| 0.2029 | 800  | 0.0096        | -               |
-| 0.2156 | 850  | 0.0094        | -               |
-| 0.2283 | 900  | 0.0077        | -               |
-| 0.2409 | 950  | 0.0072        | -               |
-| 0.2536 | 1000 | 0.006         | -               |
-| 0.2663 | 1050 | 0.0098        | -               |
-| 0.2790 | 1100 | 0.0108        | -               |
-| 0.2917 | 1150 | 0.0078        | -               |
-| 0.3043 | 1200 | 0.0089        | -               |
-| 0.3170 | 1250 | 0.0059        | -               |
-| 0.3297 | 1300 | 0.0067        | -               |
-| 0.3424 | 1350 | 0.0136        | -               |
-| 0.3551 | 1400 | 0.004         | -               |
-| 0.3677 | 1450 | 0.0041        | -               |
-| 0.3804 | 1500 | 0.0081        | -               |
-| 0.3931 | 1550 | 0.0034        | -               |
-| 0.4058 | 1600 | 0.0056        | -               |
-| 0.4185 | 1650 | 0.0045        | -               |
-| 0.4311 | 1700 | 0.0035        | -               |
-| 0.4438 | 1750 | 0.0044        | -               |
-| 0.4565 | 1800 | 0.0042        | -               |
-| 0.4692 | 1850 | 0.0061        | -               |
-| 0.4819 | 1900 | 0.0073        | -               |
-| 0.4945 | 1950 | 0.0056        | -               |
-| 0.5072 | 2000 | 0.0048        | -               |
-| 0.5199 | 2050 | 0.0023        | -               |
-| 0.5326 | 2100 | 0.0036        | -               |
-| 0.5453 | 2150 | 0.0037        | -               |
-| 0.5580 | 2200 | 0.0048        | -               |
-| 0.5706 | 2250 | 0.0042        | -               |
-| 0.5833 | 2300 | 0.0065        | -               |
-| 0.5960 | 2350 | 0.0046        | -               |
-| 0.6087 | 2400 | 0.0056        | -               |
-| 0.6214 | 2450 | 0.0029        | -               |
-| 0.6340 | 2500 | 0.004         | -               |
-| 0.6467 | 2550 | 0.0019        | -               |
-| 0.6594 | 2600 | 0.0022        | -               |
-| 0.6721 | 2650 | 0.0021        | -               |
-| 0.6848 | 2700 | 0.0036        | -               |
-| 0.6974 | 2750 | 0.0013        | -               |
-| 0.7101 | 2800 | 0.001         | -               |
-| 0.7228 | 2850 | 0.004         | -               |
-| 0.7355 | 2900 | 0.0025        | -               |
-| 0.7482 | 2950 | 0.0012        | -               |
-| 0.7608 | 3000 | 0.0011        | -               |
-| 0.7735 | 3050 | 0.001         | -               |
-| 0.7862 | 3100 | 0.0008        | -               |
-| 0.7989 | 3150 | 0.0014        | -               |
-| 0.8116 | 3200 | 0.0041        | -               |
-| 0.8242 | 3250 | 0.0019        | -               |
-| 0.8369 | 3300 | 0.0025        | -               |
-| 0.8496 | 3350 | 0.0013        | -               |
-| 0.8623 | 3400 | 0.0017        | -               |
-| 0.8750 | 3450 | 0.0021        | -               |
-| 0.8876 | 3500 | 0.0013        | -               |
-| 0.9003 | 3550 | 0.0016        | -               |
-| 0.9130 | 3600 | 0.0041        | -               |
-| 0.9257 | 3650 | 0.0037        | -               |
-| 0.9384 | 3700 | 0.0012        | -               |
-| 0.9511 | 3750 | 0.0022        | -               |
-| 0.9637 | 3800 | 0.003         | -               |
-| 0.9764 | 3850 | 0.0026        | -               |
-| 0.9891 | 3900 | 0.0027        | -               |
 ### Framework Versions
 - Python: 3.12.3

 - text: 'Wie entsteht überhaupt eine Ausstellung und in diesem Fall: eine, die weniger
     auf den Wert des Originals als die Kreativität ihrer Besucher setzt?'
 pipeline_tag: text-classification
+inference: false
 ---
 # SetFit with sentence-transformers/paraphrase-mpnet-base-v2
 ### Training Results
 | Epoch  | Step | Training Loss | Validation Loss |
 |:------:|:----:|:-------------:|:---------------:|
+| 0.0003 | 1    | 0.2958        | -               |
+| 0.0127 | 50   | 0.2471        | -               |
+| 0.0254 | 100  | 0.1602        | -               |
+| 0.0380 | 150  | 0.0884        | -               |
+| 0.0507 | 200  | 0.056         | -               |
+| 0.0634 | 250  | 0.0465        | -               |
+| 0.0761 | 300  | 0.0431        | -               |
+| 0.0888 | 350  | 0.0285        | -               |
+| 0.1014 | 400  | 0.0224        | -               |
+| 0.1141 | 450  | 0.0281        | -               |
+| 0.1268 | 500  | 0.024         | -               |
+| 0.1395 | 550  | 0.0271        | -               |
+| 0.1522 | 600  | 0.0223        | -               |
+| 0.1648 | 650  | 0.0314        | -               |
+| 0.1775 | 700  | 0.0213        | -               |
+| 0.0003 | 1    | 0.0019        | -               |
+| 0.0127 | 50   | 0.0184        | -               |
+| 0.0254 | 100  | 0.0232        | -               |
+| 0.0380 | 150  | 0.0138        | -               |
+| 0.0507 | 200  | 0.0165        | -               |
+| 0.0634 | 250  | 0.0179        | -               |
+| 0.0761 | 300  | 0.0133        | -               |
+| 0.0888 | 350  | 0.0117        | -               |
+| 0.1014 | 400  | 0.0093        | -               |
+| 0.1141 | 450  | 0.0091        | -               |
+| 0.1268 | 500  | 0.0153        | -               |
+| 0.1395 | 550  | 0.0194        | -               |
+| 0.1522 | 600  | 0.0129        | -               |
+| 0.1648 | 650  | 0.0138        | -               |
+| 0.1775 | 700  | 0.0166        | -               |
+| 0.1902 | 750  | 0.0169        | -               |
+| 0.2029 | 800  | 0.0202        | -               |
+| 0.2156 | 850  | 0.0186        | -               |
+| 0.2283 | 900  | 0.0128        | -               |
+| 0.2409 | 950  | 0.0206        | -               |
+| 0.2536 | 1000 | 0.0201        | -               |
+| 0.2663 | 1050 | 0.0152        | -               |
+| 0.2790 | 1100 | 0.0178        | -               |
+| 0.2917 | 1150 | 0.0166        | -               |
+| 0.3043 | 1200 | 0.0139        | -               |
+| 0.3170 | 1250 | 0.0098        | -               |
+| 0.3297 | 1300 | 0.0092        | -               |
+| 0.3424 | 1350 | 0.0118        | -               |
+| 0.3551 | 1400 | 0.0173        | -               |
+| 0.3677 | 1450 | 0.0131        | -               |
+| 0.3804 | 1500 | 0.0151        | -               |
+| 0.3931 | 1550 | 0.0127        | -               |
+| 0.4058 | 1600 | 0.0142        | -               |
+| 0.4185 | 1650 | 0.0156        | -               |
+| 0.4311 | 1700 | 0.0068        | -               |
+| 0.4438 | 1750 | 0.0136        | -               |
+| 0.4565 | 1800 | 0.0124        | -               |
+| 0.4692 | 1850 | 0.0104        | -               |
+| 0.4819 | 1900 | 0.0159        | -               |
+| 0.4945 | 1950 | 0.0109        | -               |
+| 0.5072 | 2000 | 0.011         | -               |
+| 0.5199 | 2050 | 0.0123        | -               |
+| 0.5326 | 2100 | 0.0087        | -               |
+| 0.5453 | 2150 | 0.0081        | -               |
+| 0.5580 | 2200 | 0.0072        | -               |
+| 0.5706 | 2250 | 0.0099        | -               |
+| 0.5833 | 2300 | 0.0137        | -               |
+| 0.5960 | 2350 | 0.0094        | -               |
+| 0.6087 | 2400 | 0.0165        | -               |
+| 0.6214 | 2450 | 0.0066        | -               |
+| 0.6340 | 2500 | 0.0123        | -               |
+| 0.6467 | 2550 | 0.0087        | -               |
+| 0.6594 | 2600 | 0.0101        | -               |
+| 0.6721 | 2650 | 0.0099        | -               |
+| 0.6848 | 2700 | 0.0157        | -               |
+| 0.6974 | 2750 | 0.0066        | -               |
+| 0.7101 | 2800 | 0.0098        | -               |
+| 0.7228 | 2850 | 0.0102        | -               |
+| 0.7355 | 2900 | 0.0112        | -               |
+| 0.7482 | 2950 | 0.0137        | -               |
+| 0.7608 | 3000 | 0.0096        | -               |
+| 0.7735 | 3050 | 0.013         | -               |
+| 0.7862 | 3100 | 0.0116        | -               |
+| 0.7989 | 3150 | 0.0102        | -               |
+| 0.8116 | 3200 | 0.0115        | -               |
+| 0.8242 | 3250 | 0.0133        | -               |
+| 0.8369 | 3300 | 0.0065        | -               |
+| 0.8496 | 3350 | 0.0117        | -               |
+| 0.8623 | 3400 | 0.0078        | -               |
+| 0.8750 | 3450 | 0.0099        | -               |
+| 0.8876 | 3500 | 0.0095        | -               |
+| 0.9003 | 3550 | 0.0119        | -               |
+| 0.9130 | 3600 | 0.008         | -               |
+| 0.9257 | 3650 | 0.0107        | -               |
+| 0.9384 | 3700 | 0.0066        | -               |
+| 0.9511 | 3750 | 0.006         | -               |
+| 0.9637 | 3800 | 0.0081        | -               |
+| 0.9764 | 3850 | 0.0076        | -               |
+| 0.9891 | 3900 | 0.009         | -               |
 ### Framework Versions
 - Python: 3.12.3

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "Chernoffface/fs-setfit-multilable-model",
   "architectures": [
     "MPNetModel"
   ],

 {
+  "_name_or_path": "sentence-transformers/paraphrase-mpnet-base-v2",
   "architectures": [
     "MPNetModel"
   ],

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65022b93fb8307ebd460706dcd805a1ab736861dbc14bf5141645e90c9bda438
 size 437967672

 version https://git-lfs.github.com/spec/v1
+oid sha256:0f338f26460ce0761f855f083d0bdf7e4e8c6b106226f0182145797104f1a337
 size 437967672

model_head.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:992c2c2037ed4adda2442fde733a224bcb67198bba0ccd7772b98bdf9a2d187f
 size 72196

 version https://git-lfs.github.com/spec/v1
+oid sha256:1f3e1e8cc0d29abd675621896fdc71e39f1c728b5ca22eeb010daf553964b406
 size 72196

tokenizer_config.json CHANGED Viewed

@@ -48,19 +48,12 @@
   "do_lower_case": true,
   "eos_token": "</s>",
   "mask_token": "<mask>",
-  "max_length": 512,
   "model_max_length": 512,
   "never_split": null,
-  "pad_to_multiple_of": null,
   "pad_token": "<pad>",
-  "pad_token_type_id": 0,
-  "padding_side": "right",
   "sep_token": "</s>",
-  "stride": 0,
   "strip_accents": null,
   "tokenize_chinese_chars": true,
   "tokenizer_class": "MPNetTokenizer",
-  "truncation_side": "right",
-  "truncation_strategy": "longest_first",
   "unk_token": "[UNK]"
 }

   "do_lower_case": true,
   "eos_token": "</s>",
   "mask_token": "<mask>",
   "model_max_length": 512,
   "never_split": null,
   "pad_token": "<pad>",
   "sep_token": "</s>",
   "strip_accents": null,
   "tokenize_chinese_chars": true,
   "tokenizer_class": "MPNetTokenizer",
   "unk_token": "[UNK]"
 }