yaniseuranova
/

setfit-rag-hybrid-search-query-router

@@ -48,7 +48,7 @@ The model has been trained using an efficient few-shot learning technique that i
 - **Sentence Transformer body:** [sentence-transformers/paraphrase-mpnet-base-v2](https://huggingface.co/sentence-transformers/paraphrase-mpnet-base-v2)
 - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
 - **Maximum Sequence Length:** 512 tokens
-- **Number of Classes:** 6 classes
 <!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
 <!-- - **Language:** Unknown -->
 <!-- - **License:** Unknown -->
@@ -60,14 +60,12 @@ The model has been trained using an efficient few-shot learning technique that i
 - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
 ### Model Labels
-| Label                 | Examples                                                                                                                                                                                                                            |
-|:----------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
-| very_semantic_queries | <ul><li>'Quels sont les principes fondamentaux du corps humain?'</li><li>"Comment améliorer l'efficacité énergétique dans les bâtiments?"</li><li>'Combien de calories dans une pomme?'</li></ul>                                   |
-| very_lexical          | <ul><li>"Quelle est la capitale de l'Italie?"</li><li>"Qui est l'auteur de '1984'?"</li><li>'What is the current unemployment rate in France?'</li></ul>                                                                            |
-| semantic_queries      | <ul><li>"Quels sont les avantages de l'apprentissage machine dans le secteur de la santé?"</li><li>'Comment puis-je optimiser les performances de mon site web?'</li><li>'What are the main challenges in cybersecurity?'</li></ul> |
-| lexical               | <ul><li>'Quel est le numéro de téléphone du service client ou du customer suport?'</li><li>'How can I reset my user password?'</li><li>'What is the zip code for New York?'</li></ul>                                               |
-| lexical_queries       | <ul><li>'Comment fonctionne la blockchain?'</li></ul>                                                                                                                                                                               |
-| lexical_query         | <ul><li>'Who won the Nobel Peace Prize in 2021?'</li></ul>                                                                                                                                                                          |
 ## Evaluation
@@ -128,12 +126,12 @@ preds = model("Comment rédiger un bon CV?")
 |:-------------|:----|:-------|:----|
 | Word count   | 4   | 7.1667 | 13  |
-| Label                 | Training Sample Count |
-|:----------------------|:----------------------|
-| very_semantic_queries | 13                    |
-| semantic_queries      | 21                    |
-| lexical_queries       | 1                     |
-| very_lexical          | 15                    |
 ### Training Hyperparameters
 - batch_size: (16, 16)
@@ -156,23 +154,23 @@ preds = model("Comment rédiger un bon CV?")
 | Epoch   | Step    | Training Loss | Validation Loss |
 |:-------:|:-------:|:-------------:|:---------------:|
 | 0.0060  | 1       | 0.3581        | -               |
-| 0.2976  | 50      | 0.2142        | -               |
-| 0.5952  | 100     | 0.1448        | -               |
-| 0.8929  | 150     | 0.0094        | -               |
-| 1.0     | 168     | -             | 0.0034          |
-| 1.1905  | 200     | 0.0014        | -               |
-| 1.4881  | 250     | 0.0009        | -               |
-| 1.7857  | 300     | 0.0007        | -               |
-| 2.0     | 336     | -             | 0.0003          |
-| 2.0833  | 350     | 0.0012        | -               |
-| 2.3810  | 400     | 0.0006        | -               |
-| 2.6786  | 450     | 0.0004        | -               |
-| 2.9762  | 500     | 0.0005        | -               |
-| 3.0     | 504     | -             | 0.0003          |
-| 3.2738  | 550     | 0.0006        | -               |
-| 3.5714  | 600     | 0.0004        | -               |
-| 3.8690  | 650     | 0.0003        | -               |
-| **4.0** | **672** | **-**         | **0.0002**      |
 * The bold row denotes the saved checkpoint.
 ### Framework Versions

 - **Sentence Transformer body:** [sentence-transformers/paraphrase-mpnet-base-v2](https://huggingface.co/sentence-transformers/paraphrase-mpnet-base-v2)
 - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
 - **Maximum Sequence Length:** 512 tokens
+- **Number of Classes:** 4 classes
 <!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
 <!-- - **Language:** Unknown -->
 <!-- - **License:** Unknown -->
 - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
 ### Model Labels
+| Label         | Examples                                                                                                                                                                                                                            |
+|:--------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
+| very_semantic | <ul><li>'Quels sont les principes fondamentaux du corps humain?'</li><li>"Comment améliorer l'efficacité énergétique dans les bâtiments?"</li><li>'Combien de calories dans une pomme?'</li></ul>                                   |
+| very_lexical  | <ul><li>"Quelle est la capitale de l'Italie?"</li><li>"Qui est l'auteur de '1984'?"</li><li>'What is the current unemployment rate in France?'</li></ul>                                                                            |
+| semantic      | <ul><li>"Quels sont les avantages de l'apprentissage machine dans le secteur de la santé?"</li><li>'Comment puis-je optimiser les performances de mon site web?'</li><li>'What are the main challenges in cybersecurity?'</li></ul> |
+| lexical       | <ul><li>'Quel est le numéro de téléphone du service client ou du customer suport?'</li><li>'Comment fonctionne la blockchain?'</li><li>'How can I reset my user password?'</li></ul>                                                |
 ## Evaluation
 |:-------------|:----|:-------|:----|
 | Word count   | 4   | 7.1667 | 13  |
+| Label         | Training Sample Count |
+|:--------------|:----------------------|
+| very_semantic | 13                    |
+| semantic      | 21                    |
+| lexical       | 11                    |
+| very_lexical  | 15                    |
 ### Training Hyperparameters
 - batch_size: (16, 16)
 | Epoch   | Step    | Training Loss | Validation Loss |
 |:-------:|:-------:|:-------------:|:---------------:|
 | 0.0060  | 1       | 0.3581        | -               |
+| 0.3012  | 50      | 0.2063        | -               |
+| 0.6024  | 100     | 0.1283        | -               |
+| 0.9036  | 150     | 0.0083        | -               |
+| 1.0     | 166     | -             | 0.003           |
+| 1.2048  | 200     | 0.0014        | -               |
+| 1.5060  | 250     | 0.0008        | -               |
+| 1.8072  | 300     | 0.0006        | -               |
+| 2.0     | 332     | -             | 0.0006          |
+| 2.1084  | 350     | 0.0004        | -               |
+| 2.4096  | 400     | 0.0003        | -               |
+| 2.7108  | 450     | 0.0005        | -               |
+| 3.0     | 498     | -             | 0.0004          |
+| 3.0120  | 500     | 0.0003        | -               |
+| 3.3133  | 550     | 0.0005        | -               |
+| 3.6145  | 600     | 0.0003        | -               |
+| 3.9157  | 650     | 0.0003        | -               |
+| **4.0** | **664** | **-**         | **0.0003**      |
 * The bold row denotes the saved checkpoint.
 ### Framework Versions

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "checkpoints/step_672",
   "architectures": [
     "MPNetModel"
   ],

 {
+  "_name_or_path": "checkpoints/step_664",
   "architectures": [
     "MPNetModel"
   ],

config_setfit.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "labels": [
-    "very_semantic_queries",
-    "semantic_queries",
-    "lexical_queries",
     "very_lexical"
   ],
   "normalize_embeddings": false

 {
   "labels": [
+    "very_semantic",
+    "semantic",
+    "lexical",
     "very_lexical"
   ],
   "normalize_embeddings": false

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b7176f55cb144d7f23531b94ed150020322801f7e4507f17192447bbd8d7a497
 size 437967672

 version https://git-lfs.github.com/spec/v1
+oid sha256:1b53398a5e1768704556a85ff27c1d05e5391646db87372f075a3bc0d2145a0b
 size 437967672

model_head.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:70861c361e27e864a51a592de6f9d6069d09dd09a1605f3a871b8061625a56d1
-size 38263

 version https://git-lfs.github.com/spec/v1
+oid sha256:c8319b40498ce63d8e5868820a4e5de714d7af5a0e73cb8705a3d00f2c7f6ee4
+size 25655