Spaces:

lamhieu
/

lightweight-embeddings

Running

lamhieu commited on 20 days ago

Commit

3b3bd32

1 Parent(s): 3150894

chore: adding `embeddinggemma-300m` model

Files changed (3) hide show

lightweight_embeddings/__init__.py CHANGED Viewed

@@ -182,6 +182,7 @@ def create_main_interface():
         "multilingual-e5-small",
         "multilingual-e5-base",
         "multilingual-e5-large",
         "siglip-base-patch16-256-multilingual",
     ]
@@ -233,7 +234,7 @@ def create_main_interface():
                       -H 'Content-Type: application/json' \\
                       -H 'Authorization: Bearer YOUR_AUTH_KEY' \\
                       -d '{
-                      "model": "snowflake-arctic-embed-l-v2.0",
                       "input": "That is a happy person"
                     }'
                     ```
@@ -245,7 +246,7 @@ def create_main_interface():
                       -H 'accept: application/json' \\
                       -H 'Content-Type: application/json' \\
                       -d '{
-                      "model": "snowflake-arctic-embed-l-v2.0",
                       "input": "That is a happy person"
                     }'
                     ```
@@ -258,7 +259,7 @@ def create_main_interface():
                       -H 'Content-Type: application/json' \\
                       -H 'Authorization: Bearer YOUR_AUTH_KEY' \\
                       -d '{
-                      "model": "snowflake-arctic-embed-l-v2.0",
                       "queries": "That is a happy person",
                       "candidates": [
                         "That is a happy dog",

         "multilingual-e5-small",
         "multilingual-e5-base",
         "multilingual-e5-large",
+        "embeddinggemma-300m",
         "siglip-base-patch16-256-multilingual",
     ]
                       -H 'Content-Type: application/json' \\
                       -H 'Authorization: Bearer YOUR_AUTH_KEY' \\
                       -d '{
+                      "model": "embeddinggemma-300m",
                       "input": "That is a happy person"
                     }'
                     ```
                       -H 'accept: application/json' \\
                       -H 'Content-Type: application/json' \\
                       -d '{
+                      "model": "embeddinggemma-300m",
                       "input": "That is a happy person"
                     }'
                     ```
                       -H 'Content-Type: application/json' \\
                       -H 'Authorization: Bearer YOUR_AUTH_KEY' \\
                       -d '{
+                      "model": "embeddinggemma-300m",
                       "queries": "That is a happy person",
                       "candidates": [
                         "That is a happy dog",

lightweight_embeddings/router.py CHANGED Viewed

@@ -37,7 +37,7 @@ class EmbeddingRequest(BaseModel):
             "Which model ID to use? "
             "Text options: ['multilingual-e5-small', 'multilingual-e5-base', 'multilingual-e5-large', "
             "'snowflake-arctic-embed-l-v2.0', 'paraphrase-multilingual-MiniLM-L12-v2', "
-            "'paraphrase-multilingual-mpnet-base-v2', 'bge-m3']. "
             "Image option: ['siglip-base-patch16-256-multilingual']."
         ),
     )

             "Which model ID to use? "
             "Text options: ['multilingual-e5-small', 'multilingual-e5-base', 'multilingual-e5-large', "
             "'snowflake-arctic-embed-l-v2.0', 'paraphrase-multilingual-MiniLM-L12-v2', "
+            "'paraphrase-multilingual-mpnet-base-v2', 'bge-m3', 'gte-multilingual-base', 'embeddinggemma']. "
             "Image option: ['siglip-base-patch16-256-multilingual']."
         ),
     )

lightweight_embeddings/service.py CHANGED Viewed

@@ -36,6 +36,7 @@ class TextModelType(str, Enum):
     PARAPHRASE_MULTILINGUAL_MPNET_BASE_V2 = "paraphrase-multilingual-mpnet-base-v2"
     BGE_M3 = "bge-m3"
     GTE_MULTILINGUAL_BASE = "gte-multilingual-base"
 class ImageModelType(str, Enum):
@@ -57,6 +58,7 @@ class MaxModelLength(str, Enum):
     PARAPHRASE_MULTILINGUAL_MPNET_BASE_V2 = 128
     BGE_M3 = 8192
     GTE_MULTILINGUAL_BASE = 8192
 class ModelInfo(NamedTuple):
@@ -114,6 +116,10 @@ class ModelConfig:
                 model_id="onnx-community/gte-multilingual-base",
                 onnx_file="onnx/model_quantized.onnx",
             ),
         }
         return text_configs[self.text_model_type]

     PARAPHRASE_MULTILINGUAL_MPNET_BASE_V2 = "paraphrase-multilingual-mpnet-base-v2"
     BGE_M3 = "bge-m3"
     GTE_MULTILINGUAL_BASE = "gte-multilingual-base"
+    EMBEDDINGGEMMA300M = "embeddinggemma-300m"
 class ImageModelType(str, Enum):
     PARAPHRASE_MULTILINGUAL_MPNET_BASE_V2 = 128
     BGE_M3 = 8192
     GTE_MULTILINGUAL_BASE = 8192
+    EMBEDDINGGEMMA300M = 2048
 class ModelInfo(NamedTuple):
                 model_id="onnx-community/gte-multilingual-base",
                 onnx_file="onnx/model_quantized.onnx",
             ),
+            TextModelType.EMBEDDINGGEMMA300M: ModelInfo(
+                model_id="onnx-community/embeddinggemma-300m-ONNX",
+                onnx_file="onnx/model_quantized.onnx",
+            ),
         }
         return text_configs[self.text_model_type]