Alibaba-NLP
/

gte-Qwen2-1.5B-instruct

Sentence Similarity

sentence-transformers

text-generation

text-embeddings-inference

Inference Endpoints

Model card Files Files and versions Community

undo PR 20

#22

by michaelfeil - opened Nov 12

base: refs/heads/main

←

from: refs/pr/22

Discussion Files changed

Files changed (3) hide show

config.json +2 -2
sentence_bert_config.json +1 -1
tokenizer_config.json +1 -1

config.json CHANGED Viewed

@@ -14,7 +14,7 @@
   "hidden_size": 1536,
   "initializer_range": 0.02,
   "intermediate_size": 8960,
-  "max_position_embeddings": 2048,
   "max_window_layers": 21,
   "model_type": "qwen2",
   "num_attention_heads": 12,
@@ -22,7 +22,7 @@
   "num_key_value_heads": 2,
   "rms_norm_eps": 1e-06,
   "rope_theta": 1000000.0,
-  "sliding_window": 2048,
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
   "transformers_version": "4.41.2",

   "hidden_size": 1536,
   "initializer_range": 0.02,
   "intermediate_size": 8960,
+  "max_position_embeddings": 131072,
   "max_window_layers": 21,
   "model_type": "qwen2",
   "num_attention_heads": 12,
   "num_key_value_heads": 2,
   "rms_norm_eps": 1e-06,
   "rope_theta": 1000000.0,
+  "sliding_window": 131072,
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
   "transformers_version": "4.41.2",

sentence_bert_config.json CHANGED Viewed

@@ -1,4 +1,4 @@
 {
-  "max_seq_length": 2048,
   "do_lower_case": false
 }

 {
+  "max_seq_length": 32768,
   "do_lower_case": false
 }

tokenizer_config.json CHANGED Viewed

@@ -39,7 +39,7 @@
   "clean_up_tokenization_spaces": false,
   "eos_token": "<|endoftext|>",
   "errors": "replace",
-  "model_max_length": 2048,
   "pad_token": "<|endoftext|>",
   "split_special_tokens": false,
   "tokenizer_class": "Qwen2Tokenizer",

   "clean_up_tokenization_spaces": false,
   "eos_token": "<|endoftext|>",
   "errors": "replace",
+  "model_max_length": 32768,
   "pad_token": "<|endoftext|>",
   "split_special_tokens": false,
   "tokenizer_class": "Qwen2Tokenizer",