Upload RankingPrompterForPreTraining

Files changed (3) hide show

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "D://huggingface_model/RankingPrompterForPreTraining-small",
   "architectures": [
     "RankingPrompterForPreTraining"
   ],
@@ -22,6 +22,7 @@
   "layer_norm_epsilon": 1e-06,
   "max_new_tokens": 64,
   "model_type": "umt5",
   "num_decoder_layers": 8,
   "num_heads": 6,
   "num_layers": 8,
@@ -32,7 +33,7 @@
   "tie_word_embeddings": false,
   "tokenizer_class": "T5Tokenizer",
   "torch_dtype": "float32",
-  "transformers_version": "4.32.0",
   "use_cache": true,
   "vocab_size": 256384
 }

 {
+  "_name_or_path": "..\\..\\..\\huggingface_model\\RankingPrompterForPreTraining-small\\",
   "architectures": [
     "RankingPrompterForPreTraining"
   ],
   "layer_norm_epsilon": 1e-06,
   "max_new_tokens": 64,
   "model_type": "umt5",
+  "num_answer_query": 128,
   "num_decoder_layers": 8,
   "num_heads": 6,
   "num_layers": 8,
   "tie_word_embeddings": false,
   "tokenizer_class": "T5Tokenizer",
   "torch_dtype": "float32",
+  "transformers_version": "4.32.1",
   "use_cache": true,
   "vocab_size": 256384
 }

configuration_rankingprompter.py CHANGED Viewed

@@ -14,6 +14,7 @@ class RankingPrompterConfig(PretrainedConfig):
         num_heads=6,
         relative_attention_num_buckets=32,
         relative_attention_max_distance=128,
         dropout_rate=0.1,
         layer_norm_epsilon=1e-6,
         initializer_factor=1.0,
@@ -48,6 +49,7 @@ class RankingPrompterConfig(PretrainedConfig):
         self.num_heads = num_heads
         self.relative_attention_num_buckets = relative_attention_num_buckets
         self.relative_attention_max_distance = relative_attention_max_distance
         self.dropout_rate = dropout_rate
         self.classifier_dropout = classifier_dropout
         self.layer_norm_epsilon = layer_norm_epsilon

         num_heads=6,
         relative_attention_num_buckets=32,
         relative_attention_max_distance=128,
+        num_answer_query=128,
         dropout_rate=0.1,
         layer_norm_epsilon=1e-6,
         initializer_factor=1.0,
         self.num_heads = num_heads
         self.relative_attention_num_buckets = relative_attention_num_buckets
         self.relative_attention_max_distance = relative_attention_max_distance
+        self.num_answer_query = num_answer_query
         self.dropout_rate = dropout_rate
         self.classifier_dropout = classifier_dropout
         self.layer_norm_epsilon = layer_norm_epsilon

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b90ef8ceeeffc7b033e65dfc28f3adf8d82cbdad204df0677ae0c0f45f4f0c24
 size 701403585

 version https://git-lfs.github.com/spec/v1
+oid sha256:aab6831f798bedd1b458b5cd3b77c941d58564bb70941bcc2aed16ad8cdee75d
 size 701403585