qhduan
/

aquila-7b

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qhduan commited on Jun 14, 2023

Commit

f41f02c

•

1 Parent(s): 347afdc

Upload 2 files

Files changed (2) hide show

config.json +2 -2
modeling_aquila.py +7 -5

config.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-  "_name_or_path": "../../models/aquila-7b-llama/",
   "architectures": [
     "AquilaForCausalLM"
   ],
   "auto_map": {
     "AutoConfig": "modeling_aquila.LlamaConfig",
     "AutoModel": "modeling_aquila.LlamaModel",
-    "AutoModelForCausalLM": "modeling_aquila.AquilaForCausalLM"
   },
   "bos_token_id": 1,
   "eos_token_id": 2,

 {
+  "_name_or_path": "qhduan/aquila-7b",
   "architectures": [
     "AquilaForCausalLM"
   ],
   "auto_map": {
     "AutoConfig": "modeling_aquila.LlamaConfig",
     "AutoModel": "modeling_aquila.LlamaModel",
+    "AutoModelForCausalLM": "modeling_aquila.LlamaForCausalLM"
   },
   "bos_token_id": 1,
   "eos_token_id": 2,

modeling_aquila.py CHANGED Viewed

@@ -250,12 +250,14 @@ class LlamaAttention(nn.Module):
         key_states = self.k_proj(hidden_states).view(bsz, q_len, self.num_heads, self.head_dim)
         value_states = self.v_proj(hidden_states).view(bsz, q_len, self.num_heads, self.head_dim).transpose(1, 2)
         self.freqs_cis = self.freqs_cis.to(hidden_states.device)
-        query_states, key_states = apply_rotary_pos_emb(query_states, key_states, freqs_cis=self.freqs_cis[:query_states.shape[1]])
-        query_states = query_states.transpose(1, 2)
-        key_states = key_states.transpose(1, 2)
-        kv_seq_len = key_states.shape[-2]
         if past_key_value is not None:
             kv_seq_len += past_key_value[0].shape[-2]
         # query_states = self.q_proj(hidden_states).view(bsz, q_len, self.num_heads, self.head_dim).transpose(1, 2)
         # key_states = self.k_proj(hidden_states).view(bsz, q_len, self.num_heads, self.head_dim).transpose(1, 2)
@@ -695,7 +697,7 @@ class LlamaModel(LlamaPreTrainedModel):
         )
-class AquilaForCausalLM(LlamaPreTrainedModel):
     def __init__(self, config):
         super().__init__(config)
         self.model = LlamaModel(config)

         key_states = self.k_proj(hidden_states).view(bsz, q_len, self.num_heads, self.head_dim)
         value_states = self.v_proj(hidden_states).view(bsz, q_len, self.num_heads, self.head_dim).transpose(1, 2)
         self.freqs_cis = self.freqs_cis.to(hidden_states.device)
+        kv_seq_len = key_states.shape[-3]
         if past_key_value is not None:
             kv_seq_len += past_key_value[0].shape[-2]
+        query_states, key_states = apply_rotary_pos_emb(
+            query_states, key_states, freqs_cis=self.freqs_cis[kv_seq_len-query_states.shape[1]:kv_seq_len]
+        )
+        query_states = query_states.transpose(1, 2)
+        key_states = key_states.transpose(1, 2)
         # query_states = self.q_proj(hidden_states).view(bsz, q_len, self.num_heads, self.head_dim).transpose(1, 2)
         # key_states = self.k_proj(hidden_states).view(bsz, q_len, self.num_heads, self.head_dim).transpose(1, 2)
         )
+class LlamaForCausalLM(LlamaPreTrainedModel):
     def __init__(self, config):
         super().__init__(config)
         self.model = LlamaModel(config)