THUDM
/

cogagent-chat-hf

Text Generation

Model card Files Files and versions Community

qingsonglv commited on Dec 18, 2023

Commit

7201d1c

·

1 Parent(s): f1ed53e

Update modeling_cogagent.py

Files changed (1) hide show

modeling_cogagent.py +0 -2

modeling_cogagent.py CHANGED Viewed

@@ -284,8 +284,6 @@ class CrossAttention(nn.Module):
         self.cross_head_dim = self.cross_compute_hidden_size // self.num_heads
         self.max_position_embeddings = config.max_position_embeddings
-        # self.rotary_emb = RotaryEmbedding(self.hidden_size // self.num_heads)
-        self.rotary_emb = FastRotaryEmbedding(dim=self.head_dim, pos_idx_in_fp32=False)
         self.query = nn.Linear(self.hidden_size, self.cross_compute_hidden_size, bias=False)
         self.key_value = nn.Linear(self.cross_hidden_size, self.cross_compute_hidden_size * 2, bias=False)
         self.dense = nn.Linear(self.cross_compute_hidden_size, self.hidden_size, bias=False)

         self.cross_head_dim = self.cross_compute_hidden_size // self.num_heads
         self.max_position_embeddings = config.max_position_embeddings
         self.query = nn.Linear(self.hidden_size, self.cross_compute_hidden_size, bias=False)
         self.key_value = nn.Linear(self.cross_hidden_size, self.cross_compute_hidden_size * 2, bias=False)
         self.dense = nn.Linear(self.cross_compute_hidden_size, self.hidden_size, bias=False)