internlm
/

internlm-chat-7b

Text Generation

feature-extraction

Model card Files Files and versions Community

x54-729 commited on Jan 19, 2024

Commit

281d770

·

1 Parent(s): 6e1fdc1

remove unnecessary attention_drop

Files changed (1) hide show

modeling_internlm.py +1 -3

modeling_internlm.py CHANGED Viewed

@@ -417,10 +417,8 @@ class InternLMFlashAttention2(InternLMAttention):
         key_states = key_states.transpose(1, 2)
         value_states = value_states.transpose(1, 2)
-        dropout_rate = 0.0 if not self.training else self.attention_dropout
         attn_output = self._flash_attention_forward(
-            query_states, key_states, value_states, attention_mask, q_len, dropout=dropout_rate
         )
         attn_output = attn_output.reshape(bsz, q_len, self.hidden_size).contiguous()
         attn_output = self.o_proj(attn_output)

         key_states = key_states.transpose(1, 2)
         value_states = value_states.transpose(1, 2)
         attn_output = self._flash_attention_forward(
+            query_states, key_states, value_states, attention_mask, q_len
         )
         attn_output = attn_output.reshape(bsz, q_len, self.hidden_size).contiguous()
         attn_output = self.o_proj(attn_output)