katuni4ka
/

tiny-random-minicpm

Text Generation

Model card Files Files and versions Community

remove flash_attn imports and usage

#1

by katuni4ka - opened Oct 17, 2024

base: refs/heads/main

←

from: refs/pr/1

Discussion Files changed

Files changed (1) hide show

modeling_minicpm.py +6 -6

modeling_minicpm.py CHANGED Viewed

@@ -51,11 +51,11 @@ from transformers.utils.import_utils import is_torch_fx_available
 from .configuration_minicpm import MiniCPMConfig
 import re
-try:
-    from flash_attn import flash_attn_func, flash_attn_varlen_func
-    from flash_attn.bert_padding import index_first_axis, pad_input, unpad_input  # noqa
-except:
-    pass
 # This makes `_prepare_4d_causal_attention_mask` a leaf function in the FX graph.
@@ -755,7 +755,7 @@ class MiniCPMSdpaAttention(MiniCPMAttention):
 MINICPM_ATTENTION_CLASSES = {
     "eager": MiniCPMAttention,
-    "flash_attention_2": MiniCPMFlashAttention2,
     "sdpa": MiniCPMSdpaAttention,
 }

 from .configuration_minicpm import MiniCPMConfig
 import re
+#try:
+#    from flash_attn import flash_attn_func, flash_attn_varlen_func
+#    from flash_attn.bert_padding import index_first_axis, pad_input, unpad_input  # noqa
+#except:
+#    pass
 # This makes `_prepare_4d_causal_attention_mask` a leaf function in the FX graph.
 MINICPM_ATTENTION_CLASSES = {
     "eager": MiniCPMAttention,
+    #"flash_attention_2": MiniCPMFlashAttention2,
     "sdpa": MiniCPMSdpaAttention,
 }