Making File Compatible With Environments That Do Not Have Flash Attention (#26)

Browse files

- Making File Compatible With Environments That Do Not Have Flash Attention (322f67256f88db7cab21c500c72a85858b0ae07e)

Co-authored-by: Andrew Qian <andrewqian123@users.noreply.huggingface.co>

Files changed (1) hide show

modeling_qwen.py +6 -4

modeling_qwen.py CHANGED Viewed

@@ -46,11 +46,13 @@ from transformers.utils import (
 )
-if is_flash_attn_2_available():
-    from flash_attn import flash_attn_func, flash_attn_varlen_func
-    from flash_attn.bert_padding import index_first_axis, pad_input, unpad_input  # noqa
-    _flash_supports_window_size = "window_size" in list(inspect.signature(flash_attn_func).parameters)
 logger = logging.get_logger(__name__)

 )
+# if is_flash_attn_2_available():
+#     from flash_attn import flash_attn_func, flash_attn_varlen_func
+#     from flash_attn.bert_padding import index_first_axis, pad_input, unpad_input  # noqa
+#     _flash_supports_window_size = "window_size" in list(inspect.signature(flash_attn_func).parameters)
+# REMOVE THE CODE ABOVE SHOULD ALLOW FOR RUNNING OF THIS MODEL WITHOUT FLASH ATTENTION SUPPORT.
 logger = logging.get_logger(__name__)