Spaces:

HuggingFaceM4
/

ai_raven

Runtime error

VictorSanh commited on Mar 10

Commit

7ea3311

•

1 Parent(s): ba3540b

flash attn

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,6 +7,7 @@ import imagehash
 import cv2
 import os
 import spaces
 from transformers import AutoProcessor, AutoModelForCausalLM
 from transformers.image_utils import to_numpy_array, PILImageResampling, ChannelDimension
@@ -19,6 +20,9 @@ from collections import Counter
 from datasets import load_dataset, concatenate_datasets
 DEVICE = torch.device("cuda")
 PROCESSOR = AutoProcessor.from_pretrained(
     "HuggingFaceM4/idefics2_raven_finetuned",

 import cv2
 import os
 import spaces
+import subprocess
 from transformers import AutoProcessor, AutoModelForCausalLM
 from transformers.image_utils import to_numpy_array, PILImageResampling, ChannelDimension
 from datasets import load_dataset, concatenate_datasets
+subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
 DEVICE = torch.device("cuda")
 PROCESSOR = AutoProcessor.from_pretrained(
     "HuggingFaceM4/idefics2_raven_finetuned",