Spaces:

diabolic6045
/

japanese-stable-vlm-demo

Sleeping

diabolic6045 commited on Jun 7, 2024

Commit

733432c

verified ·

1 Parent(s): b13a765

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,3 +1,13 @@
 # Load the model and tokenizer
 device = "cuda" if torch.cuda.is_available() else "cpu"
 model = AutoModelForVision2Seq.from_pretrained("stabilityai/japanese-stable-vlm", trust_remote_code=True, device_map='auto')
@@ -32,6 +42,7 @@ def build_prompt(task="caption", input=None, sep="\n\n### "):
     return p
 # Define the function to generate text from the image and prompt
 def generate_text(image, task, input_text=None):
     prompt = build_prompt(task=task, input=input_text)
     inputs = processor(images=image, return_tensors="pt")

+import gradio as gr
+import torch
+from transformers import AutoTokenizer, AutoModelForVision2Seq, AutoImageProcessor
+from PIL import Image
+import spaces
+import os
+from huggingface_hub import login
+login(os.environ["HF_KEY"])
 # Load the model and tokenizer
 device = "cuda" if torch.cuda.is_available() else "cpu"
 model = AutoModelForVision2Seq.from_pretrained("stabilityai/japanese-stable-vlm", trust_remote_code=True, device_map='auto')
     return p
 # Define the function to generate text from the image and prompt
+@spaces.GPU(duration=120)
 def generate_text(image, task, input_text=None):
     prompt = build_prompt(task=task, input=input_text)
     inputs = processor(images=image, return_tensors="pt")