turing-motors
/

heron-chat-git-Llama-2-7b-v0

text-generation

image-captioning

Model card Files Files and versions Community

Inoichan commited on Sep 11, 2023

Commit

16d276d

•

1 Parent(s): ff9b425

Update README.md

Files changed (1) hide show

README.md +15 -4

README.md CHANGED Viewed

@@ -30,23 +30,34 @@ from PIL import Image
 import torch
 from transformers import AutoProcessor
-from heron.models.git_llm.git_llama import GitLlamaForCausalLM
 device_id = 0
 # prepare a pretrained model
-model = GitLlamaForCausalLM.from_pretrained('turing-motors/heron-chat-git-Llama-2-7b-v0')
 model.eval()
 model.to(f"cuda:{device_id}")
 # prepare a processor
-processor = AutoProcessor.from_pretrained('turing-motors/heron-chat-git-Llama-2-7b-v0')
 # prepare inputs
 url = "https://www.barnorama.com/wp-content/uploads/2016/12/03-Confusing-Pictures.jpg"
 image = Image.open(requests.get(url, stream=True).raw)
-text = f"##human: What is this picture？\n##gpt: "
 # do preprocessing
 inputs = processor(

 import torch
 from transformers import AutoProcessor
+from heron.models.git_llm.git_llama import GitLlamaConfig, GitLlamaForCausalLM
 device_id = 0
 # prepare a pretrained model
+MODEL_NAME = 'turing-motors/heron-chat-git-Llama-2-7b-v0'
+git_config = GitLlamaConfig.from_pretrained(MODEL_NAME)
+git_config.set_vision_configs(
+    num_image_with_embedding=1, vision_model_name=git_config.vision_model_name
+)
+model = GitLlamaForCausalLM.from_pretrained(
+    MODEL_NAME, config=git_config, torch_dtype=torch.float16
+)
+model = GitLlamaForCausalLM.from_pretrained(MODEL_NAME)
 model.eval()
 model.to(f"cuda:{device_id}")
 # prepare a processor
+processor = AutoProcessor.from_pretrained(MODEL_NAME)
 # prepare inputs
 url = "https://www.barnorama.com/wp-content/uploads/2016/12/03-Confusing-Pictures.jpg"
 image = Image.open(requests.get(url, stream=True).raw)
+text = f"##human: What is this picture?\n##gpt: "
 # do preprocessing
 inputs = processor(