OpenGVLab
/

InternVL-Chat-ViT-6B-Vicuna-7B

Visual Question Answering

text-generation

Model card Files Files and versions Metrics Training metrics Community

czczup commited on Jan 26

Commit

d03385d

•

1 Parent(s): 1425bce

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -17,7 +17,7 @@ It is trained using web-scale, noisy image-text pairs. The data are all publicly
 It is _**the largest open-source vision/vision-language foundation model (14B)**_ to date, achieving _**32 state-of-the-art**_ performances on a wide range of tasks such as visual perception, cross-modal retrieval, multimodal dialogue, etc.
-![image/png](https://cdn-uploads.huggingface.co/production/uploads/64119264f0f81eb569e0d569/QmVXOyr4uFQLx5Q-WLn9-.png)
 ## How to Run?

 It is _**the largest open-source vision/vision-language foundation model (14B)**_ to date, achieving _**32 state-of-the-art**_ performances on a wide range of tasks such as visual perception, cross-modal retrieval, multimodal dialogue, etc.
+![image/png](https://cdn-uploads.huggingface.co/production/uploads/64119264f0f81eb569e0d569/k5UATwX5W2b5KJBN5C58x.png)
 ## How to Run?