Upload LlavaForConditionalGeneration

Files changed (8) hide show

README.md CHANGED Viewed

@@ -1,9 +1,9 @@
 ---
 datasets:
 - Lin-Chen/ShareGPT4V
 pipeline_tag: image-text-to-text
-library_name: xtuner
-license: llama3
 ---
 ---

 ---
+license: llama3
+library_name: xtuner
 datasets:
 - Lin-Chen/ShareGPT4V
 pipeline_tag: image-text-to-text
 ---
 ---

config.json CHANGED Viewed

@@ -1,4 +1,5 @@
 {
   "architectures": [
     "LlavaForConditionalGeneration"
   ],
@@ -12,19 +13,17 @@
     "architectures": [
       "LlamaForCausalLM"
     ],
     "max_position_embeddings": 8192,
     "model_type": "llama",
     "rms_norm_eps": 1e-05,
     "torch_dtype": "float16",
-    "vocab_size": 128256,
-    "num_attention_heads": 32,
-    "num_hidden_layers": 32,
-    "num_key_value_heads": 8,
-    "intermediate_size": 14336
   },
   "tie_word_embeddings": false,
   "torch_dtype": "float16",
-  "transformers_version": "4.37.0.dev0",
   "vision_config": {
     "hidden_size": 1024,
     "image_size": 336,
@@ -37,6 +36,5 @@
     "vocab_size": 32000
   },
   "vision_feature_layer": -2,
-  "vision_feature_select_strategy": "default",
-  "vocab_size": 128256
-}

 {
+  "_name_or_path": "xtuner/llava-llama-3-8b-v1_1-hf",
   "architectures": [
     "LlavaForConditionalGeneration"
   ],
     "architectures": [
       "LlamaForCausalLM"
     ],
+    "intermediate_size": 14336,
     "max_position_embeddings": 8192,
     "model_type": "llama",
+    "num_key_value_heads": 8,
     "rms_norm_eps": 1e-05,
     "torch_dtype": "float16",
+    "vocab_size": 128256
   },
   "tie_word_embeddings": false,
   "torch_dtype": "float16",
+  "transformers_version": "4.40.0",
   "vision_config": {
     "hidden_size": 1024,
     "image_size": 336,
     "vocab_size": 32000
   },
   "vision_feature_layer": -2,
+  "vision_feature_select_strategy": "default"
+}

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 128000,
   "eos_token_id": 128001,
-  "transformers_version": "4.37.2"
 }

   "_from_model_config": true,
   "bos_token_id": 128000,
   "eos_token_id": 128001,
+  "transformers_version": "4.40.0"
 }

model-00001-of-00004.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:779b08a5e49134a8794c97b0010859aa757281089b2293b17a7f175798427e69
+size 4954605072

model-00002-of-00004.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:268d2a5b0427bf992dd67e79fd1db200b6f95be61867bfe9345d370be2e6c68a
+size 4915917552

model-00003-of-00004.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3f8e9275cbb4ffa5607ce95502532aae71377284b251efe4c71f76883318f9ba
+size 4999820824

model-00004-of-00004.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f4e0a846205f02e2fe463cad9c6a7f9785292444ca266b8baa786a71127db32b
+size 1839245336

model.safetensors.index.json CHANGED Viewed

The diff for this file is too large to render. See raw diff