binxia
/

LLMGA-pretrained-mlp

Model card Files Files and versions Community

binxia commited on Jul 5, 2024

Commit

086b9f5

verified ·

1 Parent(s): e099719

Upload folder using huggingface_hub

Browse files

Files changed (27) hide show

llmga-Phi-3-mini-128k-pretrain/config.json +153 -0
llmga-Phi-3-mini-128k-pretrain/mm_projector.bin +3 -0
llmga-Phi-3-mini-128k-pretrain/trainer_state.json +0 -0
llmga-Qwen2-0.5B-pretrain/config.json +43 -0
llmga-Qwen2-0.5B-pretrain/mm_projector.bin +3 -0
llmga-Qwen2-0.5B-pretrain/trainer_state.json +0 -0
llmga-Qwen2-1.5B-pretrain/config.json +43 -0
llmga-Qwen2-1.5B-pretrain/mm_projector.bin +3 -0
llmga-Qwen2-1.5B-pretrain/trainer_state.json +0 -0
llmga-Qwen2-7B-pretrain/config.json +43 -0
llmga-Qwen2-7B-pretrain/mm_projector.bin +3 -0
llmga-Qwen2-7B-pretrain/trainer_state.json +0 -0
llmga-gemma-pretrain/config.json +44 -0
llmga-gemma-pretrain/mm_projector.bin +3 -0
llmga-gemma-pretrain/trainer_state.json +0 -0
llmga-llama3-8b-pretrain/config.json +43 -0
llmga-llama3-8b-pretrain/mm_projector.bin +3 -0
llmga-llama3-8b-pretrain/trainer_state.json +0 -0
llmga-mistral-pretrain/config.json +41 -0
llmga-mistral-pretrain/mm_projector.bin +3 -0
llmga-mistral-pretrain/trainer_state.json +0 -0
llmga-vicuna-13b-v1.5-pretrain/config.json +41 -0
llmga-vicuna-13b-v1.5-pretrain/mm_projector.bin +3 -0
llmga-vicuna-13b-v1.5-pretrain/trainer_state.json +0 -0
llmga-vicuna-7b-v1.5-pretrain/config.json +40 -0
llmga-vicuna-7b-v1.5-pretrain/mm_projector.bin +3 -0
llmga-vicuna-7b-v1.5-pretrain/trainer_state.json +0 -0

llmga-Phi-3-mini-128k-pretrain/config.json ADDED Viewed

	@@ -0,0 +1,153 @@

+{
+  "_name_or_path": "/mnt/bn/wyt-large-dataset/xiabin-model/LLM/Phi-3-mini-128k-instruct",
+  "architectures": [
+    "Phi3ForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "auto_map": {
+    "AutoConfig": "configuration_phi3.Phi3Config",
+    "AutoModelForCausalLM": "modeling_phi3.Phi3ForCausalLM"
+  },
+  "bos_token_id": 1,
+  "embd_pdrop": 0.0,
+  "eos_token_id": 32000,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 3072,
+  "image_aspect_ratio": "resizesquare",
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "max_position_embeddings": 131072,
+  "mm_hidden_size": 1024,
+  "mm_patch_merge_type": "flat",
+  "mm_projector_lr": null,
+  "mm_projector_type": "mlp2x_gelu",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "mm_vision_select_feature": "patch",
+  "mm_vision_select_layer": -2,
+  "mm_vision_tower": "openai/clip-vit-large-patch14-336",
+  "model_type": "llava_Phi3",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 32,
+  "original_max_position_embeddings": 4096,
+  "pad_token_id": 32000,
+  "resid_pdrop": 0.0,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "long_factor": [
+      1.0299999713897705,
+      1.0499999523162842,
+      1.0499999523162842,
+      1.0799999237060547,
+      1.2299998998641968,
+      1.2299998998641968,
+      1.2999999523162842,
+      1.4499999284744263,
+      1.5999999046325684,
+      1.6499998569488525,
+      1.8999998569488525,
+      2.859999895095825,
+      3.68999981880188,
+      5.419999599456787,
+      5.489999771118164,
+      5.489999771118164,
+      9.09000015258789,
+      11.579999923706055,
+      15.65999984741211,
+      15.769999504089355,
+      15.789999961853027,
+      18.360000610351562,
+      21.989999771118164,
+      23.079999923706055,
+      30.009998321533203,
+      32.35000228881836,
+      32.590003967285156,
+      35.56000518798828,
+      39.95000457763672,
+      53.840003967285156,
+      56.20000457763672,
+      57.95000457763672,
+      59.29000473022461,
+      59.77000427246094,
+      59.920005798339844,
+      61.190006256103516,
+      61.96000671386719,
+      62.50000762939453,
+      63.3700065612793,
+      63.48000717163086,
+      63.48000717163086,
+      63.66000747680664,
+      63.850006103515625,
+      64.08000946044922,
+      64.760009765625,
+      64.80001068115234,
+      64.81001281738281,
+      64.81001281738281
+    ],
+    "short_factor": [
+      1.05,
+      1.05,
+      1.05,
+      1.1,
+      1.1,
+      1.1500000000000001,
+      1.2000000000000002,
+      1.2500000000000002,
+      1.3000000000000003,
+      1.3500000000000003,
+      1.5000000000000004,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.000000000000001,
+      2.0500000000000007,
+      2.0500000000000007,
+      2.0500000000000007,
+      2.1000000000000005,
+      2.1000000000000005,
+      2.1000000000000005,
+      2.1500000000000004,
+      2.1500000000000004,
+      2.3499999999999996,
+      2.549999999999999,
+      2.5999999999999988,
+      2.5999999999999988,
+      2.7499999999999982,
+      2.849999999999998,
+      2.849999999999998,
+      2.9499999999999975
+    ],
+    "type": "su"
+  },
+  "rope_theta": 10000.0,
+  "sliding_window": 262144,
+  "tie_word_embeddings": false,
+  "tokenizer_model_max_length": 2048,
+  "tokenizer_padding_side": "right",
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.41.2",
+  "tune_mm_mlp_adapter": true,
+  "use_cache": true,
+  "use_mm_proj": true,
+  "vocab_size": 32064
+}

llmga-Phi-3-mini-128k-pretrain/mm_projector.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:40154d390cb770ac648ab5b484d3c41687f819ad4c2993af018f501fb830f0a0
+size 25180216

llmga-Phi-3-mini-128k-pretrain/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

llmga-Qwen2-0.5B-pretrain/config.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "_name_or_path": "/mnt/bn/wyt-large-dataset/xiabin-model/LLM/Qwen2-0.5B-Instruct",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151645,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 896,
+  "image_aspect_ratio": "resizesquare",
+  "initializer_range": 0.02,
+  "intermediate_size": 4864,
+  "max_position_embeddings": 32768,
+  "max_window_layers": 24,
+  "mm_hidden_size": 1024,
+  "mm_patch_merge_type": "flat",
+  "mm_projector_lr": null,
+  "mm_projector_type": "mlp2x_gelu",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "mm_vision_select_feature": "patch",
+  "mm_vision_select_layer": -2,
+  "mm_vision_tower": "openai/clip-vit-large-patch14-336",
+  "model_type": "llava_Qwen2",
+  "num_attention_heads": 14,
+  "num_hidden_layers": 24,
+  "num_key_value_heads": 2,
+  "rms_norm_eps": 1e-06,
+  "rope_theta": 1000000.0,
+  "sliding_window": 32768,
+  "tie_word_embeddings": true,
+  "tokenizer_model_max_length": 2048,
+  "tokenizer_padding_side": "right",
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.41.2",
+  "tune_mm_mlp_adapter": true,
+  "use_cache": true,
+  "use_mm_proj": true,
+  "use_sliding_window": false,
+  "vocab_size": 151936
+}

llmga-Qwen2-0.5B-pretrain/mm_projector.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:91ff9f53028ff3205fdf3cd0033d0c84a2ceae28fc0e6adcc7a770336d5ae607
+size 3446328

llmga-Qwen2-0.5B-pretrain/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

llmga-Qwen2-1.5B-pretrain/config.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "_name_or_path": "/mnt/bn/wyt-large-dataset/xiabin-model/LLM/Qwen2-1.5B-Instruct",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151645,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 1536,
+  "image_aspect_ratio": "resizesquare",
+  "initializer_range": 0.02,
+  "intermediate_size": 8960,
+  "max_position_embeddings": 32768,
+  "max_window_layers": 28,
+  "mm_hidden_size": 1024,
+  "mm_patch_merge_type": "flat",
+  "mm_projector_lr": null,
+  "mm_projector_type": "mlp2x_gelu",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "mm_vision_select_feature": "patch",
+  "mm_vision_select_layer": -2,
+  "mm_vision_tower": "openai/clip-vit-large-patch14-336",
+  "model_type": "llava_Qwen2",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 28,
+  "num_key_value_heads": 2,
+  "rms_norm_eps": 1e-06,
+  "rope_theta": 1000000.0,
+  "sliding_window": 32768,
+  "tie_word_embeddings": true,
+  "tokenizer_model_max_length": 2048,
+  "tokenizer_padding_side": "right",
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.41.2",
+  "tune_mm_mlp_adapter": true,
+  "use_cache": true,
+  "use_mm_proj": true,
+  "use_sliding_window": false,
+  "vocab_size": 151936
+}

llmga-Qwen2-1.5B-pretrain/mm_projector.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e7b3f2a6f26615b8d036b34f82dea91ceedc319ddc08649817cc94cc91319962
+size 7872568

llmga-Qwen2-1.5B-pretrain/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

llmga-Qwen2-7B-pretrain/config.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "_name_or_path": "/mnt/bn/wyt-large-dataset/xiabin-model/LLM/Qwen2-7B-Instruct",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151645,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 3584,
+  "image_aspect_ratio": "resizesquare",
+  "initializer_range": 0.02,
+  "intermediate_size": 18944,
+  "max_position_embeddings": 32768,
+  "max_window_layers": 28,
+  "mm_hidden_size": 1024,
+  "mm_patch_merge_type": "flat",
+  "mm_projector_lr": null,
+  "mm_projector_type": "mlp2x_gelu",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "mm_vision_select_feature": "patch",
+  "mm_vision_select_layer": -2,
+  "mm_vision_tower": "openai/clip-vit-large-patch14-336",
+  "model_type": "llava_Qwen2",
+  "num_attention_heads": 28,
+  "num_hidden_layers": 28,
+  "num_key_value_heads": 4,
+  "rms_norm_eps": 1e-06,
+  "rope_theta": 1000000.0,
+  "sliding_window": 131072,
+  "tie_word_embeddings": false,
+  "tokenizer_model_max_length": 2048,
+  "tokenizer_padding_side": "right",
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.41.2",
+  "tune_mm_mlp_adapter": true,
+  "use_cache": true,
+  "use_mm_proj": true,
+  "use_sliding_window": false,
+  "vocab_size": 152064
+}

llmga-Qwen2-7B-pretrain/mm_projector.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a07f1846da6840beca110eb0b79a6fc5deaf630196e87c006d8bfc8965a6d6db
+size 33046584

llmga-Qwen2-7B-pretrain/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

llmga-gemma-pretrain/config.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+  "_name_or_path": "/mnt/bn/xiabinpaintv2/gemma-2b-it",
+  "architectures": [
+    "GemmaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "bos_token_id": 2,
+  "eos_token_id": 1,
+  "freeze_mm_mlp_adapter": false,
+  "head_dim": 256,
+  "hidden_act": "gelu",
+  "hidden_activation": null,
+  "hidden_size": 2048,
+  "image_aspect_ratio": "resizesquare",
+  "initializer_range": 0.02,
+  "intermediate_size": 16384,
+  "max_position_embeddings": 8192,
+  "mm_hidden_size": 1024,
+  "mm_patch_merge_type": "flat",
+  "mm_projector_lr": null,
+  "mm_projector_type": "mlp2x_gelu",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "mm_vision_select_feature": "patch",
+  "mm_vision_select_layer": -2,
+  "mm_vision_tower": "openai/clip-vit-large-patch14-336",
+  "model_type": "llava_gemma",
+  "num_attention_heads": 8,
+  "num_hidden_layers": 18,
+  "num_key_value_heads": 1,
+  "pad_token_id": 0,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tokenizer_model_max_length": 2048,
+  "tokenizer_padding_side": "right",
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.39.3",
+  "tune_mm_mlp_adapter": true,
+  "use_cache": true,
+  "use_mm_proj": true,
+  "vocab_size": 256000
+}

llmga-gemma-pretrain/mm_projector.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:25af5b2f31dab5a0564b20c4b654081eca9f9241c216d313c095de13fe3d522f
+size 12593208

llmga-gemma-pretrain/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

llmga-llama3-8b-pretrain/config.json ADDED Viewed

	@@ -0,0 +1,43 @@

+{
+  "_name_or_path": "/mnt/bn/wyt-large-dataset/xiabin-dataset/Meta-Llama-3-8B-Instruct",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "bos_token_id": 128000,
+  "eos_token_id": 128001,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "image_aspect_ratio": "resizesquare",
+  "initializer_range": 0.02,
+  "intermediate_size": 14336,
+  "max_position_embeddings": 8192,
+  "mm_hidden_size": 1024,
+  "mm_patch_merge_type": "flat",
+  "mm_projector_lr": null,
+  "mm_projector_type": "mlp2x_gelu",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "mm_vision_select_feature": "patch",
+  "mm_vision_select_layer": -2,
+  "mm_vision_tower": "openai/clip-vit-large-patch14-336",
+  "model_type": "llava_llama",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": false,
+  "tokenizer_model_max_length": 2048,
+  "tokenizer_padding_side": "right",
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.40.1",
+  "tune_mm_mlp_adapter": true,
+  "use_cache": true,
+  "use_mm_proj": true,
+  "vocab_size": 128256
+}

llmga-llama3-8b-pretrain/mm_projector.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2ea4ae9b00c7ff66349b74372673f50829ffc3c0c6817584856792f5d3f43123
+size 41961528

llmga-llama3-8b-pretrain/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

llmga-mistral-pretrain/config.json ADDED Viewed

	@@ -0,0 +1,41 @@

+{
+  "_name_or_path": "/mnt/bn/wyt-large-dataset/xiabin-dataset/Mistral-7B-Instruct-v0.2",
+  "architectures": [
+    "MistralForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "image_aspect_ratio": "resizesquare",
+  "initializer_range": 0.02,
+  "intermediate_size": 14336,
+  "max_position_embeddings": 32768,
+  "mm_hidden_size": 1024,
+  "mm_patch_merge_type": "flat",
+  "mm_projector_lr": null,
+  "mm_projector_type": "mlp2x_gelu",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "mm_vision_select_feature": "patch",
+  "mm_vision_select_layer": -2,
+  "mm_vision_tower": "openai/clip-vit-large-patch14-336",
+  "model_type": "llava_mistral",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 8,
+  "rms_norm_eps": 1e-05,
+  "rope_theta": 1000000.0,
+  "sliding_window": null,
+  "tie_word_embeddings": false,
+  "tokenizer_model_max_length": 2048,
+  "tokenizer_padding_side": "right",
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.41.2",
+  "tune_mm_mlp_adapter": true,
+  "use_cache": true,
+  "use_mm_proj": true,
+  "vocab_size": 32000
+}

llmga-mistral-pretrain/mm_projector.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9d1abee01ac5eef59c437e08e16735d38d43a24729bc713c6f315cac0d304c1a
+size 41961528

llmga-mistral-pretrain/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

llmga-vicuna-13b-v1.5-pretrain/config.json ADDED Viewed

	@@ -0,0 +1,41 @@

+{
+  "_name_or_path": "/mnt/bn/inpainting-bytenas-lq/xiabin/LLMGA-modelv2/vicuna-v1.5/vicuna-13b-v1.5",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 5120,
+  "image_aspect_ratio": "square",
+  "initializer_range": 0.02,
+  "intermediate_size": 13824,
+  "max_length": 4096,
+  "max_position_embeddings": 4096,
+  "mm_hidden_size": 1024,
+  "mm_projector_lr": null,
+  "mm_projector_type": "mlp2x_gelu",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "mm_vision_select_feature": "patch",
+  "mm_vision_select_layer": -2,
+  "mm_vision_tower": "openai/clip-vit-large-patch14-336",
+  "model_type": "llava",
+  "num_attention_heads": 40,
+  "num_hidden_layers": 40,
+  "num_key_value_heads": 40,
+  "pad_token_id": 0,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "tie_word_embeddings": false,
+  "tokenizer_model_max_length": 2048,
+  "tokenizer_padding_side": "right",
+  "torch_dtype": "float16",
+  "transformers_version": "4.31.0",
+  "tune_mm_mlp_adapter": true,
+  "use_cache": true,
+  "use_mm_proj": true,
+  "vocab_size": 32000
+}

llmga-vicuna-13b-v1.5-pretrain/mm_projector.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a76159a881736588cc972c48ce7f588782513c035503c2196456d2ba3cdfe4b6
+size 62936701

llmga-vicuna-13b-v1.5-pretrain/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

llmga-vicuna-7b-v1.5-pretrain/config.json ADDED Viewed

	@@ -0,0 +1,40 @@

+{
+  "_name_or_path": "/mnt/bn/inpainting-bytenas-lq/xiabin/LLMGA-modelv2/vicuna-v1.5/vicuna-7b-v1.5",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "image_aspect_ratio": "square",
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 4096,
+  "mm_hidden_size": 1024,
+  "mm_projector_lr": null,
+  "mm_projector_type": "mlp2x_gelu",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "mm_vision_select_feature": "patch",
+  "mm_vision_select_layer": -2,
+  "mm_vision_tower": "openai/clip-vit-large-patch14-336",
+  "model_type": "llava",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 32,
+  "pad_token_id": 0,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "tie_word_embeddings": false,
+  "tokenizer_model_max_length": 2048,
+  "tokenizer_padding_side": "right",
+  "torch_dtype": "float16",
+  "transformers_version": "4.31.0",
+  "tune_mm_mlp_adapter": true,
+  "use_cache": true,
+  "use_mm_proj": true,
+  "vocab_size": 32000
+}

llmga-vicuna-7b-v1.5-pretrain/mm_projector.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ce13fa83b5415ebd74c64d1eb3683f49bcf0975aa699658d94972b3af4a659fc
+size 41961085

llmga-vicuna-7b-v1.5-pretrain/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff