Updates the full-scope model - better performance across all tasks.

Browse files

Files changed (4) hide show

config.json +13 -3
pytorch_model-00001-of-00002.bin +1 -1
pytorch_model-00002-of-00002.bin +1 -1
pytorch_model.bin.index.json +0 -0

config.json CHANGED Viewed

@@ -1,17 +1,20 @@
 {
-  "_name_or_path": "./trained_checkpoints/exp1_grand_pretrain_v15_gs4488_ckpt_25000_hf",
   "architectures": [
-    "LISAForCausalLM"
   ],
   "bbox_token_idx": 32002,
   "bos_token_id": 1,
   "eos_token_id": 2,
-  "freeze_mm_mlp_adapter": true,
   "freeze_mm_vision_resampler": false,
   "hidden_act": "silu",
   "hidden_size": 4096,
   "image_aspect_ratio": "square",
   "image_grid_pinpoints": null,
   "initializer_range": 0.02,
   "intermediate_size": 11008,
   "max_length": 4096,
@@ -21,6 +24,8 @@
   "mm_resampler_type": null,
   "mm_use_im_patch_token": false,
   "mm_use_im_start_end": true,
   "mm_vision_select_feature": "patch",
   "mm_vision_select_layer": -2,
   "mm_vision_tower": "openai/clip-vit-large-patch14-336",
@@ -29,21 +34,26 @@
   "num_hidden_layers": 32,
   "num_key_value_heads": 32,
   "num_level_reg_features": 4,
   "out_dim": 256,
   "pad_token_id": 0,
   "pretrain_mm_mlp_adapter": null,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
   "rope_scaling": null,
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
   "train_mask_decoder": true,
   "transformers_version": "4.28.0.dev0",
   "tune_mm_mlp_adapter": false,
   "tune_mm_vision_resampler": false,
   "unfreeze_mm_vision_tower": false,
   "use_cache": false,
   "use_mm_proj": true,
   "vision_tower": "openai/clip-vit-large-patch14-336",
   "vocab_size": 32007,
   "with_region": true

 {
+  "_name_or_path": "./checkpoints/GLaMM-GranD-Pretrained",
   "architectures": [
+    "GLaMMForCausalLM"
   ],
   "bbox_token_idx": 32002,
   "bos_token_id": 1,
   "eos_token_id": 2,
+  "freeze_mlp_adapter": true,
+  "freeze_mm_mlp_adapter": false,
   "freeze_mm_vision_resampler": false,
   "hidden_act": "silu",
   "hidden_size": 4096,
+  "image_aspect": "square",
   "image_aspect_ratio": "square",
   "image_grid_pinpoints": null,
+  "image_grid_points": null,
   "initializer_range": 0.02,
   "intermediate_size": 11008,
   "max_length": 4096,
   "mm_resampler_type": null,
   "mm_use_im_patch_token": false,
   "mm_use_im_start_end": true,
+  "mm_use_image_start_end": true,
+  "mm_vision_module": "openai/clip-vit-large-patch14-336",
   "mm_vision_select_feature": "patch",
   "mm_vision_select_layer": -2,
   "mm_vision_tower": "openai/clip-vit-large-patch14-336",
   "num_hidden_layers": 32,
   "num_key_value_heads": 32,
   "num_level_reg_features": 4,
+  "num_reg_features": 4,
   "out_dim": 256,
   "pad_token_id": 0,
   "pretrain_mm_mlp_adapter": null,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
   "rope_scaling": null,
+  "select_feature_type": "patch",
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
   "train_mask_decoder": true,
   "transformers_version": "4.28.0.dev0",
+  "tune_mlp_adapter": false,
   "tune_mm_mlp_adapter": false,
   "tune_mm_vision_resampler": false,
   "unfreeze_mm_vision_tower": false,
   "use_cache": false,
+  "use_image_patch_token": false,
   "use_mm_proj": true,
+  "vision_module": "openai/clip-vit-large-patch14-336",
   "vision_tower": "openai/clip-vit-large-patch14-336",
   "vocab_size": 32007,
   "with_region": true

pytorch_model-00001-of-00002.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5852b29e2afb0734d4c767e24e167f9332b6797a3e599b6b84dc2acba354001a
 size 9976691902

 version https://git-lfs.github.com/spec/v1
+oid sha256:5dcdc7b329c5aaf02265d2eff7bdec0cc64418c0ef2310f567b442af11ce2f89
 size 9976691902

pytorch_model-00002-of-00002.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:971e39574ff21400760f10803e846d1356489171d7649a3ae025b38b0107fee3
 size 6776538784

 version https://git-lfs.github.com/spec/v1
+oid sha256:04c6e1fda509b04b701ee021ba81cef0240451d138367c51bd6658482704419f
 size 6776538784

pytorch_model.bin.index.json CHANGED Viewed

The diff for this file is too large to render. See raw diff