Upload AriaForConditionalGeneration

by m-ric HF Staff - opened Dec 9, 2024

←

Files changed (7) hide show

README.md CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
-license: apache-2.0
 base_model:
 - rhymes-ai/Aria
 base_model_relation: quantized
 ---

 ---
 base_model:
 - rhymes-ai/Aria
+license: apache-2.0
 base_model_relation: quantized
 ---

config.json CHANGED Viewed

@@ -1,16 +1,20 @@
 {
-  "_name_or_path": "./",
   "architectures": [
     "AriaForConditionalGeneration"
   ],
   "auto_map": {
-    "AutoConfig": "configuration_aria.AriaConfig",
     "AutoModelForCausalLM": "modeling_aria.AriaForConditionalGeneration"
   },
   "do_sample": null,
   "ignore_index": -100,
   "image_token_index": 9,
   "model_type": "aria",
   "projector_patch_to_query_dict": {
     "1225": 128,
     "4900": 256
@@ -20,7 +24,7 @@
     "hidden_size": 2560,
     "intermediate_size": 13568,
     "max_position_embeddings": 65536,
-    "model_type": "aria_moe_lm",
     "moe_intermediate_size": 1664,
     "moe_num_experts": 64,
     "moe_topk": 6,
@@ -31,20 +35,20 @@
     "rope_theta": 5000000,
     "vocab_size": 100352
   },
-  "torch_dtype": "bfloat16",
-  "transformers_version": "4.45.0",
   "vision_config": {
     "_flash_attn_2_enabled": true,
     "architectures": [
       "AriaVisionModel"
     ],
-    "hidden_size": 1152,
     "image_size": 980,
     "intermediate_size": 4304,
-    "model_type": "aria_vision_model",
-    "num_attention_heads": 16,
     "num_hidden_layers": 27,
     "patch_size": 14,
     "torch_dtype": "bfloat16"
-  }
 }

 {
+  "_name_or_path": "rhymes-ai/Aria-torchao-int8wo",
   "architectures": [
     "AriaForConditionalGeneration"
   ],
   "auto_map": {
+    "AutoConfig": "modeling_aria.AriaConfig",
     "AutoModelForCausalLM": "modeling_aria.AriaForConditionalGeneration"
   },
   "do_sample": null,
   "ignore_index": -100,
   "image_token_index": 9,
+  "initializer_range": 0.02,
+  "intermediate_size": 1664,
+  "max_value_projector_patch_to_query_dict": 256,
   "model_type": "aria",
+  "pad_token_id": 2,
   "projector_patch_to_query_dict": {
     "1225": 128,
     "4900": 256
     "hidden_size": 2560,
     "intermediate_size": 13568,
     "max_position_embeddings": 65536,
+    "model_type": "aria_text",
     "moe_intermediate_size": 1664,
     "moe_num_experts": 64,
     "moe_topk": 6,
     "rope_theta": 5000000,
     "vocab_size": 100352
   },
+  "torch_dtype": "float16",
+  "transformers_version": "4.48.0.dev0",
   "vision_config": {
     "_flash_attn_2_enabled": true,
     "architectures": [
       "AriaVisionModel"
     ],
+    "attention_heads": 16,
     "image_size": 980,
     "intermediate_size": 4304,
+    "model_type": "idefics3_vision",
     "num_hidden_layers": 27,
     "patch_size": 14,
     "torch_dtype": "bfloat16"
+  },
+  "vision_feature_layer": -1
 }

generation_config.json CHANGED Viewed

@@ -1,8 +1,7 @@
 {
   "_from_model_config": true,
   "bos_token_id": 1,
-  "do_sample": true,
   "eos_token_id": 2,
-  "temperature": 0.7,
-  "transformers_version": "4.45.0"
 }

 {
   "_from_model_config": true,
   "bos_token_id": 1,
   "eos_token_id": 2,
+  "pad_token_id": 2,
+  "transformers_version": "4.48.0.dev0"
 }

pytorch_model-00001-of-00003.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:480dae1a48acf8a46f33ba04020bc50ca1c25d2c9be439710e1dd13d2154cfe6
+size 3764

pytorch_model-00002-of-00003.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2385c41974e1f894b26a8865f6f0271a54998e27c51083564e3e655c6efeee1d
+size 64086

pytorch_model-00003-of-00003.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:db57e5cd720c4164439696f11239a777f5ba1a566e9b10d57bb7f206bc112624
+size 18932

pytorch_model.bin.index.json CHANGED Viewed

The diff for this file is too large to render. See raw diff