rhymes-ai
/

Aria-Chat

Image-Text-to-Text

Inference Endpoints

Model card Files Files and versions Community

teowu commited on Dec 15, 2024

Commit

064c827

·

verified ·

1 Parent(s): 433b819

Update README.md

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ base_model:
 </p>  -->
-# Aria-Chat-Preview Model Card
 <!--
 - Aria is the **first open multimodal native MoE** model, capable of seamlessly handling various input modalities within a MoE architecture.
@@ -25,7 +25,7 @@ base_model:
 ## Key features
-- **Especially Optimized For Multimodal Chat**: Unlike previous models, Aria-Chat-Preview is especially optimized for open-ended dialogs. We hope this version can provide seamless open-source multimodal chat experience.
 - **Improved Stability**: We have especially improved its stability for long outputs, reducing probabilities for previously-reported bad cases like incomplete responses on Markdown tables, or endless responses on listwise outputs.
 - **Better Multi-Lingual Abilities**: We have optimized its ability on non-English scenarios (Chinese, Spanish, French, Japanese, *etc*), including both multi-lingual OCR and multi-lingual dialogs.
@@ -49,7 +49,7 @@ This checkpoint is not designed for benchmarks, but for real-world open-ended ap
 | Model                     | Score   |
 |---------------------------|---------|
 | gpt-4o                    | 89.15   |
-| **Aria-Chat-Preview**     |**81.3** |
 | gpt-4-vision-preview      | 79.78   |
 | Aria                      | 74.1    |
 | Reka-Flash                | 64.65   |
@@ -81,7 +81,7 @@ import torch
 from PIL import Image
 from transformers import AutoModelForCausalLM, AutoProcessor
-model_id_or_path = "rhymes-ai/Aria-Chat-Preview"
 model = AutoModelForCausalLM.from_pretrained(model_id_or_path, device_map="auto", torch_dtype=torch.bfloat16, trust_remote_code=True)

 </p>  -->
+# Aria-Chat Model Card
 <!--
 - Aria is the **first open multimodal native MoE** model, capable of seamlessly handling various input modalities within a MoE architecture.
 ## Key features
+- **Especially Optimized For Multimodal Chat**: Unlike previous models, Aria-Chat is especially optimized for open-ended dialogs. We hope this version can provide seamless open-source multimodal chat experience.
 - **Improved Stability**: We have especially improved its stability for long outputs, reducing probabilities for previously-reported bad cases like incomplete responses on Markdown tables, or endless responses on listwise outputs.
 - **Better Multi-Lingual Abilities**: We have optimized its ability on non-English scenarios (Chinese, Spanish, French, Japanese, *etc*), including both multi-lingual OCR and multi-lingual dialogs.
 | Model                     | Score   |
 |---------------------------|---------|
 | gpt-4o                    | 89.15   |
+| **Aria-Chat**     |**81.3** |
 | gpt-4-vision-preview      | 79.78   |
 | Aria                      | 74.1    |
 | Reka-Flash                | 64.65   |
 from PIL import Image
 from transformers import AutoModelForCausalLM, AutoProcessor
+model_id_or_path = "rhymes-ai/Aria-Chat"
 model = AutoModelForCausalLM.from_pretrained(model_id_or_path, device_map="auto", torch_dtype=torch.bfloat16, trust_remote_code=True)