File size: 666 Bytes
1f9001d
6642c6e
 
 
 
 
 
 
7ec6e1f
6642c6e
e1b6a6e
1f9001d
7ec6e1f
1
2
3
4
5
6
7
8
9
10
11
12
13
14
# MMAlaya
MMAlaya是基于大语言模型[Alaya](https://github.com/DataCanvasIO/Alaya)的多模态模型。

MMAlaya包含以下三个模块:
<br>1,大语言模型Alaya。
<br>2,图像文本特征编码器[blip2-opt-2.7b](https://huggingface.co/Salesforce/blip2-opt-2.7b)
<br>3,图像文本特征到大预言模型的线性投影器。

模型的训练主要基于[LLaVA](https://github.com/haotian-liu/LLaVA)架构

2024.01.23 最终在[MMBench](https://mmbench.opencompass.org.cn)线上测试中文测试集分数为56.9,英文测试集分数为59.8。

推理可以参考 [inference.py](https://github.com/bingwork/MMAlaya/blob/inference/inference.py)