File size: 4,604 Bytes
a4c06ad
 
 
 
 
cfe4f59
 
30cb415
4159242
 
cfe4f59
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4159242
f9498b8
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4159242
a37773c
ce15084
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
a4c06ad
ce15084
 
 
 
 
 
64e9021
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
---
license: apache-2.0
language:
- ar
---
# <b>AceGPT</b>
AceGPT is a fully fine-tuned generative text model collection based on LlaMA2, particularly in the  
Arabic language domain. This is the repository for the 13B pretrained model.

---
## Model Details
We have released the AceGPT family of large language models, which is a collection of fully fine-tuned  
generative text models based on LlaMA2, ranging from 7B to 13B parameters. Our models include two main  
categories: AceGPT and AceGPT-chat. AceGPT-chat is an optimized version specifically designed for dialogue  
applications. It is worth mentioning that our models have demonstrated superior performance compared   
to all currently available open-source Arabic dialogue models in multiple benchmark tests. Furthermore,  
in our human evaluations, our models have shown comparable satisfaction levels to some closed-source models,  
such as ChatGPT, in the Arabic language.
## Model Developers 
We are from the School of Data Science, the Chinese University of Hong Kong, Shenzhen (CUHKSZ), and   
the Shenzhen Research Institute of Big Data (SRIBD).
## Variations
AceGPT famils comes in a range of parameter sizes —— 7B and 13B, each size of model has a base categorie   
and a -chat categorie.
## Input 
Models input text only.
## Output
Models output text only.

## Model Evaluation Results

Experiments on Arabic MMLU and EXAMs. 'AverageBest', 'STEM','Humanities','Social Sciences' and 'Others (Business, Health, Misc)'  
belong to Arabic MMLU. Best performance is in bold and the second best is underlined.

|   Model         | Average | STEM | Humanities | Social Sciences | Others (Business, Health, Misc) |EXAMs         |
|-----------------|---------|------|------------|-----------------|---------------------------------|--------------|
| Bloomz Muennighoff et al. (2022) | 30.95        | 32.32        | 26.71        | 35.85        | 28.95       | 33.89          |                             
| Llama2-7B                        | 28.81        | 28.48        | 26.68        | 29.88        | 30.18        | 23.48         |                                 
| Llama2-13B                       | 31.25        | 31.06        | 27.11        | 35.5         | 31.35        | 25.45         |                                 
| Jais-13B-base                    | 30.01        | 27.85        | 25.42        | 39.7         | 27.06        | 35.67         |                                 
| AceGPT-7B-base                   | 30.36        | 26.63        | 28.17        | 35.15        | 31.5         | 31.96         |                                 
| AceGPT-13B-base                  | <u>37.26</u> | <u>35.16</u> | <u>30.3</u>  | <u>47.34</u> | <u>36.25</u> | <u>36.63</u>  |                                 
| ChatGPT                          | <b>46.07</b> | <b>44.17</b> | <b>35.33/<b> | <b>61.26</b> | <b>43.52</b> | <b>45.63 </b> | 

---
## Samples
#### Arabic MMLU (5-shot)
فيما يلي أسئلة الاختيار من متعدد (مع الإجابات) حول جبر تجريدي  
سؤال: العثور على جميع قيم c في Z_3 بحيث يكون Z_3 [x]/(x^2+c) حقلًا.  
A. 0  
B. 1  
C. 2  
D. 3  
إجابة: B  

  
سؤال: البيان رقم 1 | إذا كان aH عنصرًا في مجموعة العوامل ، فإن | aH | يقسم | a |. البيان رقم 2 | إذا كانت H و K مجموعات فرعية لـ G ، فإن HK مجموعة فرعية لـ G.  
A. صحيح ، صحيح  
B. خطأ ، خطأ  
C. صحيح ، خطأ  
D. خطأ ، صحيح  
إجابة: B  

    
سؤال: العبارة 1 | كل عنصر من مجموعة يولد مجموعة دورية من المجموعة. العبارة 2 | المجموعة المتناظرة S_10 لديها 10 عناصر.  
A. صحيح، صحيح  
B. خطأ، خطأ  
C. صحيح، خطأ  
D. خطأ، صحيح  
إجابة: C  


سؤال: البيان 1| كل وظيفة من مجموعة محدودة على نفسها يجب أن تكون واحدة لكل مجموعة. البيان 2 | كل فرع فرعي لمجموعة أبيلية هو أبيلي.  
A. صحيح, صحيح  
B. خاطئ, خاطئ  
C. صحيح, خاطئ  
D. خاطئ, صحيح\nإجابة: A  

سؤال: اعثر على خاصية الحلقة 2Z.  
A. 0  
B. 3  
C. 12  
D. 30  
إجابة: A  

سؤال: ما هو الدرجة للامتداد الميداني الناتج من Q(sqrt(2), sqrt(3), sqrt(18)) على Q؟  
A. 0  
B. 4  
C. 2  
D. 6  
إجابة:",
# You can get more detail at https://github.com/FreedomIntelligence/AceGPT/tree/main