File size: 4,049 Bytes
f211e05
0e40916
 
 
419c959
dfe7a9a
0e40916
0196e3b
2fdffb2
 
256d9e6
419c959
0196e3b
419c959
0196e3b
419c959
 
0196e3b
ca20aaf
 
67068f2
419c959
0196e3b
ee45f50
9efaf29
324480c
961c986
7bc5e31
 
 
 
 
 
 
 
 
 
 
361e612
961c986
0faefde
 
 
 
 
c409b58
0faefde
 
 
b25704e
604f610
0faefde
961c986
0faefde
11ee808
1798e6c
66e09b5
b24adc0
0b883d6
b24adc0
ff222fd
961c986
2e6096e
363eccd
c47847c
 
6b8133b
dec5886
 
c47847c
1c299fa
67068f2
9627eaf
363eccd
803967e
 
 
 
 
363eccd
803967e
6a29910
803967e
67068f2
2e6096e
67068f2
2e6096e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
---
language:
- ar
metrics:
- Accuracy
library_name: transformers
pipeline_tag: text2text-generation
tags:
- t5
- text2text-generation
- text2text
- Classification and Generation
- Classification
- Generation
- ArabicT5
- Text Classification
- Text2Text Generation
widget:
- example_title: الرياضة
- text: |
    الاتحاد لا يستحق ركلة جزاء أمام النصر
---

# # Arabic news classification and generation using transformers
  - In this model focus on classifying and generating news Arabic.

# # The number in the generated text represents the category of the news, as shown below:
  category_mapping = {
  
      'Political':1,
      'Economy':2,
      'Health':3,
      'Sport':4,
      'Culture':5,
      'Technology':6,
      'Art':7,
      'Accidents':8
  }
  
# # Training parameters

|                       |              |
| :-------------------: | :-----------:|
|  Training batch size  |     `8`      |
| Evaluation batch size |     `8`      |
|     Learning rate     |    `1e-4`    |
|    Max length input   |     `64`     |
|   Max length target   |    `512`     |
|     Number workers    |     `4`      |
|         Epoch         |     `5`      |
|                       |              |

# # Results

|                         |               |
| :---------------------: | :-----------: | 
|   Validation Loss       |    `1.77`     |  
| Classification Accuracy |   `96.17%`    | 
|   Generation Accuracy   |   `87.16%`    |
|                         |               |

# # Example usage
```python

from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline

model_name="Hezam/ArabicT5-news-classification-generation"
model = T5ForConditionalGeneration.from_pretrained(model_name)
tokenizer = T5Tokenizer.from_pretrained(model_name)
generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer)

text = "الاتحاد لا يستحق ركلة جزاء أمام النصر"

output= generation_pipeline(text,
                            num_beams=4,
                            max_length=512,
                            top_p=0.9,
                            repetition_penalty = 3.0,
                            no_repeat_ngram_size = 3)[0]["generated_text"]

output

```
4 كتب حسام الحاج اكد احمد سامي المدير الفني للفريق الاول لكره القدم بنادي الاتحاد السكندري فريقه يستحق ركله جزاء في المباراه التي تجمع الفريقين اليوم الاحد استاد القاهره الدولي ضمن منافسات الجوله الرابعه والعشرين عمر مسابقه الدوري المصري الممتاز وجاء تشكيل الاتحاد كالتالي حراسه المرمي محمد الشناوي خط الدفاع حمزه المثلوثي محمود حمدي الونش حسين الشحات خط الوسط عمرو السوليه اسلام عيسي عبد الله السعيد علي معلول مصطفي الزناري خط الهجوم كريم فءاد ويجلس مقاعد بدلاء فريق الاتحاد السكندر
```bash
4 كتب حسام الحاج اكد احمد سامي المدير الفني للفريق الاول لكره القدم بنادي الاتحاد السكندري فريقه يستحق ركله جزاء في المباراه التي تجمع الفريقين اليوم الاحد استاد القاهره الدولي ضمن منافسات الجوله الرابعه والعشرين عمر مسابقه الدوري المصري الممتاز وجاء تشكيل الاتحاد كالتالي حراسه المرمي محمد الشناوي خط الدفاع حمزه المثلوثي محمود حمدي الونش حسين الشحات خط الوسط عمرو السوليه اسلام عيسي عبد الله السعيد علي معلول مصطفي الزناري خط الهجوم كريم فءاد ويجلس مقاعد بدلاء فريق الاتحاد السكندر
```