File size: 3,321 Bytes
f211e05
0e40916
 
 
419c959
 
 
dfe7a9a
0e40916
0196e3b
2fdffb2
 
256d9e6
419c959
0196e3b
419c959
0196e3b
419c959
 
0196e3b
6eafa35
2ad21ef
363eccd
419c959
0196e3b
85ced4c
7bc5e31
0196e3b
961c986
7bc5e31
 
 
 
 
 
 
 
 
 
 
961c986
0faefde
 
 
 
 
c409b58
0faefde
 
 
b25704e
604f610
0faefde
 
961c986
0faefde
11ee808
1798e6c
0faefde
 
ec3ce91
0b883d6
ff222fd
6dd4b2d
961c986
2e6096e
363eccd
c47847c
 
 
dec5886
 
c47847c
1c299fa
363eccd
9627eaf
363eccd
c47847c
363eccd
c47847c
 
 
363eccd
cae2fe7
2e6096e
e857a05
6a29910
2e6096e
363eccd
2e6096e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
---
language:
- ar
metrics:
- Accuracy
- F1_score
- BLEU
library_name: transformers
pipeline_tag: text2text-generation
tags:
- t5
- text2text-generation
- text2text
- Classification and Generation
- Classification
- Generation
- ArabicT5
- Text Classification
- Text2Text Generation
widget:
- example_title: "الرياضة"
- text: >
    خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس
---

# # ArabicT5 Model for Arabic News Classification and Generation 
  - The model is under trial

# # The number in the generated text represents the category of the news, as shown below:
  category_mapping = {
  
      'Political':1,
      'Economy':2,
      'Health':3,
      'Sport':4,
      'Culture':5,
      'Technology':6,
      'Art':7,
      'Accidents':8
  }
# # Training parameters

|                       |              |
| :-------------------: | :-----------:|
|  Training batch size  |     `8`      |
| Evaluation batch size |     `8`      |
|     Learning rate     |    `1e-4`    |
|    Max length input   |     `64`     |
|   Max length target   |    `512`     |
|     Number workers    |     `4`      |
|         Epoch         |     `5`      |
|                       |              |


# # Results

|                         |               |
| :---------------------: | :-----------: | 
|   Evaluation Loss       |    `3.94`     |  
|    Training Loss        |    `3.20`     |   
| Classification Accuracy |   `96.17%`     | 
|   Generation Accuracy   |   `87.16%`    |


# # Example usage
```python

from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline

model_name="Hezam/arabic-T5-news-classification-generation"
model = T5ForConditionalGeneration.from_pretrained(model_name)
tokenizer = T5Tokenizer.from_pretrained(model_name)
generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer)

text = " خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس"

output= generation_pipeline(text,
                    num_beams=10,
                    max_length=300,
                    top_p=0.9,
                    repetition_penalty = 3.0,
                    no_repeat_ngram_size = 3)[0]["generated_text"]

print('output: 'output)
```
output: 4 كتبت لبنى عبد الله خسر فريق ليفربول بقيادة البرتغالي جوسفالدو فيريرا نظيره تولوز بنتيجة فى المباراة التى جمعتهما اليوم السبت ضمن منافسات الجولة الـ عمر مسابقة الدورى المصرى الممتاز والتى انتهت بفوز المارد الأحمر بهدف رد سجله أحمد سيد زيزو لاعب وسط الفريق الأول لكرة القدم بنادى

```bash
output: 4 كتبت لبنى عبد الله خسر فريق ليفربول بقيادة البرتغالي جوسفالدو فيريرا نظيره تولوز بنتيجة فى المباراة التى جمعتهما اليوم السبت ضمن منافسات الجولة الـ عمر مسابقة الدورى المصرى الممتاز والتى انتهت بفوز المارد الأحمر بهدف رد سجله أحمد سيد زيزو لاعب وسط الفريق الأول لكرة القدم بنادى
```