File size: 3,321 Bytes
f211e05 0e40916 419c959 dfe7a9a 0e40916 0196e3b 2fdffb2 256d9e6 419c959 0196e3b 419c959 0196e3b 419c959 0196e3b 6eafa35 2ad21ef 363eccd 419c959 0196e3b 85ced4c 7bc5e31 0196e3b 961c986 7bc5e31 961c986 0faefde c409b58 0faefde b25704e 604f610 0faefde 961c986 0faefde 11ee808 1798e6c 0faefde ec3ce91 0b883d6 ff222fd 6dd4b2d 961c986 2e6096e 363eccd c47847c dec5886 c47847c 1c299fa 363eccd 9627eaf 363eccd c47847c 363eccd c47847c 363eccd cae2fe7 2e6096e e857a05 6a29910 2e6096e 363eccd 2e6096e |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 |
---
language:
- ar
metrics:
- Accuracy
- F1_score
- BLEU
library_name: transformers
pipeline_tag: text2text-generation
tags:
- t5
- text2text-generation
- text2text
- Classification and Generation
- Classification
- Generation
- ArabicT5
- Text Classification
- Text2Text Generation
widget:
- example_title: "الرياضة"
- text: >
خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس
---
# # ArabicT5 Model for Arabic News Classification and Generation
- The model is under trial
# # The number in the generated text represents the category of the news, as shown below:
category_mapping = {
'Political':1,
'Economy':2,
'Health':3,
'Sport':4,
'Culture':5,
'Technology':6,
'Art':7,
'Accidents':8
}
# # Training parameters
| | |
| :-------------------: | :-----------:|
| Training batch size | `8` |
| Evaluation batch size | `8` |
| Learning rate | `1e-4` |
| Max length input | `64` |
| Max length target | `512` |
| Number workers | `4` |
| Epoch | `5` |
| | |
# # Results
| | |
| :---------------------: | :-----------: |
| Evaluation Loss | `3.94` |
| Training Loss | `3.20` |
| Classification Accuracy | `96.17%` |
| Generation Accuracy | `87.16%` |
# # Example usage
```python
from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline
model_name="Hezam/arabic-T5-news-classification-generation"
model = T5ForConditionalGeneration.from_pretrained(model_name)
tokenizer = T5Tokenizer.from_pretrained(model_name)
generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer)
text = " خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس"
output= generation_pipeline(text,
num_beams=10,
max_length=300,
top_p=0.9,
repetition_penalty = 3.0,
no_repeat_ngram_size = 3)[0]["generated_text"]
print('output: 'output)
```
output: 4 كتبت لبنى عبد الله خسر فريق ليفربول بقيادة البرتغالي جوسفالدو فيريرا نظيره تولوز بنتيجة فى المباراة التى جمعتهما اليوم السبت ضمن منافسات الجولة الـ عمر مسابقة الدورى المصرى الممتاز والتى انتهت بفوز المارد الأحمر بهدف رد سجله أحمد سيد زيزو لاعب وسط الفريق الأول لكرة القدم بنادى
```bash
output: 4 كتبت لبنى عبد الله خسر فريق ليفربول بقيادة البرتغالي جوسفالدو فيريرا نظيره تولوز بنتيجة فى المباراة التى جمعتهما اليوم السبت ضمن منافسات الجولة الـ عمر مسابقة الدورى المصرى الممتاز والتى انتهت بفوز المارد الأحمر بهدف رد سجله أحمد سيد زيزو لاعب وسط الفريق الأول لكرة القدم بنادى
``` |