image/jpeg

# ArabicT5 Model for Arabic News Classification and Generation

  • In this model focus on classifying and generating news Arabic.

# The number in the generated text represents the category of the news, as shown below:

category_mapping = {

  'Political':1,
  'Economy':2,
  'Health':3,
  'Sport':4,
  'Culture':5,
  'Technology':6,
  'Art':7,
  'Accidents':8

}

# Training parameters

Training batch size 8
Evaluation batch size 8
Learning rate 1e-4
Max length input 64
Max length target 200
Number workers 4
Epoch 5

# Results

Training Loss 3.20
Classification Accuracy 95.7%
Generation Accuracy 88.87%

# Example usage


from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline

model_name = "Hezam/ArabicT5-49GB-small-classification-generation"
model = T5ForConditionalGeneration.from_pretrained(model_name)
tokenizer = T5Tokenizer.from_pretrained(model_name)
generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer)

text = "أوقفوا القتل الجماعي في غزة"

output= generation_pipeline(text,
                    num_beams=10,
                    max_length=200,
                    top_p=0.9,
                    repetition_penalty = 3.0,
                    no_repeat_ngram_size = 3)[0]["generated_text"]

output

category: 1 article: كتب عبد اللطيف صبح قال الرءيس الفلسطيني محمود عباس في تصريح ل اليوم السابع وقفوا القتل الجماعي في مدينه غزة مءكدا يجب يوقفوا قتل المدنيين العزل في قطاعي غزة والضفه وغزه واوقفوا القتل الجماع

bash
category: 1 article: كتب عبد اللطيف صبح قال الرءيس الفلسطيني محمود عباس في تصريح ل اليوم السابع وقفوا القتل الجماعي في مدينه غزة مءكدا يجب يوقفوا قتل المدنيين العزل في قطاعي غزة والضفه وغزه واوقفوا القتل الجماع
Downloads last month
129
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.