|
--- |
|
license: apache-2.0 |
|
language: |
|
- ar |
|
tags: |
|
- Summarization |
|
- Arabic Headline Dataset |
|
- AHS |
|
- AraBART |
|
--- |
|
# AraBART-AHS |
|
|
|
### Model Description |
|
|
|
**AraBART-AHS** is a fine-tuned version of [AraBART](https://huggingface.co/moussaKam/AraBART) model on [Arabic Headline Dataset (AHS)](https://journalofbigdata.springeropen.com/articles/10.1186/s40537-020-00386-7). |
|
|
|
## Uses |
|
|
|
This model is intended to be used to generate Arabic abstractive summaries in particular headlines of articles. |
|
|
|
### How to Use |
|
|
|
```python |
|
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer, pipeline |
|
|
|
|
|
model_name = "benakrab/AraBART-AHS" |
|
|
|
tokenizer = AutoTokenizer.from_pretrained(model_name) |
|
model = AutoModelForSeq2SeqLM.from_pretrained(model_name) |
|
|
|
summarizer = pipeline("summarization", model=model, tokenizer=tokenizer) |
|
|
|
|
|
text = "ينصح بممارسة الكتابة بشكل يومي ، وجعلها روتينا يوميا ؛ و ذلك لتطوير المهارات اللغوية و الكتابية و تحسينها ، إذ إنه كلما كتب الشخص أكثر كلما شعر بتطور أكبر ، و لذلك يجب تخصيص وقت لكتابة فقرة على الأقل ، أو صفحة كاملة يوميا ، و يمكن الاستيقاظ باكرا للكتابة ، أو النوم متأخرا بعد كتابة فقرة ما ، و لو لفترة قصيرة لا تتعدى خمس عشرة دقيقة عند عدم وجود وقت كاف أثناء النهار" |
|
|
|
summary = summarizer(text)[0].get("summary_text") |
|
print(summary) |
|
|
|
``` |
|
|
|
## Citation |
|
```bibtex |
|
@inproceedings{Benbarka-2024-arabart-ahs, |
|
title = "Fine-Tuning AraBART on AHS dataset for Arabic Abstractive Summarization", |
|
author = "Mustapha Benbarka and Moulay Abdellah Kassimi", |
|
booktitle = "Proceedings of the Eighth International Conference on Arabic Language Processing", |
|
year = "2024", |
|
publisher = "Accepted, to be pusblished in CCIS series Springer", |
|
} |
|
``` |