AraBART-AHS / README.md
benakrab's picture
Create README.md
131c6a0 verified
|
raw
history blame
1.96 kB
---
license: apache-2.0
language:
- ar
tags:
- Summarization
- Arabic Headline Dataset
- AHS
- AraBART
---
# AraBART-AHS
### Model Description
**AraBART-AHS** is a fine-tuned version of [AraBART](https://huggingface.co/moussaKam/AraBART) model on [Arabic Headline Dataset (AHS)](https://journalofbigdata.springeropen.com/articles/10.1186/s40537-020-00386-7).
## Uses
This model is intended to be used to generate Arabic abstractive summaries in particular headlines of articles.
### How to Use
```python
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer, pipeline
model_name = "benakrab/AraBART-AHS"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
summarizer = pipeline("summarization", model=model, tokenizer=tokenizer)
text = "ينصح بممارسة الكتابة بشكل يومي ، وجعلها روتينا يوميا ؛ و ذلك لتطوير المهارات اللغوية و الكتابية و تحسينها ، إذ إنه كلما كتب الشخص أكثر كلما شعر بتطور أكبر ، و لذلك يجب تخصيص وقت لكتابة فقرة على الأقل ، أو صفحة كاملة يوميا ، و يمكن الاستيقاظ باكرا للكتابة ، أو النوم متأخرا بعد كتابة فقرة ما ، و لو لفترة قصيرة لا تتعدى خمس عشرة دقيقة عند عدم وجود وقت كاف أثناء النهار"
summary = summarizer(text)[0].get("summary_text")
print(summary)
```
## Citation
```bibtex
@inproceedings{Benbarka-2024-arabart-ahs,
title = "Fine-Tuning AraBART on AHS dataset for Arabic Abstractive Summarization",
author = "Mustapha Benbarka and Moulay Abdellah Kassimi",
booktitle = "Proceedings of the Eighth International Conference on Arabic Language Processing",
year = "2024",
publisher = "Accepted, to be pusblished in CCIS series Springer",
}
```