Update README with Acknowledgment list
Browse files
README.md
CHANGED
@@ -4,7 +4,8 @@ datasets:
|
|
4 |
- Marefa-NER
|
5 |
---
|
6 |
|
7 |
-
#
|
|
|
8 |
|
9 |
## Model description
|
10 |
|
@@ -21,15 +22,20 @@ Person, Location, Organization, Nationality, Job, Product, Event, Time, Art-Work
|
|
21 |
|
22 |
## How to use كيف تستخدم النموذج
|
23 |
|
24 |
-
Install transformers
|
25 |
|
26 |
-
`$ pip3 install transformers==4.3.0`
|
27 |
|
28 |
> If you are using `Google Colab`, please restart your runtime after installing the packages.
|
29 |
|
30 |
-----------
|
31 |
|
32 |
```python
|
|
|
|
|
|
|
|
|
|
|
33 |
from transformers import AutoTokenizer, AutoModelForTokenClassification
|
34 |
from transformers import pipeline
|
35 |
|
@@ -43,6 +49,9 @@ nlp = pipeline("ner", model=model, tokenizer=tokenizer, grouped_entities=True)
|
|
43 |
|
44 |
# ===== extract the entities from a sample text
|
45 |
example = 'قاد عمر المختار القوات في ليبيا ضد الجيش الإيطالي'
|
|
|
|
|
|
|
46 |
ner_results = nlp(example)
|
47 |
|
48 |
# ===== print the ner_results
|
@@ -55,4 +64,33 @@ for ent in ner_results:
|
|
55 |
# الجيش الإيطالي -> organization # score: 0.99
|
56 |
####
|
57 |
|
58 |
-
```
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
- Marefa-NER
|
5 |
---
|
6 |
|
7 |
+
# Tebyan تبيـان
|
8 |
+
## Marefa Arabic Named Entity Recognition Model نموذج المعرفة لتصنيف أجزاء النص
|
9 |
|
10 |
## Model description
|
11 |
|
|
|
22 |
|
23 |
## How to use كيف تستخدم النموذج
|
24 |
|
25 |
+
Install transformers AND nltk
|
26 |
|
27 |
+
`$ pip3 install transformers==4.3.0 nltk==3.5`
|
28 |
|
29 |
> If you are using `Google Colab`, please restart your runtime after installing the packages.
|
30 |
|
31 |
-----------
|
32 |
|
33 |
```python
|
34 |
+
# we need to install NLTK punkt to be used for word tokenization
|
35 |
+
import nltk
|
36 |
+
nltk.download('punkt')
|
37 |
+
from nltk.tokenize import word_tokenize
|
38 |
+
|
39 |
from transformers import AutoTokenizer, AutoModelForTokenClassification
|
40 |
from transformers import pipeline
|
41 |
|
|
|
49 |
|
50 |
# ===== extract the entities from a sample text
|
51 |
example = 'قاد عمر المختار القوات في ليبيا ضد الجيش الإيطالي'
|
52 |
+
# clean the text
|
53 |
+
example = " ".join(word_tokenize(example))
|
54 |
+
# feed to the NER model to parse
|
55 |
ner_results = nlp(example)
|
56 |
|
57 |
# ===== print the ner_results
|
|
|
64 |
# الجيش الإيطالي -> organization # score: 0.99
|
65 |
####
|
66 |
|
67 |
+
```
|
68 |
+
|
69 |
+
## Acknowledgment شكر و تقدير
|
70 |
+
|
71 |
+
قام بإعداد البيانات التي تم تدريب النموذج عليها, مجموعة من المتطوعين الذين قضوا ساعات يقومون بتنقيح البيانات و مراجعتها
|
72 |
+
|
73 |
+
- على سيد عبد الحفيظ - إشراف
|
74 |
+
- نرمين محمد عطيه
|
75 |
+
- احمد علي عبدربه
|
76 |
+
- عمر بن عبد العزيز سليمان
|
77 |
+
- محمد ابراهيم الجمال
|
78 |
+
- عبدالرحمن سلامه خلف
|
79 |
+
- إبراهيم كمال محمد سليمان
|
80 |
+
- حسن مصطفى حسن
|
81 |
+
- أحمد فتحي سيد
|
82 |
+
- عثمان مندو
|
83 |
+
- عارف الشريف
|
84 |
+
- أميرة محمد محمود
|
85 |
+
- حسن سعيد حسن
|
86 |
+
- عبد العزيز علي البغدادي
|
87 |
+
- واثق عبدالملك الشويطر
|
88 |
+
- عمرو رمضان عقل الحفناوي
|
89 |
+
- حسام الدين أحمد على
|
90 |
+
- أسامه أحمد محمد محمد
|
91 |
+
- حاتم محمد المفتي
|
92 |
+
- عبد الله دردير
|
93 |
+
- أدهم البغدادي
|
94 |
+
- أحمد صبري
|
95 |
+
- عبدالوهاب محمد محمد
|
96 |
+
- أحمد محمد عوض
|