مشكلة في الكياتات التي التصقت بها حروف

#3
by shhada - opened

السلام عليكم ورحمة الله وبركاته
جزاكم الله خيراً على العمل المميز، ولكن لاحظت أنه لا يستخرج الكيانات إذا التصق بها حرف ما، مثلاً في النص التالي:
حدثنا قتيبة حدثنا عبد الوهاب عن أيوب عن ابن أبي مليكة عن عقبة بن الحارث قال جيء بالنعيمان أو بابن النعيمان شاربا فأمر النبي صلى الله عليه وسلم من كان بالبيت أن يضربوه قال فضربوه فكنت أنا فيمن ضربه بالنعال.
لن يستخرج (النعيمان) و(ابن النعيمان) و(البيت) و(النعال)؛ بسبب التصاق حرف (ب) بها، ولو فصلنا حرف (ب) عنها بمسافة لحُلَّت المشكلة، ولكن هذا شاق يدوياً وخاصة مع النصوص الكبيرة.

وكذلك الحال في المثال التالي:
حدثنا سعيد بن منصور وقتيبة بن سعيد وأبو كامل الجحدري - واللفظ لسعيد - قالوا حدثنا أبو عوانة عن سماك بن حرب عن مصعب بن سعد قال دخل عبد الله بن عمر على ابن عامر يعوده وهو مريض فقال ألا تدعو الله لي يا ابن عمر قال إني سمعت رسول الله صلى الله عليه وسلم يقول «لا تقبل صلاة بغير طهور ولا صدقة من غلول وكنت على البصرة».
لن يستخرج (قتيبة بن سعيد) و(أبو كامل الجحدري) و(لسعيد)؛ بسبب التصاق حرف (و) بها.

حاولت تصحيح الأمر بتعديل الكود، ولكن فيه بعض الثغرات، فهل لديكم حل مثالي لهذه المشكلة؟

Sign up or log in to comment