أقسام الموقع: مبادئ عامة

[مقدمة في الذكاء الاصطناعي] 13- استخراج جذور الكلمات لتحليل النص Stemming

درسنا اليوم سيكون بسيط ومختصر ,,,

رأينا في الدرسين السابقين أهمية مدى تكرار المفردات في النصوص وكيف يمكن أن يبين لنا هذا الامر عن فحوى وماهية النص

ولكن نواجه مشكلة بسيطة , سواء في اللغة العربية او الانكليزية أو غيرها من اللغات , نرى كلمات عديدة جداً ولكنها تحمل معنى مشابه

وذلك سببه أن في هذه اللغات يوجد مايدعى بـ جذر الكلمة Word Stem

ومن أي جذر نستطيع بإضافة بعض الأحرف عليه , أن نأتي بعدد كبير من الكلمات تحمل الجذر نفسه

وهذا قد يسبب لنا مشكلة صغيرة أثناء تحليلنا لنص ما

ولذلك نلجئ للتقنيات التي تسمح لنا بأن نعيد أغلب الكلمات داخل النص إلى جذورها الأصلية ومن ثم نعيد تحليلنا للنص ومعرفة الجذور المتكررة

وبهذا بالتأكيد سيسمح لنا بالحصول على نتائج أدق وأفضل

ويمكننا أن نفعل ذلك بواسطة “خوارزمية بورتر Porter Algorithm”

حيث تحدد هذه الخوارزمية مجموعة من القواعد لتجريد الكلمات الى جذورها الأصلية اعتماداً على أنماط الاحرف الساكنة والصوتية أو احرف العلة , وأشهر الكلمات المشتقة بالإضافة لنهايات الكلمات وأيضاً بعض المعايير الاخرى

لن نتطرق في درس اليوم الى أمثلة على ذلك وسنترك المجال لشرح هذه الخوارزمية مستقبلاً .

وهذه بعض الأمثلة على عدة مشتقات لها جذر واحد :

sweetness

sweeting

sweetening

وكلها كلمات مشتقة من الجذر sweet .

  • فراس معن
Firas Maan

آخر المنشورات

  • أخبار

برنامج DeepFake أونلاين لصناعة الفيديوهات المزيفة بدون تحميل

لم يمضي وقت كبير عندما قام أحد مستخدمي منصة reddit  يسمى ديب فيك Deep fake بنشر فيديوهات واقعية وذات جودة…

9 أشهر مضت
  • تعلم الآلة
  • مبادئ عامة

انشاء شبكة عصبية اصطناعية بسيطة Artificial Neural Network, الجزء الأول

0- تمهيد لدينا بعض المعلومات عن أزهار موجودة في الحديقة كان الباحث يسجل (طول ساق الزهرة) و(عرض ساق الزهرة) و…

9 أشهر مضت
  • أخبار

“شمرا أكاديميا” محرك بحث لمشاريع التخرج والابحاث العلمية السورية لطلاب الجامعات والباحثين

"شمرا أكاديميا" هي خدمة يقدمها محرك البحث السوري الأول "شمرا" وتعتبر خدمة "شمرا أكاديميا" كمحرك بحث خاص بالمؤلفات العلمية والأكاديمية…

سنة واحدة مضت
  • تعلم الآلة

[Scikit Learn] شرح عمل برنامج للتنبؤ بالقيم بخوارزمية Linear Regression

تعد خوارزمية المنحني الخطي/الانحدار الخطي Linear Regression من أشهر خوارزميات تعلم الالة وهي تدخل ضمن تصنيف التعلم بإشراف Supervised Learning…

سنة واحدة مضت
  • أخبار

“جوليا” لغة برمجة الذكاء الاصطناعي المنتظرة !

Follow my blog with Bloglovin "جوليا Julia" هي لغة برمجة عالية المستوى متعددة الاغراض , صممت في البداية لتوافق احتياجات…

سنة واحدة مضت
  • أخبار

برامج Deep Fake لانتاج المشاهد المفبركة بالذكاء الاصطناعي

لندن - نيويورك: «الشرق الأوسط» تصور مشهداً لغرفة فيها كنبة حمراء، ونبتة في حوض، ولمسة من الفنّ الخفيف الذي نراه…

سنة واحدة مضت