أقسام الموقع: مبادئ عامة

[مقدمة في الذكاء الاصطناعي] 13- استخراج جذور الكلمات لتحليل النص Stemming

درسنا اليوم سيكون بسيط ومختصر ,,,

رأينا في الدرسين السابقين أهمية مدى تكرار المفردات في النصوص وكيف يمكن أن يبين لنا هذا الامر عن فحوى وماهية النص

ولكن نواجه مشكلة بسيطة , سواء في اللغة العربية او الانكليزية أو غيرها من اللغات , نرى كلمات عديدة جداً ولكنها تحمل معنى مشابه

وذلك سببه أن في هذه اللغات يوجد مايدعى بـ جذر الكلمة Word Stem

ومن أي جذر نستطيع بإضافة بعض الأحرف عليه , أن نأتي بعدد كبير من الكلمات تحمل الجذر نفسه

وهذا قد يسبب لنا مشكلة صغيرة أثناء تحليلنا لنص ما

ولذلك نلجئ للتقنيات التي تسمح لنا بأن نعيد أغلب الكلمات داخل النص إلى جذورها الأصلية ومن ثم نعيد تحليلنا للنص ومعرفة الجذور المتكررة

وبهذا بالتأكيد سيسمح لنا بالحصول على نتائج أدق وأفضل

ويمكننا أن نفعل ذلك بواسطة “خوارزمية بورتر Porter Algorithm”

حيث تحدد هذه الخوارزمية مجموعة من القواعد لتجريد الكلمات الى جذورها الأصلية اعتماداً على أنماط الاحرف الساكنة والصوتية أو احرف العلة , وأشهر الكلمات المشتقة بالإضافة لنهايات الكلمات وأيضاً بعض المعايير الاخرى

لن نتطرق في درس اليوم الى أمثلة على ذلك وسنترك المجال لشرح هذه الخوارزمية مستقبلاً .

وهذه بعض الأمثلة على عدة مشتقات لها جذر واحد :

sweetness

sweeting

sweetening

وكلها كلمات مشتقة من الجذر sweet .

  • فراس معن
Firas Maan

آخر المنشورات

  • أخبار
  • تعلم الآلة

كيفية تحميل واستخدام برنامج FakeApp v2.2.0

كيفية تحميل واستخدام برنامج FakeApp v2.2.0 تقنية تبديل الوجوه Face swap technology رابط التحميل : https://www.fakeapp.org/download رابط تحميل ثاني: https://www.filehorse.com/download-fakeapp/…

شهرين مضت
  • أخبار
  • تعلم الآلة

8 أمثلة على برامج DeepFake الزيف العميق وكيفية استخدامه

بعض الأمثلة العميقة مقنعة بشكل لا يصدق. يعرضون كيف يمكن لتكنولوجيا التعلم العميق تحويل أشكال للفنانين وصانعي الأفلام ثلاثية الأبعاد…

شهرين مضت
  • أخبار

برنامج DeepFake أونلاين لصناعة الفيديوهات المزيفة بدون تحميل

لم يمضي وقت كبير عندما قام أحد مستخدمي منصة reddit  يسمى ديب فيك Deep fake بنشر فيديوهات واقعية وذات جودة…

سنة واحدة مضت
  • تعلم الآلة
  • مبادئ عامة

انشاء شبكة عصبية اصطناعية بسيطة Artificial Neural Network, الجزء الأول

0- تمهيد لدينا بعض المعلومات عن أزهار موجودة في الحديقة كان الباحث يسجل (طول ساق الزهرة) و(عرض ساق الزهرة) و…

سنة واحدة مضت
  • أخبار

“شمرا أكاديميا” محرك بحث لمشاريع التخرج والابحاث العلمية السورية لطلاب الجامعات والباحثين

"شمرا أكاديميا" هي خدمة يقدمها محرك البحث السوري الأول "شمرا" وتعتبر خدمة "شمرا أكاديميا" كمحرك بحث خاص بالمؤلفات العلمية والأكاديمية…

سنتين مضت
  • تعلم الآلة

[Scikit Learn] شرح عمل برنامج للتنبؤ بالقيم بخوارزمية Linear Regression

تعد خوارزمية المنحني الخطي/الانحدار الخطي Linear Regression من أشهر خوارزميات تعلم الالة وهي تدخل ضمن تصنيف التعلم بإشراف Supervised Learning…

سنتين مضت