مبادئ عامة

[مقدمة في الذكاء الاصطناعي]: 5- مقياس الانحدار Regression في تعلم الآلة

بدءاً بالتعلم بإشراف Supervised Learning ..

 

لنفرض أن لدي بعض البيانات حول صحة بعض الأشخاص

وأعرف التمرين الذي قاموا به وكم حرقوا من السعرات الحرارية (كالوريز) ووو..الخ

وأريد برمجة برنامج يعتمد على الذكاء الصنعي وتعلم الآلة لكي يتنبأ بعدد السعرات الحرارية المتوقع أن يحرقها الشخص عندما يقوم بتمارين رياضية مشابهة .

 

عندما نريد أن نتوقع قيمة عددية مثل كمية النقود او درجة الحرارة او عدد السعرات الحرارية ,

عندها نستخدم تقنية في التعلم بإشراف, تدعى “الانحدار Regression”

 

على سبيل المثال ..

لنفرض أن “أمجد” هو مشارك في البحث الذي نقوم به حول الصحة

وهو الان يقوم بأحد التمارين الرياضية ..

نحنا عندها نكون قد جمعنا بيانات عن أمجد قبل أن يبدأ بالتمارين, وأثناء قيامه بالتمارين نكون قد جمعنا معلومات أكثر عنه

 

الآن نريد أن نقوم بنمذجة Modeling السعرات الحرارية التي تم حرقها باستخدام الخصائص التي نعرفها عن المتدرب أمجد مثل عمره ووزنه ومعدل ضربات القلب و مدة التمرين وهكذا ..الخ

في هذه الحالة نحن نعلم كل الخصائص ونعلم أنها تتبع لتصنيف الـ “231” سعرة حرارية (مثلاً)

 

في هذه الحالة نحن نريد من خوارزمية برنامجنا ان تتعلم الدالة التي تأخذ خصائص المتدرب أمجد (وزنه, عمره …الخ) كمداخل X, وتعطينا عدد السعرات الحرارية المتوقع أن يحرقها “231 كالوري”, كمخرج Y

 

وهنا طبعاً من المهم الإشارة إلى أن نموذجنا عن شخص متدرب واحد, لايمكن ان يتم تعميمه على عدة أمثلة اخرى … اذن ماذا نفعل ؟؟

– نقوم بجمع نفس نوعية البيانات عن عدة أشخاص متدربين متنوعين بحيث نشكل قاعدة بيانات لكل متدرب وخصائص , ونستفيد منها في “تدريب” برنامجنا لكي يعطي نتائج أدق وأفضل ونموذج يمكن تعميمه .

 

وبعد أن نكون قد انتهينا من تدريب برنامجنا, أصبح لدينا دالة يمكن تعميمها على عدة أمثلة عن أشخاص متدربين جدد وستعطينا نتائج دقيقة

 

والان يمكننا ان نعرض على برنامجنا عدة أمثلة ليتوقع لنا عدد السعرات الحرارية المتوقع ان يتم حرقها, ونقوم نحن بمقارنتها مع النتائج الحقيقية على أرض الواقع … وهنا في هذه المرحلة سنلاحظ وجود اختلاف طفيف غالباً بين الرقمين

والفرق بين النتيجة المتوقعة والنتيجة الحقيقية يُسمى بـ “المخلفات Residuals”

وقيمة “المخلفات” هنا يمكنها أن تخبرنا شيئاً عن مدى دقة البرنامج ونسبة الخطأ فيه

 

ويوجد عدة طرق يمكننا من خلالها حساب مدى الخطأ في البرنامج ومن هذه الطرق :

  •  الانحراف المعياري للخطأ
  • المتوسط المطلق للخطأ

 

على سبيل المثال..

اذا كانت قيمة الانحراف المعياري للخطأ تساوي 5

فهذا يعني أن معدل الخطأ في برنامجنا هو 5 سعرات حرارية

وبالطبع القيم المطلقة يمكن أن تتنوع كثيراً اعتماداً على مانحسبه

 

واذا كانت القيمة 5 هي معدل الخطأ لعدد السعرات الحرارية في برنامجنا فهذا رقم جداً منطقي ويدل على أن برنامجنا جيد جداً

 

ولكن لو كان الهدف من برنامجنا هو حساب كم عدد ساعات التمرين وكانت قيمة الانحراف المعياري للخطأ تساوي 5

فهذا يعني أن معدل الخطأ ببرنامجنا هو 5 ساعات ! وهو خطأ كارثي طبعاً

 

ولذلك يفضل أن نستخدم مقاييس نسبية مناسبة لنموذجنا لتعطينا مستوى عام من معدل الخطأ بمقاييس نسبية بين الصفر و الواحدة

 

الخطأ النسبي المطلق و جذر الخطأ النسبي تعطينا مقاييس حيث كلما كانت القيمة أقرب للصفر كان البرنامج أفضل و أدق

و معامل التحديد الذي ندعوه أحياناً (R مربع) Coefficient of determination هو أيضاً مقياس نسبي جيد, ولكن في هذه الحالة كلما كانت قيمته أقرب للواحد كلما كان برنامجنا أدق .

 

 

وبالتأكيد سنأتي على شرح جميع المفاهيم المذكورة في المنشور أعلاه تدريجياً على موقعنا عالم الذكاء الاصطناعي

 

 

 – فراس معن

اترك تعليقاً