مبادئ عامة

[مقدمة في الذكاء الاصطناعي] 6- تقنية التصنيف Classification في تعلم الالة

الان حان الوقت لنطلع على تقنية اخرى في التعلم بإشراف Machine Supervised Learning

وتدعى “التصنيف Classification”

 

التصنيف هي تقنية تستطيع أن تتنبأ التصنيف او القسم الذي ينتمي اليه شيء ما .
وأبسط مثال هو التصنيف الثنائي Binary Classification حيث ينتمي الشيء إما الى المجموعة A أو الى المجموعة  B

وهو غالباً يستخدم لمعرفة ان كانت احدى خواص الشيء الذي ندرسه إما صحيحة True أو خاطئة False .

 

على سبيل المثال, افترض انه لدينا عدد من المرضى في العيادة, ونحن نجمع عنهم بعض المعلومات والتفاصيل الشخصية ونجري بعض الفحوصات, عندها نستطيع معرفة من منهم مصاب بمرض السكري, ومن منهم سليم من هذا المرض.

 

يمكن لبرنامجنا أن يصنع دالة يمكن تطبيقها على معلومات المرضى وتعطينا كنتيجة إما 1 اذا كان الشخص مريض بالسكري, او 0 اذا كان سليم من المرض .

 

بشكل عام, مصنِف ثنائي Binary Classifier, هو دالة تأخذ خواص ومعلومات المرضى كمدخل X, وتعطينا 1 أو 2 كنتيجة/مخرج Y

 

في الواقع أن الدالة لن تحسب القيمة 1 أو 0 بشكل تام, بل ستعطينا أرقام عشرية بين الـ1 و الـ0

وعندها نستطيع انشاء حد فاصل لنقرر أياً من القيم ستكون بمثابة 1, وأياً منها سيكون بمثابة 0

وعندما نستخدم هذا النموذج Model في برنامجنا ليتنبئ بقيم, القيم الناتجة سيتم تصنيفها إما كـ1 أو كـ0 , وذلك حسب الطرف الذي تقع عليه القيم من الحد الفاصل

 

— كل القيم بين 1 و الحد الفاصل (0.5) سيعتبرها البرنامج كـ1

–وكذلك كل القيم بين 0 والحد الفاصل (0.5) سيعتبرها البرنامج كـ0

 

وبما أن التصنيف Classification هو أحد تقنيات تعلم الالة بإشراف Machine Supervised Learning ,,, سوف نحتفظ ببعض البيانات التي لدينا عن المرضى لكي نجربها لاحقاً لنرى مدى دقة البرنامج والنموذج .

 

في الحالات إذا توقع البرنامج قيمة 1 ولاحظنا حسب فحوصاتنا الحقيقية على المريض فعلاً أن النتيجة 1, عندها يمكن اعتبار نتيجة الفحص وتوقع البرنامج “إيجابي حقيقية True Positive”

أما اذا توقع البرنامج قيمة 0 ولاحظنا على المريض فعلاً أن النتيجة يجب أن تكون 0 , عندها ندعو هذه الحالة “سلبي حقيقي True Negative”

أما اذا توقع البرنامج قيمة 1 ولكن كنا نعلم أن الشخص غير مصاب, أي أن نتيجته يجب أن تكون 0 , ندعو هذه الحالة “إيجابي خاطئ False Positive”

واذا توقع البرنامج قيمة 0 وكان الشخص مصاب بالمرض, أي نتيجته 1 , ندعو هذه الحالة “سلبي خاطئ False Negative”

 

والان, اختيار “الحد الفاصل Threshold” الذي تكلمنا عنه مسبقاً, هو فعلاً من يحدد التصنيف الذي تتبع له كل نتيجة .

وفي بعض الحالات يمكن أن تقع النتيجة المتوقعة بمكان قريب جداً من الحد الفاصل ولذلك قد يخطئ في تصنيفها الصحيح .

 

ومن الجميل جداً أنه يمكننا أن نغير مكان الحد الفاصل حسب حاجتنا ومانريد .

فمثلاً في مثالنا أعلاه عن مرضى السكري ,, من الجيد لنا أن يكون لدينا عدد كبير من الحالات “إيجابي خاطئ”, وأن يكون لدينا حالات قليلة من “سلبي خاطئ”

وذلك حتى يحصل أكبر عدد ممكن على العناية الطبية اللازمة للتأكد من ان كان فعلاً مريض بالسكري , وطبعاً هذا “العدد الاكبر” لن يتم اختياره عشوائياً , بل حسب تقنيات الذكاء الصنعي وتعلم الالة وبذلك نعلم أن لهذا الشخص فعلاً احتمال حقيقي أن يكون مصاباً بالمرض .

 

 

الدرس عن تقنية التصنيف Classification لم ينته بعد .. وسيتم اكمال شرح بعض المفاهيم المتعلقة به في الدرس القادم …

 

 – فراس معن

اترك تعليقاً