تفاصيل العمل

هذا المشروع كان بمثابة دراسة متعمقة في التعامل مع تحديات التعلم الآلي في العالم الحقيقي، خصوصًا مشكلة عدم توازن البيانات (Class Imbalance)، تقييم النماذج، و هندسة الخصائص (Feature Engineering).

أهم الجوانب التقنية:

بناء نموذج تصنيفي باستخدام Random Forest Classifier من مكتبة scikit-learn.

معالجة مشكلة عدم توازن البيانات باستخدام SMOTE (Synthetic Minority Over-sampling Technique) لتحسين قدرة النموذج على التعميم.

استخدام class_weight='balanced' لجعل النموذج أكثر حساسية للفئة الأقل تمثيلًا (Minority Class).

ضبط عتبة التنبؤ (Prediction Threshold) لزيادة معدل الاستدعاء (Recall) لفئة العملاء المهددين بترك الخدمة (Churn Class)، وهي الفئة الأكثر أهمية من منظور الأعمال.

تقييم أداء النموذج باستخدام: مصفوفة الالتباس (Confusion Matrix)، تقرير التصنيف (Classification Report)، والرسوم البيانية (ROC Curve, Precision-Recall Curve).

النتائج:

الدقة الكلية (Accuracy): 79%

معدل الاستدعاء (Recall) لفئة العملاء الذين سيتركون البنك (Churn = 1): 70%

تحسين قدرة النموذج على اكتشاف العملاء المهددين بترك الخدمة مع الحفاظ على مستوى جيد من الدقة (Precision).

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
3
تاريخ الإضافة
تاريخ الإنجاز
المهارات