هذا المشروع يتناول التنبؤ بتسرب العملاء (Churn Prediction) باستخدام عدة نماذج تعلم آلة. يقوم المشروع بالخطوات التالية:
إعداد البيانات (Data Preparation): يتم تحميل بيانات عملاء شركة اتصالات، وتنظيفها، ومعالجة القيم المفقودة، وتحويل المتغيرات الفئوية إلى أرقام، وتقسيم البيانات إلى مجموعات تدريب واختبار.
نموذج الانحدار اللوجستي الأساسي (Baseline Logistic Regression): يتم تدريب نموذج انحدار لوجستي وتقييم أدائه.
AdaBoost: يتم تدريب نموذج AdaBoost وتقييمه.
Gradient Boosting: يتم تدريب نموذج Gradient Boosting وتقييمه.
XGBoost: يتم تدريب نموذج XGBoost وتقييمه.
التقييم (Evaluation): يتم مقارنة أداء جميع النماذج باستخدام مقاييس مثل الدقة (Accuracy)، والمدى (Precision)، والاستدعاء (Recall)، وF1-Score، ومنحنى ROC-AUC.
منحنيات ROC (ROC Curves): يتم رسم منحنيات ROC لجميع النماذج لتصور أدائها.
أهمية الميزات (Feature Importance): يتم تحليل أهمية الميزات لنموذج XGBoost.
توصية عمل نهائية (Final Business Recommendation): يتم تقديم توصية حول أفضل نموذج للاستخدام في التنبؤ بتسرب العملاء، مع التركيز على XGBoost لأدائه العالي في الاستدعاء (Recall) وهو أمر حاسم لتحديد العملاء المحتملين للتسرب