هذا المشروع يهدف إلى التنبؤ بمعدل مغادرة العملاء (Churn) في إحدى شركات الاتصالات من خلال تحليل سلوك العملاء واستخدامهم للخدمات. تم تطبيق نماذج تعلم الآلة لتحديد العوامل المؤثرة في معدل المغادرة.
المهام والتقنيات الرئيسية:
معالجة البيانات (Data Preprocessing):
- تنظيف البيانات والتعامل مع القيم المفقودة وترميز الميزات الفئوية.
- تطبيق مقياس الميزات (Feature Scaling) لتحسين أداء النماذج.
تحليل البيانات الاستكشافي (EDA):
- تحديد الاتجاهات والارتباطات باستخدام المخططات الحرارية (Heatmaps) والرسوم البيانية الإحصائية.
- تحليل العوامل الرئيسية المؤثرة في مغادرة العملاء مثل نوع العقد، عدد مكالمات خدمة العملاء، نوع خدمة الإنترنت، وفترة الاشتراك.
تصوير البيانات (Data Visualization):
- إنشاء تصورات بيانية واضحة وذات تأثير قوي لتوصيل الأفكار الرئيسية بفعالية.
النمذجة التنبؤية (Predictive Modeling):
- تطوير وتقييم عدة نماذج تعلم آلة، مثل:
- الانحدار اللوجستي (Logistic Regression).
- الأشجار القرار (Decision Trees).
- الغابات العشوائية (Random Forest).
- نماذج متقدمة أخرى.
- إنشاء تصورات بيانية فعالة مثل منحنيات ROC وتوزيع العملاء المغادرين لعرض النتائج بوضوح.
تقييم النماذج (Model Evaluation):
- قياس أداء النماذج باستخدام دقة التصنيف (Accuracy)، ومنحنى ROC-AUC، ومعامل F1-score.
- تحديد النموذج الأفضل بناءً على القدرة التنبؤية وإمكانية التفسير.