قمت بتنفيذ تحليل استكشافي شامل للبيانات (EDA) لفهم سلوك العملاء والعوامل المؤثرة في قرار الانسحاب، حيث شمل ذلك:
تحليل توزيع المتغيرات العددية والفئوية
دراسة العلاقة بين الخصائص وهدف الـ Churn
اكتشاف القيم الشاذة ومعالجتها
فحص توازن البيانات
تحليل الارتباط بين المتغيرات
بعد فهم البيانات بشكل عميق، قمت ببناء Pipeline متكاملة لضمان تنظيم الخطوات ومنع تسريب البيانات (Data Leakage)، وتضمنت:
معالجة القيم المفقودة
Encoding للمتغيرات الفئوية
دمج المعالجة المسبقة مع النموذج داخل Pipeline واحدة
استخدام Cross-Validation لضمان تقييم عادل ومستقر للأداء