يعتبر الحفاظ على العملاء محركا رئيسيا للربحية في الشركات التي تعتمد على نظام الاشتراكات. قمت في هذا المشروع بتطوير نظام تنبؤي لتحديد العملاء المعرضين لخطر الرحيل قبل مغادرتهم. من خلال تحليل أنماط الاستخدام وأنواع العقود وتاريخ الدفع يوفر النموذج رؤى قابلة للتنفيذ لمساعدة فرق التسويق على تنفيذ استراتيجيات احتفاظ استباقية.
المهام التقنية التي قمت بتنفيذها
1 معالجة وهندسة البيانات عبر تنفيذ استراتيجية مزدوجة لاستخدام تقنيات الترميز وتحويل المتغيرات الفئوية إلى صيغ برمجية مفهومة مع تطبيق التحجيم القياسي لضمان دقة الخوارزميات.
2 معالجة عدم توازن البيانات نظرا لأن العملاء الراحلين يمثلون أقلية عادة استخدمت تقنية سموت لموازنة مجموعة التدريب مما منع النموذج من الانحياز تجاه العملاء غير الراحلين.
3 تطوير النماذج والمقارنة بين عدة خوارزميات تشمل الانحدار اللوجستي والغابات العشوائية وأجهزة المتجهات الداعمة وإكس جي بوست لتحديد التوازن الأفضل بين الدقة والاستدعاء.
4 تحسين الأداء باستخدام إطار العمل اوبتونا لإجراء بحث متقدم عن أفضل المعلمات لنموذج الغابات العشوائية مما ساهم في تعزيز قدرة النموذج على التعميم.
5 التقييم والتحليل عبر التركيز على مقاييس الاستدعاء واف ون سكور لضمان تحديد أكبر عدد ممكن من العملاء المعرضين للرحيل مع تحليل مصفوفة الارتباك لتقليل الأخطاء في التنبؤ.
النتائج المحققة
بناء نموذج قادر على التمييز بدقة بين العملاء الأوفياء والعملاء المعرضين للمغادرة.
تطوير خط إنتاج بيانات منظم يسهل تحديثه ببيانات العملاء الجديدة شهريا.
استخراج رؤى تجارية واضحة حول الدوافع الرئيسية لرحيل العملاء مثل طول مدة العقد والرسوم الشهرية.
الأدوات والتقنيات المستخدمة
لغة بايثون ومكتبات pandas و numpy
تقنية SMOTE لمعالجة عدم توازن البيانات
خوارزميات Random Forest و XGBoost و SVC
أداة Optuna لتحسين النماذج
مكتبات Matplotlib و Seaborn للتحليل البياني للمؤشرات