يهدف هذا المشروع إلى فهم وتحليل سلوك عملاء Spotify وتحديد العوامل الرئيسية التي تؤدي إلى (إلغاء الاشتراك).
من خلال تحليل بيانات حقيقية تحتوي على أكثر من 8000 مستخدم، قمت ببناء لوحة تحكم تفاعلية ونموذج تنبؤي يساعد Spotify على التنبؤ بالعملاء المهددين بإلغاء الاشتراك، مما يمكّن الشركة من اتخاذ إجراءات احتفاظية (Retention) فعالة قبل حدوث الخسارة.
ما قمت به في المشروع:
فهم الأعمال واستكشاف البيانات (EDA)
تحليل شامل للبيانات واكتشاف أن معدل الـ Churn يبلغ 25.9% (بيانات غير متوازنة).
هندسة الميزات (Feature Engineering)
إنشاء متغيرات جديدة مهمة مثل:
daily_skips, engagement_score, ad_exposure_ratio
skip_age_interaction, is_premium_family, high_skip_user
المعالجة المسبقة للبيانات
بناء Pipeline احترافي باستخدام Scikit-learn يحتوي على:
Scaling للمتغيرات الرقمية
One-Hot Encoding للمتغيرات الفئوية
Ordinal Encoding لمتغيرات الترتيب
بناء لوحة تحكم احترافية
Dashboard باستخدام Matplotlib + Seaborn بألوان أسود، أخضر، أحمر.
عرض العوامل الرئيسية للـ Churn (خاصة مشتركي Family ومستخدمي Mobile).
بناء وتقييم النموذج
تدريب نموذج Logistic Regression مع معالجة عدم التوازن (class_weight='balanced')
تقييم النموذج باستخدام:
Precision, Recall, AUC Score
Confusion Matrix (Heatmap)
Cross Validation (5-Fold)
نتائج المشروع ومخرجاته:
لوحة تحكم واضحة تُظهر أن أهم عوامل الـ Churn هي:
اشتراك Family (أعلى نسبة churn)
استخدام Mobile كجهاز رئيسي
معدل تخطي الأغاني المرتفع (skip_rate)
نموذج تنبؤي يعطي:
Recall = 45.89% (يكتشف نسبة جيدة من العملاء المهددين)
Precision = 24.80%
AUC = 0.5014
Cross Validation أكد استقرار النموذج.
الفائدة المتوقعة للعميل:
يساعد هذا المشروع Spotify على:
تقليل معدل churn
توفير تكاليف اكتساب عملاء جدد
تصميم حملات احتفاظ مستهدفة (Targeted Retention Campaigns)
اتخاذ قرارات مبنية على البيانات