نموذج تعلم آلة للتنبؤ بمغادرة العملاء في spotify

تفاصيل العمل

يهدف هذا المشروع إلى فهم وتحليل سلوك عملاء Spotify وتحديد العوامل الرئيسية التي تؤدي إلى (إلغاء الاشتراك).

من خلال تحليل بيانات حقيقية تحتوي على أكثر من 8000 مستخدم، قمت ببناء لوحة تحكم تفاعلية ونموذج تنبؤي يساعد Spotify على التنبؤ بالعملاء المهددين بإلغاء الاشتراك، مما يمكّن الشركة من اتخاذ إجراءات احتفاظية (Retention) فعالة قبل حدوث الخسارة.

ما قمت به في المشروع:

فهم الأعمال واستكشاف البيانات (EDA)

تحليل شامل للبيانات واكتشاف أن معدل الـ Churn يبلغ 25.9% (بيانات غير متوازنة).

هندسة الميزات (Feature Engineering)

إنشاء متغيرات جديدة مهمة مثل:

daily_skips, engagement_score, ad_exposure_ratio

skip_age_interaction, is_premium_family, high_skip_user

المعالجة المسبقة للبيانات

بناء Pipeline احترافي باستخدام Scikit-learn يحتوي على:

Scaling للمتغيرات الرقمية

One-Hot Encoding للمتغيرات الفئوية

Ordinal Encoding لمتغيرات الترتيب

بناء لوحة تحكم احترافية

Dashboard باستخدام Matplotlib + Seaborn بألوان أسود، أخضر، أحمر.

عرض العوامل الرئيسية للـ Churn (خاصة مشتركي Family ومستخدمي Mobile).

بناء وتقييم النموذج

تدريب نموذج Logistic Regression مع معالجة عدم التوازن (class_weight='balanced')

تقييم النموذج باستخدام:

Precision, Recall, AUC Score

Confusion Matrix (Heatmap)

Cross Validation (5-Fold)

نتائج المشروع ومخرجاته:

لوحة تحكم واضحة تُظهر أن أهم عوامل الـ Churn هي:

اشتراك Family (أعلى نسبة churn)

استخدام Mobile كجهاز رئيسي

معدل تخطي الأغاني المرتفع (skip_rate)

نموذج تنبؤي يعطي:

Recall = 45.89% (يكتشف نسبة جيدة من العملاء المهددين)

Precision = 24.80%

AUC = 0.5014

Cross Validation أكد استقرار النموذج.

الفائدة المتوقعة للعميل:

يساعد هذا المشروع Spotify على:

تقليل معدل churn

توفير تكاليف اكتساب عملاء جدد

تصميم حملات احتفاظ مستهدفة (Targeted Retention Campaigns)

اتخاذ قرارات مبنية على البيانات

بطاقة العمل

اسم المستقل
عدد الإعجابات
2
عدد المشاهدات
3
تاريخ الإضافة
تاريخ الإنجاز
المهارات