في المشروع ده قمت بتحليل بيانات أكثر من 100,000 راكب على خطوط طيران مختلفة، والهدف كان التنبؤ بمستوى رضا الراكب بناءً على بيانات رحلته وتقييماته للخدمات.
المراحل اللي اتعملت:
- تحليل استكشافي كامل للبيانات (EDA) مع Visualizations احترافية
- معالجة القيم المفقودة وتحويل البيانات النصية لأرقام
- تدريب ومقارنة 3 موديلز: Logistic Regression، Random Forest، Gradient Boosting
- تقييم الموديلز باستخدام Accuracy، F1-Score، وROC-AUC
أبرز النتائج:
- ركاب Business Class ورحلات العمل الأعلى رضاً
- Online Boarding وInflight Entertainment من أكثر العوامل تأثيراً
- Random Forest حقق أعلى دقة على الـ Test Data