? مميزات المشروع:
? نظام متكامل (من البداية للنهاية)
المشروع بيغطي كل المراحل: جمع البيانات _تنظيف البيانات _تحليل البيانات _تجهيز وتحسين البيانات _تدريب النماذج
تقييم النتائج .
? تحليل ذكي للبيانات
1-التعامل مع البيانات الناقصة
2-تحويل البيانات الوصفية (زي النوع) لأرقام
3-فهم العلاقة بين البيانات والنجاة
? استخدام أكتر من نموذج
بيتم تجربة أكتر من طريقة للتوقع، زي:
• الانحدار اللوجستي (Logistic Regression)
• الغابات العشوائية (Random Forest)
• التعزيز التدريجي (Gradient Boosting)
وبنختار الأفضل فيهم.
? تقييم دقيق للأداء
بيتم قياس كفاءة النموذج باستخدام :الدقة (Accuracy) _الإحكام (Precision) _الاسترجاع (Recall) _مقياس F1
ROC-AUC
? نتائج مفهومة
المشروع بيحدد:
إيه العوامل اللي كانت بتأثر أكتر في نجاة الركاب
زي: النوع، الدرجة، السن…
? خطوات تنفيذ المشروع:
1. تحميل البيانات
بنستخدم بيانات الركاب من مواقع زي Kaggle.
2- استكشاف البيانات
تحليل بيانات زي:العمر (Age) _النوع (Sex) _درجة التذكرة (Passenger Class) _عدد أفراد العيلة (SibSp و Parch)
3- تنظيف البيانات
• معالجة القيم الناقصة (زي العمر أو الكابينة)
• حذف البيانات غير المهمة (زي الاسم ورقم التذكرة)
4-تحسين البيانات (Feature Engineering)
• حساب حجم العيلة
• استخراج ألقاب من الاسم (زي Mr / Mrs)
5- تجهيز البيانات
تحويل البيانات لكلام رقمي باستخدام:
• Label Encoding
• One-Hot Encoding
6- تقسيم البيانات
تقسيمها إلى: تدريب _اختبار .
7- تدريب النماذج
تجربة أكتر من نموذج واختيار الأفضل.
8- تقييم النتائج
اختبار دقة النموذج والتأكد إنه شغال كويس.
9- التنبؤ
استخدام النموذج لتوقع نجاة ركاب جدد.
? قيمة المشروع:
• بيساعد نفهم إيه العوامل اللي أثرت في نجاة الركاب
• ممكن يتطبق على مشاريع تانية فيها توقع نتائج
• مهم جدًا في الـ Portfolio لأنه بيبين إنك:
o بتتعامل مع البيانات كويس
o بتبني نماذج ذكية
o بتقارن بين النماذج وتختار الأفضل