مشروع التنبؤ بنجاة ركاب سفينة تايتانيك (Titanic-Passenger-Survival-Prediction)

تفاصيل العمل

? مميزات المشروع:

? نظام متكامل (من البداية للنهاية)

المشروع بيغطي كل المراحل: جمع البيانات _تنظيف البيانات _تحليل البيانات _تجهيز وتحسين البيانات _تدريب النماذج

تقييم النتائج .

? تحليل ذكي للبيانات

1-التعامل مع البيانات الناقصة

2-تحويل البيانات الوصفية (زي النوع) لأرقام

3-فهم العلاقة بين البيانات والنجاة

? استخدام أكتر من نموذج

بيتم تجربة أكتر من طريقة للتوقع، زي:

• الانحدار اللوجستي (Logistic Regression)

• الغابات العشوائية (Random Forest)

• التعزيز التدريجي (Gradient Boosting)

وبنختار الأفضل فيهم.

? تقييم دقيق للأداء

بيتم قياس كفاءة النموذج باستخدام :الدقة (Accuracy) _الإحكام (Precision) _الاسترجاع (Recall) _مقياس F1

ROC-AUC

? نتائج مفهومة

المشروع بيحدد:

إيه العوامل اللي كانت بتأثر أكتر في نجاة الركاب

زي: النوع، الدرجة، السن…

? خطوات تنفيذ المشروع:

1. تحميل البيانات

بنستخدم بيانات الركاب من مواقع زي Kaggle.

2- استكشاف البيانات

تحليل بيانات زي:العمر (Age) _النوع (Sex) _درجة التذكرة (Passenger Class) _عدد أفراد العيلة (SibSp و Parch)

3- تنظيف البيانات

• معالجة القيم الناقصة (زي العمر أو الكابينة)

• حذف البيانات غير المهمة (زي الاسم ورقم التذكرة)

4-تحسين البيانات (Feature Engineering)

• حساب حجم العيلة

• استخراج ألقاب من الاسم (زي Mr / Mrs)

5- تجهيز البيانات

تحويل البيانات لكلام رقمي باستخدام:

• Label Encoding

• One-Hot Encoding

6- تقسيم البيانات

تقسيمها إلى: تدريب _اختبار .

7- تدريب النماذج

تجربة أكتر من نموذج واختيار الأفضل.

8- تقييم النتائج

اختبار دقة النموذج والتأكد إنه شغال كويس.

9- التنبؤ

استخدام النموذج لتوقع نجاة ركاب جدد.

? قيمة المشروع:

• بيساعد نفهم إيه العوامل اللي أثرت في نجاة الركاب

• ممكن يتطبق على مشاريع تانية فيها توقع نتائج

• مهم جدًا في الـ Portfolio لأنه بيبين إنك:

o بتتعامل مع البيانات كويس

o بتبني نماذج ذكية

o بتقارن بين النماذج وتختار الأفضل