تفاصيل العمل

نوع العمل:

تحليل بيانات وبناء نموذج تنبؤي باستخدام علم البيانات والتعلم الآلي لتحديد احتمالية نجاة ركاب سفينة Titanic.

ميزات المشروع:

نموذج قادر على التنبؤ بالنجاة بدقة عالية.

استكشاف وتحليل البيانات للكشف عن الأنماط والعوامل المؤثرة مثل الجنس، العمر، والفئة.

مقارنة عدة خوارزميات للتعلم الآلي واختيار الأنسب.

عرض النتائج بصريًا باستخدام الرسوم البيانية ولوحات البيانات.

طريقة التنفيذ:

استكشاف البيانات (EDA): تحليل الأعمدة المهمة، التوزيع الإحصائي للبيانات، وعلاقة الخصائص بالنجاة، مع استخدام الرسوم البيانية مثل Histogram وCount Plot وHeatmap.

تنظيف وتحويل البيانات: معالجة القيم المفقودة، حذف الأعمدة غير المهمة، وتحويل البيانات الفئوية إلى أرقام لتسهيل بناء النماذج.

تقسيم البيانات: تحديد المتغير المستهدف (Survived) والمتغيرات المستقلة، ثم تقسيم البيانات لمجموعات تدريب واختبار.

بناء النماذج التنبؤية: تجربة عدة خوارزميات مثل Logistic Regression، Random Forest، Gradient Boosting، Decision Tree، KNN، Naive Bayes، وSVC.

تقييم الأداء: استخدام مقاييس الدقة (Accuracy) لاختيار أفضل نموذج للتنبؤ.

التنبؤ النهائي: استخدام النموذج الأفضل (Random Forest) لإصدار نتائج النجاة وإنشاء ملف Submission جاهز للاستخدام.

الأدوات المستخدمة: Python، Pandas، NumPy، Matplotlib، Seaborn، Scikit-learn

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة
تاريخ الإنجاز
المهارات