وصف المشروع: يركز هذا المشروع على مهارات "تنظيف البيانات" و"هندسة الخصائص" (Feature Engineering). الهدف هو تحليل بيانات ركاب سفينة تايتانيك لتحديد العوامل التي ساهمت في نجاة بعض الركاب دون غيرهم (مثل العمر، الجنس، والدرجة)، وبناء نموذج لتوقع النجاة.
⚙️ طريقة التنفيذ (كيف قمتِ ببنائه):
التعامل مع البيانات المفقودة: واجهتِ تحدياً في نقص بيانات "العمر"، فقمتِ بتطوير استراتيجية لتعويض هذه القيم (Imputation) بناءً على متوسط أعمار كل طبقة اجتماعية، بدلاً من حذف البيانات.
هندسة الخصائص (Feature Engineering): قمتِ بدمج بيانات "الإخوة" و"الآباء" لإنشاء خاصية جديدة تسمى "حجم العائلة" (Family Size)، مما زاد من دقة التوقعات.
التحليل المرئي: أثبتِ من خلال الرسوم البيانية أن النساء وركاب الدرجة الأولى كانت لديهم فرص نجاة أعلى بكثير.
تجهيز البيانات للتعلم الآلي: قمتِ بتحويل البيانات النصية (مثل "ذكر/أنثى") إلى أرقام (Encoding) لتكون جاهزة لتدريب نماذج التصنيف.