لهدف من هذا العمل هو تحليل بيانات ركاب السفينة تايتانيك لاستخراج أنماط وعوامل أثرت على فرص النجاة.
البيانات المتوفرة عادة تتضمن:
الاسم، الجنس، العمر.
الدرجة (Class) التي حجز فيها الراكب (1st, 2nd, 3rd).
عدد أفراد الأسرة المرافقين.
سعر التذكرة.
مكان الصعود (Embarked).
هل نجا الراكب أم لا (Survived = 0/1).
المهام التي يقوم بها محلل البيانات:
استكشاف البيانات (EDA):
معرفة عدد الركاب، الناجين والخسائر.
التعرف على نسب النجاة حسب الجنس، العمر، والدرجة.
تنظيف البيانات:
معالجة القيم المفقودة (مثلاً: العمر غير مسجل لبعض الركاب).
تعديل القيم غير الصحيحة أو غير المتسقة.
التحليل الإحصائي:
حساب نسب النجاة الكلية.
مقارنة نسب النجاة بين الرجال والنساء.
دراسة تأثير العمر (الأطفال مقابل البالغين).
تحليل أثر الدرجة (Class) على النجاة.
تصور البيانات (Data Visualization):
رسم مخططات أعمدة ودوائر لعرض نسب النجاة.
رسوم Boxplot لتوضيح العلاقة بين السعر/العمر والنجاة.