تحليل بيانات لملف الناجين و الخسائر لسفينة titanic

تفاصيل العمل

لهدف من هذا العمل هو تحليل بيانات ركاب السفينة تايتانيك لاستخراج أنماط وعوامل أثرت على فرص النجاة.

البيانات المتوفرة عادة تتضمن:

الاسم، الجنس، العمر.

الدرجة (Class) التي حجز فيها الراكب (1st, 2nd, 3rd).

عدد أفراد الأسرة المرافقين.

سعر التذكرة.

مكان الصعود (Embarked).

هل نجا الراكب أم لا (Survived = 0/1).

المهام التي يقوم بها محلل البيانات:

استكشاف البيانات (EDA):

معرفة عدد الركاب، الناجين والخسائر.

التعرف على نسب النجاة حسب الجنس، العمر، والدرجة.

تنظيف البيانات:

معالجة القيم المفقودة (مثلاً: العمر غير مسجل لبعض الركاب).

تعديل القيم غير الصحيحة أو غير المتسقة.

التحليل الإحصائي:

حساب نسب النجاة الكلية.

مقارنة نسب النجاة بين الرجال والنساء.

دراسة تأثير العمر (الأطفال مقابل البالغين).

تحليل أثر الدرجة (Class) على النجاة.

تصور البيانات (Data Visualization):

رسم مخططات أعمدة ودوائر لعرض نسب النجاة.

رسوم Boxplot لتوضيح العلاقة بين السعر/العمر والنجاة.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
8
تاريخ الإضافة
تاريخ الإنجاز
المهارات