تحليل استكشافي لبيانات ركاب التايتانيك باستخدام Python وPandas وMatplotlib، يتضمن إحصاءات ورسوم بيانية توضح تأثير الفئة والعمر والجنس والتذكرة على فرص النجاة.

تفاصيل العمل

بدأ العمل برفع ملف بيانات titanic.csv إلى منصة Google Colab، ثم قراءة البيانات باستخدام مكتبة Pandas لتحويلها إلى إطار بيانات منظم. بعد ذلك تم إجراء تحليل استكشافي شامل للبيانات من خلال مجموعة من العمليات الإحصائية والرسوم البيانية.

تم أولاً حساب معدل النجاة لكل فئة من فئات الركاب (Pclass)، وإظهار النتائج باستخدام مخطط أعمدة بيّن بوضوح أن ركاب الدرجة الأولى كانت فرص نجاتهم أعلى من غيرهم. ثم جرى استخراج عدد الركاب الذين تقل أعمارهم عن 18 سنة، وعرض بيانات النساء في الدرجة الأولى مثل الاسم والعمر وقيمة التذكرة.

كما تم تحديد أعلى خمسة ركاب دفعوا أجرة مع إظهار تفاصيلهم، وترتيب الركاب حسب الفئة والعمر من الأكبر إلى الأصغر. إضافةً إلى ذلك، حُسب متوسط العمر للناجين وغير الناجين، مع رسم توزيع الأعمار لكلا المجموعتين عبر مخطط بياني (Histogram).

ومن جهة أخرى، تم تحليل توزيع الركاب حسب الفئة والجنس، وعرض النتائج في مخطط أعمدة مكدس. كما تم حساب متوسط الأجرة ونسبة النجاة لكل فئة، وتحديد الفئة ذات أعلى معدل للنجاة. وبالنسبة للجوانب الاجتماعية، جرى استخراج عدد الركاب الذين كانوا برفقة أشقائهم أو أزواجهم.

أخيراً، ركّز التحليل على الركاب الأكبر من خمسين عاماً، حيث تم حساب نسبة النجاة لديهم بحسب الجنس، وعرض النتائج في مخطط أعمدة أوضح الفوارق بين الرجال والنساء.

وبذلك يُعد هذا العمل تحليلاً استكشافياً متكاملاً لبيانات ركاب التايتانيك باستخدام Python وPandas وMatplotlib، إذ جمع بين الإحصاء والتمثيل البياني لإبراز العوامل المؤثرة في النجاة بصورة شاملة ودقيقة.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
4
تاريخ الإضافة
تاريخ الإنجاز
المهارات