تفاصيل العمل

تحليل بيانات ناجين تيتانيك

هذا المشروع عبارة عن دراسة تحليلية واستكشافية لبيانات سفينة تيتانيك، تم الحصول على البيانات من منصة Kaggle. تحتوي مجموعة البيانات على 1,309 سجلاً للركاب تشمل معلومات مثل العمر، سعر التذكرة، الجنس، درجة السفر، حجم الأسرة، وميناء الصعود.

الهدف الرئيسي من المشروع هو استخراج الأنماط والعوامل التي أثّرت على نجاة الركاب من خلال استكشاف منظّم للبيانات وتمثيل بصري واضح للنتائج.

المراحل التي تم تنفيذها:

تحميل البيانات وفحصها لفهم هيكلها وأنواع المتغيرات والقيم المفقودة

تنظيف البيانات من خلال معالجة القيم المفقودة في عمودي العمر وميناء الصعود

هندسة المتغيرات عبر إنشاء متغيرات جديدة كحجم الأسرة وتحويل القيم الرقمية إلى تسميات واضحة

رسم مجموعة متنوعة من المخططات البيانية تشمل توزيع النجاة حسب الجنس، درجة السفر، الفئة العمرية، سعر التذكرة، ميناء الصعود، وحجم الأسرة

تصميم لوحة تحكم شاملة تجمع أهم المؤشرات والرسوم البيانية في عرض بصري موحد

أبرز النتائج:

الراكبات من الإناث كان معدل نجاتهن أعلى بشكل ملحوظ مقارنةً بالذكور

ركاب الدرجة الأولى كانوا الأكثر حظاً في النجاة مقارنةً بالدرجتين الثانية والثالثة

الركاب الذين سافروا بمفردهم أظهروا معدل نجاة أقل مقارنةً بمن سافروا مع مجموعات عائلية صغيرة

ارتفاع سعر التذكرة ارتبط إيجابياً بفرصة النجاة، مما يعكس الفجوة الطبقية على متن السفينة

الأطفال وصغار السن أظهروا معدلات نجاة أفضل نسبياً مقارنةً بالفئات العمرية الأكبر

الأدوات والمكتبات المستخدمة: Python، Pandas، NumPy، Matplotlib، Seaborn — وذلك كله داخل بيئة Google Colab.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
تاريخ الإنجاز
المهارات