المعالجة المسبقة والتصوير لداتا تايتنك

تفاصيل العمل

قمت بتنفيذ مشروع تحليل بيانات استكشافي (EDA) باستخدام لغة Python على مجموعة بيانات Titanic الشهيرة، بهدف فهم البيانات، اكتشاف الأنماط، وتحليل العوامل المؤثرة على بقاء الركاب.

شمل المشروع الخطوات التالية:

استيراد البيانات باستخدام مكتبة Seaborn

استعراض البيانات وهيكلها العام (head, info)

تحليل إحصائي شامل للخصائص العددية والوصفية (describe)

فحص القيم المفقودة (Missing Values)

تحليل توزيع المتغيرات الأساسية مثل:

الجنس

العمر

فئة التذكرة

الأجرة

عدد أفراد العائلة

إنشاء رسوم بيانية توضيحية لفهم العلاقات بين المتغيرات باستخدام Matplotlib وSeaborn

دراسة تأثير الجنس، العمر، والدرجة الاجتماعية على نسبة النجاة

استخراج ملاحظات واستنتاجات تساعد في فهم سلوك البيانات واتجاهاتها

الأدوات والتقنيات المستخدمة:

Python

Pandas

NumPy

Matplotlib

Seaborn

نتيجة المشروع:

تحليل بصري وإحصائي واضح يوضح أهم العوامل التي أثّرت على نجاة الركاب، مع تنظيم الكود بشكل نظيف وقابل لإعادة الاستخدام والتطوير لاحقًا لبناء نموذج تعلم آلة للتنبؤ بالنجاة.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
4
تاريخ الإضافة
تاريخ الإنجاز
المهارات