قمت بتنفيذ مشروع تحليل بيانات استكشافي (EDA) باستخدام لغة Python على مجموعة بيانات Titanic الشهيرة، بهدف فهم البيانات، اكتشاف الأنماط، وتحليل العوامل المؤثرة على بقاء الركاب.
شمل المشروع الخطوات التالية:
استيراد البيانات باستخدام مكتبة Seaborn
استعراض البيانات وهيكلها العام (head, info)
تحليل إحصائي شامل للخصائص العددية والوصفية (describe)
فحص القيم المفقودة (Missing Values)
تحليل توزيع المتغيرات الأساسية مثل:
الجنس
العمر
فئة التذكرة
الأجرة
عدد أفراد العائلة
إنشاء رسوم بيانية توضيحية لفهم العلاقات بين المتغيرات باستخدام Matplotlib وSeaborn
دراسة تأثير الجنس، العمر، والدرجة الاجتماعية على نسبة النجاة
استخراج ملاحظات واستنتاجات تساعد في فهم سلوك البيانات واتجاهاتها
الأدوات والتقنيات المستخدمة:
Python
Pandas
NumPy
Matplotlib
Seaborn
نتيجة المشروع:
تحليل بصري وإحصائي واضح يوضح أهم العوامل التي أثّرت على نجاة الركاب، مع تنظيم الكود بشكل نظيف وقابل لإعادة الاستخدام والتطوير لاحقًا لبناء نموذج تعلم آلة للتنبؤ بالنجاة.