مشروع تحليل بيانات شامل على مجموعة بيانات Titanic Dataset بهدف استخراج العوامل المؤثرة على معدلات النجاة، وتحويل البيانات الخام إلى رؤى تحليلية قابلة للتفسير.
مراحل تنفيذ المشروع:
-Data Understanding & Exploration:
دراسة المتغيرات مثل: العمر، الجنس، الدرجة، الأجرة
تحليل توزيع البيانات وفهم طبيعة كل متغير.
اكتشاف الأنماط الأولية المرتبطة بالنجاة.
- Data Cleaning & Preprocessing:
معالجة القيم المفقودة (مثل Age وCabin).
تحويل المتغيرات الفئوية إلى صيغة رقمية.
التعامل مع القيم الشاذة (Outliers).
Feature Engineering لاستخراج خصائص جديدة.
- Exploratory Data Analysis (EDA):
تحليل تأثير الجنس والدرجة الاجتماعية على النجاة.
دراسة العلاقة بين العمر ونسبة البقاء.
تحليل تأثير سعر التذكرة والميناء.
استخراج أهم العوامل المؤثرة في احتمالية النجاة.
- Data Visualization:
إنشاء رسومات بيانية توضح:
نسب النجاة حسب الجنس.
مقارنة النجاة حسب الدرجة (Pclass).
توزيع الأعمار.
العلاقات بين المتغيرات.
تقديم النتائج في شكل واضح وسهل الفهم.