قمت بتنفيذ مشروع تحليل بيانات لقاعدة بيانات ركاب سفينة تايتانيك بهدف دراسة العوامل المؤثرة في معدل النجاة واستخلاص أنماط واضحة من البيانات.
بدأت بمرحلة تنظيف البيانات باستخدام Microsoft Excel وPower Query، حيث تم التعامل مع القيم المفقودة خاصة في عمود العمر، ومعالجة القيم الفارغة في المقصورة، وإزالة التكرار، وضبط أنواع البيانات. كما تم تقسيم بعض الأعمدة النصية مثل الاسم لاستخراج معلومات إضافية تدعم التحليل.
بعد تجهيز البيانات، انتقلت إلى مرحلة التحليل باستخدام Power BI، حيث قمت ببناء نموذج بيانات منظم وإنشاء مقاييس (Measures) لحساب:
-نسبة النجاة الإجمالية
-نسبة النجاة حسب الجنس
-نسبة النجاة حسب درجة السفر (Pclass)
-متوسط العمر للناجين وغير الناجين
كما صممت لوحة معلومات تفاعلية تضمنت مؤشرات أداء رئيسية (KPIs) ورسومًا بيانية توضح العلاقة بين النجاة وكل من الجنس، العمر، ودرجة السفر، مع إمكانية التصفية والتفاعل لاستخراج رؤى أعمق.
أظهر التحليل أن الجنس ودرجة السفر كان لهما تأثير واضح على فرص النجاة، بينما لعب العمر دورًا متفاوتًا بين الفئات المختلفة.
تم تنفيذ المشروع بدايةً من تنظيف البيانات ومعالجتها، مرورًا بالتحليل الإحصائي الوصفي، وصولًا إلى تصميم داشبورد احترافي يعكس فهمًا عمليًا لأساسيات تحليل البيانات واستخلاص الرؤى.