قمت بتحليل بيانات ركاب سفينة Titanic الشهيرة باستخدام أداة Power BI بهدف استكشاف العوامل المؤثرة في فرص النجاة وتقديم لوحات تحكم تفاعلية توضح الأنماط الرئيسية في البيانات.
خطوات العمل:
Data Cleaning (تنظيف البيانات):
التعامل مع القيم المفقودة (مثل العمر والدرجة).
تنسيق البيانات وتحويلها لصيغة مناسبة للتحليل.
إزالة التكرارات والتأكد من جودة البيانات.
Data Modeling (نمذجة البيانات):
إنشاء العلاقات بين الجداول (مثل الركاب والتذاكر).
إضافة أعمدة محسوبة (Calculated Columns) ومقاييس (Measures) باستخدام DAX.
تقسيم البيانات لفئات (العمر – الجنس – الدرجة – تكلفة التذكرة).
Data Visualization (تصوير البيانات):
تصميم لوحات تحكم (Dashboards) تفاعلية تعرض:
نسب النجاة حسب الجنس والعمر.
تأثير الدرجة (Class) على فرص النجاة.
توزيع الركاب حسب الموانئ.
تحليلات إضافية باستخدام الرسوم البيانية.
استخدام عناصر بصرية جذابة تسهّل على المستخدم النهائي فهم النتائج بسرعة.
النتائج:
إظهار أن النساء والأطفال كانت لديهم فرص أكبر للبقاء مقارنة بالرجال.
توضيح تأثير الدرجة الأولى بشكل إيجابي على معدلات النجاة.
إبراز أهمية الميناء كنقطة انطلاق وتأثيرها على توزيع الركاب.
القيمة المضافة:
المشروع يوضح القدرة على تنفيذ دورة تحليل بيانات كاملة من تنظيف البيانات → النمذجة → التصور التفاعلي باستخدام Power BI، مما يجعله نموذجًا مثاليًا لمشاريع الأعمال وتحليل البيانات.