في هذا المشروع، قمت بتحليل مجموعة بيانات (Dataset) التاريخية الشهيرة لركاب سفينة تيتانيك. الهدف الرئيسي كان فهم العوامل المؤثرة في نجاة الركاب (مثل الجنس، الفئة، العمر) وتقديم رؤى واضحة من خلال تنظيف البيانات وتحليلها.
الميزات والتقنيات المستخدمة:
تنظيف البيانات: تم التعامل مع القيم المفقودة (Missing Values) في الأعمدة مثل Age و Embarked باستخدام الإحصاء الوصفي (Median) والمنوال (Mode). تم تحويل البيانات النصية إلى فئات (Categorical Data) لتجهيزها للتحليل.
اكتشاف ومعالجة القيم المتطرفة (Outliers): تم استخدام المخططات الصندوقية (Box plots) لاكتشاف القيم المتطرفة في أعمدة مثل Fare و Age ومعالجتها لتحسين دقة التحليل.
التحليل الاستكشافي للبيانات (EDA): تم إنشاء العديد من الرسوم البيانية مثل:
مخططات الأعمدة (Bar plots) لتوضيح العلاقة بين الجنس والفئة وفرص النجاة.
مصفوفة ارتباط (Correlation Matrix) لفهم العلاقات بين المتغيرات الرقمية.
المكتبات المستخدمة: تم توظيف مكتبات Pandas لمعالجة البيانات، و Matplotlib و Seaborn لإنشاء رسوم بيانية احترافية وتفاعلية.