في هذا المشروع قمت بتحليل بيانات ركاب سفينة Titanic بهدف استخراج أنماط ورؤى مهمة من البيانات.
خطوات العمل:
1- تنظيف البيانات (Data Cleaning):
- معالجة القيم المفقودة (مثل الأعمار والموانئ).
- إزالة التكرارات والتأكد من تناسق الأنواع (Data Types).
- تنسيق الأعمدة لتصبح جاهزة للتحليل.
2- تحليل البيانات (Data Analysis):
- حساب إحصاءات وصفية مثل متوسط الأعمار وتوزيع الركاب حسب الدرجة.
- دراسة نسب النجاة حسب الجنس والدرجة.
- استخدام عمليات Grouping & Filtering لتحديد الأنماط بين الفئات المختلفة من الركاب.
3- تصور البيانات (Visualization):
- رسم مخططات باستخدام Matplotlib و Seaborn مثل:
- مخطط الأعمدة لمقارنة معدلات النجاة بين الجنسين.
- Boxplot لتوزيع الأعمار حسب فئات الركاب.
- Histogram لتوزيع الأعمار.
- عرض النتائج بشكل بصري واضح يساعد في فهم العوامل المؤثرة على فرص النجاة.
الأدوات المستخدمة:
Python (Pandas, NumPy, Matplotlib, Seaborn)
من خلال المشروع قدرت أوضح إزاي ممكن تحويل بيانات خام مليئة بنواقص وعدم تناسق إلى معلومات مفهومة ومفيدة باستخدام تقنيات تنظيف البيانات والتحليل والتصور.