تحميل وتنظيف البيانات (معالجة القيم المفقودة، تعديل الأنواع، التحقق من التكرارات)
تحليل البيانات الاستكشافي (EDA) باستخدام مكتبات مثل pandas, matplotlib, و seaborn
تصور العلاقات بين المتغيرات (مثل العلاقة بين الجنس، الدرجة الاجتماعية، العمر واحتمالية النجاة)
استخدام إحصاءات وصفية لفهم توزيع البيانات (المتوسط، الوسيط، الانحراف المعياري...)
تحليل الفروق بين الناجين وغير الناجين باستخدام اختبارات إحصائية (مثل T-test وChi-Square)
تجهيز البيانات لنماذج التعلم الآلي (معالجة البيانات الفئوية، تطبيع القيم)
تدريب نموذج تنبؤي أولي باستخدام خوارزمية Logistic Regression لتقدير احتمالية النجاة