نوع العمل: مشروع تعلم آلة (تصنيف)
في هذا المشروع قمت بتطوير نموذج تعلم آلة للتنبؤ ببقاء ركاب سفينة Titanic اعتمادًا على بيانات الركاب التاريخية.
يتضمن المشروع مجموعة من الخطوات الاحترافية في تحليل البيانات وبناء النماذج التنبؤية، حيث تم تنفيذ:
تحليل استكشافي شامل للبيانات (Exploratory Data Analysis) لفهم العلاقات بين المتغيرات المختلفة مثل العمر، الجنس، درجة التذكرة، وسعر التذكرة.
معالجة البيانات وتنظيفها من القيم المفقودة، بالإضافة إلى تحويل المتغيرات النصية مثل الجنس وميناء الصعود إلى متغيرات رقمية قابلة للاستخدام في نماذج تعلم الآلة.
تطبيق عدة نماذج تعلم آلة للمقارنة بينها مثل:
Logistic Regression
Random Forest
Decision Tree
Gradient Boosting
Support Vector Machine
ثم تم تقييم أداء النماذج باستخدام عدة مقاييس مثل:
Accuracy
Confusion Matrix
ROC-AUC
كما تم استخدام الرسوم البيانية لتحليل النتائج وفهم العوامل المؤثرة في بقاء الركاب.
يوضح هذا المشروع القدرة على:
تحليل البيانات الواقعية
تنظيف البيانات ومعالجتها
بناء نماذج تصنيف باستخدام تعلم الآلة
تقييم أداء النماذج واستخلاص النتائج
الأدوات المستخدمة:
Python
Pandas
NumPy
Matplotlib
Seaborn
Scikit-learn