يطبّق هذا المشروع خوارزميات التعلّم الآلي على مجموعة بيانات Titanic الشهيرة للتنبؤ ببقاء الركاب على قيد الحياة استنادًا إلى العوامل الاجتماعية والاقتصادية والديموغرافية.
يعرض المشروع منهجية متكاملة من البداية إلى النهاية تشمل معالجة البيانات، هندسة الميزات، تدريب النماذج، ضبط المعاملات الفائقة (Hyperparameter Tuning)، وتقييم الأداء.
الميزات الرئيسية:
معالجة البيانات (Data Preprocessing):
التعامل مع القيم المفقودة.
ترميز المتغيرات التصنيفية.
تطبيق موازنة الميزات (Feature Scaling).
هندسة الميزات (Feature Engineering):
إنشاء متغيرات جديدة مثل Title وFamilySize وIsAlone لاكتشاف العلاقات الخفية في البيانات.
Modeling :
تنفيذ عدة خوارزميات تعلم آلي مثل آلة المتجهات الداعمة (SVM) وأقرب الجيران (KNN).
تحسين أداء النماذج باستخدام GridSearchCV لضبط المعاملات الفائقة.
تحقيق دقة تصل إلى حوالي 83٪ على مجموعة الاختبار، مما يدل على قدرة جيدة على التعميم.