باستخدام مجموعة بيانات "التايتانيك" للتنبؤ بالناجين باستخدام نماذج التعلم الآلي قمت بالخطوات التالية:
1- معالجة البيانات:
أ ) تحميل مجموعة بيانات التايتانيك وتنظيف البيانات من القيم المفقودة.
ب) ترميز الميزات التصنيفية لتصبح جاهزة للتدريب على النماذج.
2- التحليل الاستكشافي للبيانات (EDA):
ا ) تصور الميزات الأساسية مثل العمر، الجنس، وتوزيع الدرجة.
ب) تحديد الأنماط والشواذ المحتملة، وإزالة الشواذ لتحسين دقة وثبات النموذج.
3- اختيار الميزات:
ا ) اختيار الميزات الأكثر صلة بالاعتماد على المعرفة بالمجال وتحليل الارتباط.
ب) تحسين مجموعة البيانات لاستخدامها مع خوارزميات SVM و KNN.
4- تدريب النماذج:
ا ) تنفيذ نموذج (K-Nearest Neighbors - KNN) كتصنيف بديل للمقارنة، وقد حقق دقة بنسبة 91%.
ب) تدريب نموذج (SVM) للتمييز بين الناجين وغير الناجين، وحقق دقة بنسبة 89%.
ج) استخدام "البحث الشبكي" (Grid Search) لضبط المعلمات وتحسين الدقة لتصل إلى 100%.
5- تقييم النموذج:
ا) مقارنة أداء نماذجي SVM و KNN باستخدام مقاييس الدقة و Confusion Matrix لتقييم دقة التنبؤات.
ب) استنادًا إلى هذه النتائج، تم تحديد النموذج الأفضل أداءً وتحليل أسباب كونه أكثر فعالية لهذه المجموعة من البيانات.
اسم المستقل | Mahmoud E. |
عدد الإعجابات | 0 |
عدد المشاهدات | 3 |
تاريخ الإضافة | |
تاريخ الإنجاز |