تفاصيل العمل

باستخدام مجموعة بيانات "التايتانيك" للتنبؤ بالناجين باستخدام نماذج التعلم الآلي قمت بالخطوات التالية:

1- معالجة البيانات:

أ ) تحميل مجموعة بيانات التايتانيك وتنظيف البيانات من القيم المفقودة.

ب) ترميز الميزات التصنيفية لتصبح جاهزة للتدريب على النماذج.

2- التحليل الاستكشافي للبيانات (EDA):

ا ) تصور الميزات الأساسية مثل العمر، الجنس، وتوزيع الدرجة.

ب) تحديد الأنماط والشواذ المحتملة، وإزالة الشواذ لتحسين دقة وثبات النموذج.

3- اختيار الميزات:

ا ) اختيار الميزات الأكثر صلة بالاعتماد على المعرفة بالمجال وتحليل الارتباط.

ب) تحسين مجموعة البيانات لاستخدامها مع خوارزميات SVM و KNN.

4- تدريب النماذج:

ا ) تنفيذ نموذج (K-Nearest Neighbors - KNN) كتصنيف بديل للمقارنة، وقد حقق دقة بنسبة 91%.

ب) تدريب نموذج (SVM) للتمييز بين الناجين وغير الناجين، وحقق دقة بنسبة 89%.

ج) استخدام "البحث الشبكي" (Grid Search) لضبط المعلمات وتحسين الدقة لتصل إلى 100%.

5- تقييم النموذج:

ا) مقارنة أداء نماذجي SVM و KNN باستخدام مقاييس الدقة و Confusion Matrix لتقييم دقة التنبؤات.

ب) استنادًا إلى هذه النتائج، تم تحديد النموذج الأفضل أداءً وتحليل أسباب كونه أكثر فعالية لهذه المجموعة من البيانات.

بطاقة العمل

اسم المستقل Mahmoud E.
عدد الإعجابات 0
عدد المشاهدات 3
تاريخ الإضافة
تاريخ الإنجاز