تفاصيل العمل

باستخدام مجموعة بيانات "التايتانيك" للتنبؤ بالناجين باستخدام نماذج التعلم الآلي قمت بالخطوات التالية:

1- معالجة البيانات:

أ ) تحميل مجموعة بيانات التايتانيك وتنظيف البيانات من القيم المفقودة.

ب) ترميز الميزات التصنيفية لتصبح جاهزة للتدريب على النماذج.

2- التحليل الاستكشافي للبيانات (EDA):

ا ) تصور الميزات الأساسية مثل العمر، الجنس، وتوزيع الدرجة.

ب) تحديد الأنماط والشواذ المحتملة، وإزالة الشواذ لتحسين دقة وثبات النموذج.

3- اختيار الميزات:

ا ) اختيار الميزات الأكثر صلة بالاعتماد على المعرفة بالمجال وتحليل الارتباط.

ب) تحسين مجموعة البيانات لاستخدامها مع خوارزميات SVM و KNN.

4- تدريب النماذج:

ا ) تنفيذ نموذج (K-Nearest Neighbors - KNN) كتصنيف بديل للمقارنة، وقد حقق دقة بنسبة 91%.

ب) تدريب نموذج (SVM) للتمييز بين الناجين وغير الناجين، وحقق دقة بنسبة 89%.

ج) استخدام "البحث الشبكي" (Grid Search) لضبط المعلمات وتحسين الدقة لتصل إلى 100%.

5- تقييم النموذج:

ا) مقارنة أداء نماذجي SVM و KNN باستخدام مقاييس الدقة و Confusion Matrix لتقييم دقة التنبؤات.

ب) استنادًا إلى هذه النتائج، تم تحديد النموذج الأفضل أداءً وتحليل أسباب كونه أكثر فعالية لهذه المجموعة من البيانات.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة
تاريخ الإنجاز
المهارات