تفاصيل العمل

https://github.com/Ahmed-...

جراء تحليل استكشافي للبيانات (EDA) باستخدام Pandas وMatplotlib وSeaborn لاكتشاف القيم المفقودة والعلاقات المهمة.

معالجة القيم المفقودة بتقدير عمر الركاب حسب الدرجة (Pclass)، وتعويض الأجرة (Fare) بالوسيط، وحذف عمود (Cabin) بسبب كثرة القيم الناقصة.

ترميز المتغيرات الفئوية مثل (الجنس والميناء) باستخدام One-Hot Encoding، وتطبيق RobustScaler لتوحيد القيم.

بناء وتدريب نموذج انحدار لوجستي (Logistic Regression) حقق دقة ~81%، مع دقة نوعية (Precision) 83% و استدعاء (Recall) 66%.

تقييم أداء النموذج باستخدام مصفوفة الالتباس (Confusion Matrix) وتقرير التصنيف (Classification Report).

تطبيق التنبؤات على مجموعة الاختبار بعد تنفيذ نفس خطوات المعالجة المسبقة.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
4
تاريخ الإضافة
المهارات