تفاصيل العمل

في هذا المشروع قمت بتطوير نموذج تعلم آلي لتصنيف طلبات الموافقة على القروض، مع معالجة مشكلة اختلال التوازن بين الفئات (class imbalance) في البيانات.

البيانات المستخدمة:

بيانات تحتوي على 45,000 سجل و 14 متغيرًا (خصائص شخصية، مالية، تعليمية، إلخ).

الفئة المستهدفة (loan_status) غير متوازنة بشدة (35,000 رفض مقابل 10,000 موافقة).

الخطوات المنفذة:

استكشاف البيانات وتحليلها: التأكد من نظافة البيانات، والكشف عن اختلال التوازن.

التصور: رسم توزيعات الجنس وحالة القرض.

معالجة البيانات:

تحويل المتغيرات الفئوية باستخدام OneHotEncoder.

قياس المتغيرات الرقمية باستخدام StandardScaler.

التعامل مع اختلال التوازن:

استخدام خوارزمية RandomForest مع class_weight='balanced'.

تقسيم البيانات مع الحفاظ على التوزيع باستخدام stratify=y.

التقييم: حقق النموذج:

دقة عامة ~93%

F1-score للفئة الأقل تمثيلاً ~82%

مع أداء ممتاز للفئة الأكبر (~95%)

النتائج:

النموذج يقدم نتائج جيدة جدًا على الرغم من اختلال التوازن، مع إمكانية تحسين الاستدعاء للفئة الثانية باستخدام خوارزميات أخرى مثل XGBoost.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
2
تاريخ الإضافة
تاريخ الإنجاز
المهارات