في هذا المشروع قمت بتطوير نموذج تعلم آلي لتصنيف طلبات الموافقة على القروض، مع معالجة مشكلة اختلال التوازن بين الفئات (class imbalance) في البيانات.
البيانات المستخدمة:
بيانات تحتوي على 45,000 سجل و 14 متغيرًا (خصائص شخصية، مالية، تعليمية، إلخ).
الفئة المستهدفة (loan_status) غير متوازنة بشدة (35,000 رفض مقابل 10,000 موافقة).
الخطوات المنفذة:
استكشاف البيانات وتحليلها: التأكد من نظافة البيانات، والكشف عن اختلال التوازن.
التصور: رسم توزيعات الجنس وحالة القرض.
معالجة البيانات:
تحويل المتغيرات الفئوية باستخدام OneHotEncoder.
قياس المتغيرات الرقمية باستخدام StandardScaler.
التعامل مع اختلال التوازن:
استخدام خوارزمية RandomForest مع class_weight='balanced'.
تقسيم البيانات مع الحفاظ على التوزيع باستخدام stratify=y.
التقييم: حقق النموذج:
دقة عامة ~93%
F1-score للفئة الأقل تمثيلاً ~82%
مع أداء ممتاز للفئة الأكبر (~95%)
النتائج:
النموذج يقدم نتائج جيدة جدًا على الرغم من اختلال التوازن، مع إمكانية تحسين الاستدعاء للفئة الثانية باستخدام خوارزميات أخرى مثل XGBoost.