تفاصيل العمل

قمنا ببناء نموذج تنبؤ بالموافقة على القروض البنكية باستخدام تقنيات التعلم الآلي (Machine Learning) على مجموعة بيانات تحتوي على 4,269 طلب قرض. يهدف المشروع إلى التنبؤ بما إذا كان سيتم قبول أو رفض طلب القرض بناءً على المعلومات المالية والشخصية لمقدم الطلب.

تتضمن البيانات 12 متغيرًا رئيسيًا: عدد المعالين، المستوى التعليمي (خريج أو غير خريج)، العمل الحر، الدخل السنوي، مبلغ القرض المطلوب، مدة القرض، درجة CIBIL (درجة الائتمان)، وقيم الأصول (السكنية، التجارية، الفاخرة، والبنكية). المتغير المستهدف هو حالة القرض: Approved (موافق عليه) أو Rejected (مرفوض).

بدأنا المشروع بتحليل استكشافي شامل للبيانات (EDA) يشمل: فحص القيم المفقودة (لا توجد قيم ناقصة)، تحليل توزيع البيانات، اكتشاف القيم الشاذة (Outliers)، ودراسة العلاقة بين المتغيرات باستخدام Heatmap للارتباط. لاحظنا أن درجة CIBIL هي أقوى مؤشر للتنبؤ بحالة القرض.

تم معالجة البيانات من خلال: إزالة عمود loan_id غير المفيد، تحويل المتغيرات الفئوية (education, self_employed, loan_status) إلى قيم رقمية باستخدام Label Encoding، وتطبيق RobustScaler لتوحيد البيانات الرقمية وتقليل تأثير القيم الشاذة. استخدمنا أيضًا تقنية SMOTE لمعالجة عدم توازن الفئات (Class Imbalance) بين القروض الموافق عليها والمرفوضة.

قمنا بتحليل أهمية المتغيرات باستخدام Mutual Information واكتشفنا أن درجة CIBIL تساهم بنسبة 50.8% في التنبؤ، تليها مدة القرض (1.8%)، والمستوى التعليمي (0.66%). هذا يؤكد أن التاريخ الائتماني هو العامل الأكثر تأثيرًا في قرار الموافقة على القرض.

استخدمنا نموذج Logistic Regression مع معاملات محسّنة: L1 regularization (penalty="l1")، solver="saga"، C=0.1، وclass_weight='balanced' لمعالجة عدم التوازن. تم تقسيم البيانات إلى 80% للتدريب و20% للاختبار.

حقق النموذج أداءً ممتازًا بـ دقة 94% (Accuracy) على بيانات الاختبار. في تقرير التصنيف (Classification Report): دقة التنبؤ بالقروض المرفوضة 90% مع استدعاء 96% (Recall)، ودقة التنبؤ بالقروض الموافق عليها 97% مع استدعاء 93%. النموذج متوازن في التعامل مع الفئتين.

استخدمنا ROC Curve ومقياس AUC (Area Under Curve) لتقييم جودة النموذج، حيث بلغ AUC حوالي 0.94-0.95، مما يشير إلى قدرة عالية على التمييز بين القروض المقبولة والمرفوضة.

رسمنا Confusion Matrix لتوضيح أداء النموذج: من أصل 854 حالة اختبار، تنبأ النموذج بشكل صحيح بـ 323 حالة رفض و531 حالة موافقة مع عدد قليل جدًا من الأخطاء (False Positives & False Negatives).

استخدمنا أيضًا تصورات بيانية متقدمة مثل Boxplots لتحليل توزيع درجة CIBIL حسب حالة القرض، وHeatmap لفهم الارتباطات بين المتغيرات المالية المختلفة.

النتيجة النهائية: نموذج تنبؤ دقيق وموثوق يمكن للبنوك استخدامه لأتمتة عملية تقييم طلبات القروض، مما يوفر الوقت ويقلل من المخاطر المالية من خلال اتخاذ قرارات مبنية على البيانات

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة