يهدف هذا المشروع إلى بناء نموذج تعلم آلي قادر على التنبؤ بقبول أو رفض طلبات القروض البنكية اعتمادًا على مجموعة من البيانات المتعلقة بالمتقدمين للحصول على القرض مثل الدخل، الحالة التعليمية، تاريخ الائتمان، وقيمة الأصول.
تم تنفيذ المشروع باستخدام لغة Python مع مجموعة من مكتبات تحليل البيانات والتعلم الآلي. بدأت العملية باستيراد البيانات ومعالجتها، حيث تم تنظيف البيانات والتعامل مع القيم المفقودة وتحويل المتغيرات الفئوية إلى متغيرات رقمية مناسبة للنماذج.
بعد ذلك تم إجراء تحليل استكشافي للبيانات (EDA) لفهم توزيع المتغيرات واكتشاف العلاقات بين الخصائص المختلفة وتأثيرها على قرار الموافقة على القرض. ثم تم تقسيم البيانات إلى بيانات تدريب واختبار لتقييم أداء النماذج.
تم تدريب عدة خوارزميات تعلم آلي لبناء نموذج تصنيف قادر على التنبؤ بقرار القرض، مثل:
Logistic Regression
Decision Tree
Random Forest
وتم تقييم النماذج باستخدام مقاييس الأداء مثل Accuracy و Confusion Matrix لاختيار النموذج الأكثر كفاءة. تساعد هذه النماذج المؤسسات المالية على تسريع عملية تقييم طلبات القروض وتقليل المخاطر المرتبطة بالإقراض من خلال الاعتماد على تحليل البيانات والتنبؤات الذكية.
الأدوات المستخدمة في المشروع:
Python
Pandas & NumPy
Matplotlib & Seaborn
Scikit-learn
Jupyter Notebook