مشروع التنبؤ بالموافقة على القروض باستخدام Logistic Regression

تفاصيل العمل

قمت بتنفيذ مشروع تحليل بيانات وبناء نموذج تصنيف للتنبؤ بحالة الموافقة على القروض (Loan Approval Prediction) باستخدام خوارزمية Logistic Regression في Python.

◄ هدف المشروع

بناء نموذج يستطيع التنبؤ بما إذا كان القرض سيتم الموافقة عليه أم لا، بناءً على بيانات العميل مثل الدخل، التعليم، والحالة الوظيفية.

خطوات العمل:

◄ استكشاف البيانات (Data Exploration)

قراءة البيانات باستخدام Pandas.

فحص أنواع البيانات والقيم الناقصة.

تحليل توزيع المتغير المستهدف (Loan Status).

◄ معالجة البيانات (Data Preprocessing)

تحويل المتغيرات الفئوية (مثل التعليم والعمل الحر) إلى أرقام باستخدام LabelEncoder.

فصل البيانات إلى:

المتغيرات المستقلة (X)

المتغير الهدف (y)

تقسيم البيانات إلى Training و Testing بنسبة 75% / 25%.

◄ بناء النموذج (Model Building)

تدريب نموذج Logistic Regression.

تحسين الأداء باستخدام:

class_weight='balanced' لمعالجة مشكلة عدم توازن البيانات.

زيادة عدد التكرارات (max_iter=1000) لضمان تقارب النموذج.

◄تقييم الأداء (Model Evaluation)

استخدام:

Classification Report (Precision – Recall – F1-score)

Confusion Matrix

تحليل أداء النموذج قبل وبعد معالجة عدم التوازن.

◄ تحليل بصري (Data Visualization)

رسم توزيع حالات القروض (Approved / Rejected).

تحليل العلاقة بين الدخل السنوي وحالة القرض باستخدام Boxplot.

إنشاء Correlation Heatmap لاكتشاف العلاقات بين المتغيرات.

النتائج:

النموذج قادر على التنبؤ بحالة القرض بدقة جيدة.

تم تحسين أداء النموذج بعد معالجة مشكلة عدم توازن البيانات.

تم استخراج علاقات مهمة بين الدخل وبعض العوامل المؤثرة على قرار القرض.

الأدوات والتقنيات المستخدمة:

Python

Pandas

Scikit-learn

Matplotlib

Seaborn

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
3
تاريخ الإضافة
المهارات