تفاصيل العمل

يهدف هذا المشروع إلى تنفيذ تحليل بيانات شامل (EDA) وبناء نموذج تنبؤي باستخدام بيانات عملاء أحد البنوك بهدف فهم سلوك العملاء والتنبؤ بإمكانية اشتراكهم في الودائع البنكية.

بدأ المشروع بمرحلة تنظيف البيانات ومعالجتها، حيث تم التعامل مع القيم المفقودة واستبدال بعض القيم غير المعروفة بالقيم الأكثر تكرارًا، بالإضافة إلى تحويل أنواع البيانات المناسبة لضمان دقة التحليل. بعد ذلك تم إجراء تحليل استكشافي للبيانات (Exploratory Data Analysis) لفهم توزيع المتغيرات واكتشاف العلاقات بينها باستخدام الرسوم البيانية المختلفة.

كما تم تحليل المتغيرات العددية والفئوية، واكتشاف القيم الشاذة (Outliers)، ودراسة تأثير بعض المتغيرات مثل مدة الاتصال مع العميل، الرصيد البنكي، ونوع القروض على احتمالية اشتراك العميل في الوديعة.

بعد مرحلة التحليل، تم إنشاء ميزات جديدة (Feature Engineering) لتحسين أداء النماذج التنبؤية، ثم تم تدريب عدة نماذج تعلم آلي مثل:

Logistic Regression

Random Forest

XGBoost

وتم تقييم أداء النماذج باستخدام أسلوب Cross Validation لاختيار النموذج الأفضل من حيث الدقة والقدرة على التنبؤ.

أظهر التحليل أن مدة الاتصال مع العميل (Duration) والرصيد البنكي (Balance) من أهم العوامل المؤثرة في قرار العميل بالاشتراك في الوديعة البنكية.

تم تنفيذ المشروع باستخدام الأدوات التالية:

Python

Pandas & NumPy

Matplotlib & Seaborn

Scikit-learn

يساعد هذا المشروع المؤسسات المالية على فهم سلوك العملاء بشكل أفضل واتخاذ قرارات مبنية على البيانات لتحسين استراتيجيات التسويق وزيادة معدلات الاشتراك في المنتجات البنكية.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
3
تاريخ الإضافة
تاريخ الإنجاز
المهارات