يهدف هذا المشروع إلى تنفيذ تحليل بيانات شامل (EDA) وبناء نموذج تنبؤي باستخدام بيانات عملاء أحد البنوك بهدف فهم سلوك العملاء والتنبؤ بإمكانية اشتراكهم في الودائع البنكية.
بدأ المشروع بمرحلة تنظيف البيانات ومعالجتها، حيث تم التعامل مع القيم المفقودة واستبدال بعض القيم غير المعروفة بالقيم الأكثر تكرارًا، بالإضافة إلى تحويل أنواع البيانات المناسبة لضمان دقة التحليل. بعد ذلك تم إجراء تحليل استكشافي للبيانات (Exploratory Data Analysis) لفهم توزيع المتغيرات واكتشاف العلاقات بينها باستخدام الرسوم البيانية المختلفة.
كما تم تحليل المتغيرات العددية والفئوية، واكتشاف القيم الشاذة (Outliers)، ودراسة تأثير بعض المتغيرات مثل مدة الاتصال مع العميل، الرصيد البنكي، ونوع القروض على احتمالية اشتراك العميل في الوديعة.
بعد مرحلة التحليل، تم إنشاء ميزات جديدة (Feature Engineering) لتحسين أداء النماذج التنبؤية، ثم تم تدريب عدة نماذج تعلم آلي مثل:
Logistic Regression
Random Forest
XGBoost
وتم تقييم أداء النماذج باستخدام أسلوب Cross Validation لاختيار النموذج الأفضل من حيث الدقة والقدرة على التنبؤ.
أظهر التحليل أن مدة الاتصال مع العميل (Duration) والرصيد البنكي (Balance) من أهم العوامل المؤثرة في قرار العميل بالاشتراك في الوديعة البنكية.
تم تنفيذ المشروع باستخدام الأدوات التالية:
Python
Pandas & NumPy
Matplotlib & Seaborn
Scikit-learn
يساعد هذا المشروع المؤسسات المالية على فهم سلوك العملاء بشكل أفضل واتخاذ قرارات مبنية على البيانات لتحسين استراتيجيات التسويق وزيادة معدلات الاشتراك في المنتجات البنكية.