يهدف هذا المشروع إلى تحليل بيانات المعاملات البنكية لاكتشاف الأنماط الاحتيالية والتفريق بينها وبين العمليات المشروعة.
بما أن البيانات تحتوي على عدد قليل جدًا من العمليات الاحتيالية مقارنةً بالمعاملات العادية، كان التحدي الرئيسي هو التعامل مع البيانات غير المتوازنة لضمان تدريب نموذج قادر على اكتشاف الاحتيال بدقة عالية.
الخطوات الرئيسية في المشروع:
1- تحليل البيانات الاستكشافي (EDA): فحص البيانات باستخدام مكتبات Pandas و Matplotlib و Seaborn لاكتشاف الأنماط والارتباطات بين المتغيرات.
2-التعامل مع البيانات غير المتوازنة: تطبيق تقنيات مثل SMOTE (Synthetic Minority Over-sampling Technique) لموازنة البيانات بين الفئات المختلفة.
3-بناء نماذج تعلم آلي:
تم تجربة عدة نماذج مثل Logistic Regression, Random Forest, XGBoost, Neural Networks، ومقارنة أدائها.
تقييم النماذج باستخدام مصفوفة الارتباك (Confusion Matrix)، ودقة النموذج (Accuracy)، ودقة الكشف عن الاحتيال (Precision & Recall).
تحسين أداء النموذج:
تطبيق تقنيات Feature Engineering لاختيار أفضل الميزات المؤثرة على النتائج.
استخدام Grid Search & Hyperparameter Tuning لتحسين دقة النماذج.
عرض النتائج والتوصيات: تقديم تقرير يوضح التحليل والنتائج، مع التوصيات الممكنة لتطوير نظام أمان ذكي يمنع الاحتيال في المستقبل.
التقنيات والأدوات المستخدمة:
1- Python – لتنفيذ جميع الخطوات البرمجية
2- Pandas, NumPy – لمعالجة البيانات
3- Matplotlib, Seaborn – لتحليل البيانات بصريًا
4- Scikit-learn, XGBoost – لتدريب النماذج وتحليل الأداء
5- SMOTE – للتعامل مع البيانات غير المتوازنة