قمت بتصميم وتطوير نظام متكامل لاكتشاف عمليات الاحتيال في معاملات بطاقات الائتمان بشكل فردي، اعتمادًا على تقنيات تعلم الآلة وتحليل البيانات المتقدم. يستخدم المشروع مجموعة بيانات مجهولة الهوية تضم أكثر من 284,000 معاملة مالية، من بينها 492 معاملة احتيالية فقط، مما شكّل تحديًا كبيرًا بسبب عدم توازن البيانات.
يركز النظام على بناء خط معالجة آلي ودقيق قادر على التعامل مع البيانات واسعة النطاق، وتحقيق أداء مرتفع في اكتشاف المعاملات الاحتيالية مع تقليل الإنذارات الخاطئة.
منهجية العمل
إجراء تحليل استكشافي شامل للبيانات (EDA) لفهم التوزيعات والأنماط والعلاقات
تنظيف البيانات ومعالجتها وتطبيع الخصائص
بناء وتدريب عدة نماذج تعلم آلة ومقارنتها، تشمل:
Logistic Regression
Random Forest
Gradient Boosting
LightGBM
Multi-Layer Perceptron (MLP)
اختيار النموذج الأفضل بناءً على مقاييس تقييم مناسبة للبيانات غير المتوازنة
التقييم والنتائج
الاعتماد على مقياس Area Under the Precision-Recall Curve (AUPRC) بدلًا من الدقة العامة
أفضل نموذج كان LightGBM محققًا:
AUPRC = 0.786
Precision للمعاملات الاحتيالية: 84.6%
Recall: 78.6%
قابلية التفسير
استخدام مكتبة SHAP لشرح قرارات النموذج
تحديد الخصائص الأكثر تأثيرًا في اكتشاف الاحتيال من خلال رسوم تحليلية
واجهة العرض ولوحة التحكم
تطوير لوحة تحكم تفاعلية باستخدام Streamlit
دعم اللغتين العربية والإنجليزية
عرض المقاييس والرسوم البيانية ومعاينة البيانات
إمكانية مقارنة النماذج وتصفية النتائج
المخرجات
نماذج مدربة وجاهزة لإعادة الاستخدام
تقارير تقييم تفصيلية
مخططات تحليلية شاملة
تطبيق ويب تفاعلي لعرض النتائج
التقنيات المستخدمة
Python
scikit-learn
LightGBM
SHAP
pandas
matplotlib
seaborn
Streamlit