تفاصيل العمل

في هذا المشروع، قمت بتطوير نظام متكامل لاكتشاف الاحتيال في بطاقات الائتمان باستخدام تقنيات تعلم الآلة (Machine Learning) بهدف تحديد المعاملات الاحتيالية في الوقت الفعلي. شمل العمل جميع مراحل دورة علم البيانات بدءًا من فهم المشكلة التجارية وحتى نشر النموذج (Model Deployment). تمثلت المشكلة في التحدي الكبير لاكتشاف المعاملات الاحتيالية وسط ملايين العمليات اليومية لبطاقات الائتمان، وكان الهدف هو بناء نموذج تنبؤي قادر على اكتشاف العمليات المشبوهة تلقائيًا للحد من الخسائر المالية ودعم محللي الاحتيال في اتخاذ القرارات. استخدمت في المشروع مجموعة بيانات حقيقية ومجهولة الهوية تضم 284,807 معاملة من بينها 492 معاملة احتيالية فقط (0.17%)، مما أبرز مشكلة عدم توازن الفئات (Class Imbalance) التي تمت معالجتها بطرق مناسبة. تمت مراجعة البيانات بعناية للتأكد من خلوها من القيم المفقودة، كما تم حذف 1,081 سجل مكرر لضمان جودة البيانات ودقتها. بالإضافة إلى ذلك، تم توحيد القيم العددية مثل Time وAmount باستخدام StandardScaler لتسهيل عملية التدريب وتحسين أداء النموذج بشكل عام.

تم تنفيذ مرحلة هندسة الخصائص (Feature Engineering) من خلال تحليل المتغيرات واختيار أكثرها تأثيرًا في التنبؤ بالاحتيال، مع تطبيق تقنيات مثل PCA لتقليل الأبعاد وتحسين كفاءة النموذج. بعد ذلك، تم تقسيم البيانات إلى مجموعات تدريب واختبار بنسبة 80:20 لضمان تقييم عادل للنموذج. استخدمت عدة خوارزميات تصنيف مثل Logistic Regression وRandom Forest وXGBoost وتمت مقارنة أدائها لاختيار الأفضل.

تم التركيز على دقة الكشف عن الفئة النادرة (المعاملات الاحتيالية) باستخدام مقاييس مثل Precision وRecall وF1-Score بالإضافة إلى مصفوفة الارتباك (Confusion Matrix) ومنحنى ROC-AUC لضمان توازن الأداء بين الدقة والحساسية. أظهر نموذج XGBoost أفضل أداء شامل بقدرة عالية على اكتشاف الاحتيالات مع تقليل الأخطاء.

بعد التدريب، تم حفظ النموذج النهائي باستخدام مكتبة joblib وتغليفه في واجهة API بسيطة عبر Flask لتوفير نظام تنبؤ فوري يمكنه استقبال بيانات المعاملات الجديدة وإرجاع التنبؤ مباشرة. تم اختبار النظام بنجاح في بيئة تجريبية ليكون جاهزًا للتكامل مع الأنظمة المصرفية أو تطبيقات الدفع الإلكتروني.

يُظهر هذا المشروع القدرة على تحويل البيانات المالية الضخمة إلى نظام ذكي فعال يساعد المؤسسات على تقليل الخسائر الناتجة عن الاحتيال، ويعكس تطبيقًا عمليًا متكاملًا لمهارات تحليل البيانات وتعلم الآلة من الفكرة إلى النشر.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة
تاريخ الإنجاز
المهارات