تفاصيل العمل

في هذا المشروع، عملت على تطوير نظام لاكتشاف الاحتيال في معاملات بطاقات الائتمان باستخدام خوارزميات الذكاء الاصطناعي وتعلّم الآلة (Machine Learning) بلغة Python.

الهدف كان بناء نموذج ذكي يستطيع التفرقة بين المعاملات الحقيقية والمزيفة بدقة عالية، رغم أن البيانات كانت غير متوازنة بشدة (نسبة الاحتيال أقل من 0.2% من إجمالي البيانات).

بدأت بـ التحليل الاستكشافي للبيانات (EDA) باستخدام مكتبات Pandas, Matplotlib, Seaborn لفهم طبيعة البيانات والعلاقات بين الخصائص. ساعدني ذلك في تحديد أهم العوامل التي تؤثر على احتمالية حدوث الاحتيال مثل الخصائص V14, V17, V10.

بعد ذلك قمت بمعالجة البيانات من خلال تطبيع القيم باستخدام StandardScaler وتقسيمها إلى بيانات تدريب (80%) واختبار (20%) مع الحفاظ على توازن الفئات.

وللتعامل مع مشكلة عدم التوازن، استخدمت تقنيتين أساسيتين:

Class Weights في النماذج مثل Logistic Regression و Random Forest و LightGBM.

SMOTE لتوليد عينات إضافية من الفئة الأقل تمثيلًا (الاحتيال).

بعد تجهيز البيانات، درّبت مجموعة من النماذج المختلفة مثل:

Logistic Regression – Random Forest – XGBoost – LightGBM – CatBoost – Neural Network (MLP).

ثم استخدمت RandomizedSearchCV لتحسين الأداء واختيار أفضل الإعدادات بناءً على مؤشر F1-Score الذي يوازن بين الدقة والاسترجاع.

وفي المرحلة الأخيرة، أنشأت نماذج تجميعية (Voting و Stacking Classifiers) جمعت بين أفضل الخوارزميات.

حقق نموذج Stacking باستخدام XGBoost كمُتعلّم نهائي أعلى أداء من حيث الدقة والتوازن بين النتائج.

لجعل النتائج تفاعلية وسهلة الفهم، أنشأت لوحة تحكم تفاعلية (Dashboard) باستخدام Dash وPlotly لعرض أداء النماذج وتحليل البيانات بشكل مرئي وواضح.

النتيجة: النموذج النهائي يكتشف العمليات الاحتيالية بدقة عالية ويقلل الإنذارات الخاطئة، مما يجعله نظامًا موثوقًا وفعّالًا.

يمكنني تنفيذ مشروع مماثل لمؤسستك أو بياناتك، يشمل كل المراحل: تنظيف البيانات، التحليل، بناء النماذج، تحسين الأداء، وتصميم لوحات تحكم تفاعلية — لتحويل بياناتك الخام إلى قرارات دقيقة وذكية.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
3
تاريخ الإضافة
المهارات