في هذا المشروع تعاملت مع Dataset مالية ضخمة تحتوي على 284,807 معاملة و31 متغيرًا بهدف تحليل البيانات واكتشاف العمليات الاحتيالية.
قمت بـ:
تحميل ومعالجة بيانات كبيرة الحجم بكفاءة باستخدام Pandas
تحسين استهلاك الذاكرة أثناء التعامل مع البيانات
تنفيذ عمليات Data Cleaning شاملة
تحليل التوزيع الإحصائي للمتغيرات
التعامل مع مشكلة عدم توازن البيانات (Highly Imbalanced Dataset)
بناء نموذج Classification لاكتشاف Fraud
تقييم النموذج باستخدام Precision و Recall و F1-Score
نجحت في معالجة Dataset كبيرة مع الحفاظ على الأداء والكفاءة أثناء التنفيذ، وإنتاج نموذج قادر على التمييز بين العمليات السليمة والاحتيالية بدقة عالية.
Processed and analyzed a high-volume financial dataset containing 284,807 records while maintaining computational efficiency and model performance.