تنظيف ومعالجة البيانات (Data Cleaning)
**الوصف:**
تنفيذ Pipeline متكامل لتنظيف البيانات وتحويلها من بيانات خام إلى بيانات جاهزة للتحليل والنمذجة.
**ما تم تنفيذه:**
* حذف الأعمدة غير المهمة والبيانات الحساسة
* معالجة القيم المفقودة
* إزالة البيانات المكررة
* التعامل مع القيم الشاذة (Outliers)
* تنقية البيانات من القيم غير المنطقية
* إنشاء Features جديدة لتحسين التحليل
**النتيجة:**
تحسين جودة البيانات وتقليلها من 119,390 إلى 87,396 سجل جاهز للاستخدام.
**الأدوات:**
Python – Pandas – NumPy