تفاصيل العمل

تنظيف ومعالجة البيانات (Data Cleaning)

**الوصف:**

تنفيذ Pipeline متكامل لتنظيف البيانات وتحويلها من بيانات خام إلى بيانات جاهزة للتحليل والنمذجة.

**ما تم تنفيذه:**

* حذف الأعمدة غير المهمة والبيانات الحساسة

* معالجة القيم المفقودة

* إزالة البيانات المكررة

* التعامل مع القيم الشاذة (Outliers)

* تنقية البيانات من القيم غير المنطقية

* إنشاء Features جديدة لتحسين التحليل

**النتيجة:**

تحسين جودة البيانات وتقليلها من 119,390 إلى 87,396 سجل جاهز للاستخدام.

**الأدوات:**

Python – Pandas – NumPy

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة