يهدف هذا المشروع إلى تعزيز صلاحية مجموعة البيانات وسهولة استخدامها، وإعدادها لتطبيقات مختلفة مثل التعلم الآلي، وتصور البيانات، وتحليلها.
يتم تنظيم المشروع في ثلاث مراحل رئيسية (مع دفاتر الملاحظات المتوفرة):
تحليل البيانات الاستكشافية (EDA).
تنظيف البيانات.
تطبيق خوارزميات التعلم الآلي لإحتساب بعض القيم المفقودة.
تتضمن عملية التنظيف التفصيلية ما يلي:
التعامل مع القيم المتطرفة في الأعمدة الرقمية
إزالة/ملء القيم المفقودة بتقنيات مختلفة
إصلاح الأخطاء المطبعية والإدخالات غير المتناسقة
حذف الصفوف والأعمدة عديمة الفائدة
ازالة التكرارات
اضافة اعمدة جديدة
اسم المستقل | محمد ط. |
عدد الإعجابات | 0 |
عدد المشاهدات | 10 |
تاريخ الإضافة |