تحليل وتجهيز البيانات للتنبؤ بمستوى الدخل (Adult Income Dataset) باستخدام Python

تفاصيل العمل

قمت في هذا المشروع برحلة كاملة في هندسة البيانات (Data Engineering) والتحليل الاستكشافي باستخدام لغة Python ومكتبة Pandas. تضمن العمل الخطوات التالية:

تنظيف البيانات: التعامل مع القيم المفقودة (Nulls) واستبدال الرموز غير المفهومة (مثل "?") بقيم منطقية.

المعالجة الآلية: بناء سكريبت ذكي يقوم بفرز الأعمدة (عددي/تصنيفي) وتعبئة الفراغات تلقائياً باستخدام الوسيط (Median) للقيم الرقمية والمنوال (Mode) للقيم النصية.

إزالة التكرار: تنقية البيانات من السجلات المكررة لضمان دقة النتائج.

الهدف: تجهيز مجموعة بيانات نظيفة بنسبة 100% لتكون جاهزة لمرحلة تدريب نماذج تعلم الآلة (machine learning).

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
تاريخ الإنجاز
المهارات