قمت في هذا المشروع برحلة كاملة في هندسة البيانات (Data Engineering) والتحليل الاستكشافي باستخدام لغة Python ومكتبة Pandas. تضمن العمل الخطوات التالية:
تنظيف البيانات: التعامل مع القيم المفقودة (Nulls) واستبدال الرموز غير المفهومة (مثل "?") بقيم منطقية.
المعالجة الآلية: بناء سكريبت ذكي يقوم بفرز الأعمدة (عددي/تصنيفي) وتعبئة الفراغات تلقائياً باستخدام الوسيط (Median) للقيم الرقمية والمنوال (Mode) للقيم النصية.
إزالة التكرار: تنقية البيانات من السجلات المكررة لضمان دقة النتائج.
الهدف: تجهيز مجموعة بيانات نظيفة بنسبة 100% لتكون جاهزة لمرحلة تدريب نماذج تعلم الآلة (machine learning).