قمت بتنفيذ مرحلة المعالجة المسبقة للبيانات (Data Preprocessing) لمجموعة بيانات خاصة بحملة تسويقية بهدف تحليل سلوك العملاء وقياس فعالية الحملة. شمل العمل فحص جودة البيانات واكتشاف المشكلات مثل القيم المفقودة، البيانات غير المنطقية، والتكرار، ثم معالجتها باستخدام أساليب مناسبة لضمان دقة النتائج.
كما قمت بتحويل المتغيرات النصية إلى متغيرات رقمية (Encoding)، وتطبيع البيانات (Scaling) عند الحاجة، بالإضافة إلى معالجة القيم الشاذة (Outliers) وتحليل توزيع البيانات إحصائيًا لفهم خصائصها قبل الانتقال إلى مرحلة النمذجة.
تم تجهيز البيانات لتكون متوافقة مع متطلبات نماذج تعلم الآلة، مع تقسيمها إلى بيانات تدريب واختبار، واختيار الخصائص المؤثرة (Feature Selection) بما يساعد على تحسين أداء النموذج وتقليل التعقيد.
الهدف من العمل كان إعداد قاعدة بيانات نظيفة ومنظمة تُمكّن من بناء نماذج تنبؤية دقيقة تساعد في تقييم نجاح الحملة التسويقية واتخاذ قرارات مبنية على البيانات.