مشروع متخصص في معالجة وتنظيف البيانات باستخدام Python بهدف تجهيز بيانات Spotify و YouTube للتحليل بشكل احترافي وموثوق. ركز المشروع بشكل أساسي على بناء Data Preprocessing Pipeline متكاملة لمعالجة البيانات الخام وتحويلها إلى Dataset جاهزة للاستخدام في التحليل أو تطبيقات Machine Learning.
تضمن العمل إزالة الـ Duplicates، معالجة الـ Missing Values باستخدام أكثر من Technique مناسبة لطبيعة البيانات، تنظيف النصوص وتحويلها لصيغ قابلة للتحليل، بالإضافة إلى تنفيذ Feature Engineering لإنشاء متغيرات جديدة تساعد في فهم أداء المحتوى الموسيقي وسلوك المستخدمين. كما استخدمت Log Transformation لتحسين توزيع البيانات والتعامل مع القيم المتطرفة، مع تحليل العلاقات بين المشاهدات، الإعجابات، وخصائص المحتوى المختلفة. المشروع ساعدني على تطوير فهم عميق لمرحلة الـ Data Preparation باعتبارها من أهم مراحل الـ Data Analysis وأكثرها تأثيرًا على جودة النتائج النهائية.