مشروع احترافي لمعالجة وتنظيف البيانات باستخدام Python، حيث يتم تحميل بيانات الكتب الخام الناتجة من Web Scraping ثم تنفيذ عمليات تنظيف وتحويل متقدمة لجعل البيانات صالحة للتحليل.
يشمل المشروع:
تنظيف الأسعار وتحويلها إلى قيم رقمية
التعامل مع القيم المفقودة (Missing Values)
استخراج حالة التوفر (In Stock) وتحويلها إلى بيانات منطقية
إزالة البيانات المكررة (Duplicates)
تحسين أسماء الأعمدة لتكون موحدة وسهلة الاستخدام
ترتيب البيانات حسب السعر
في النهاية يتم حفظ البيانات في ملف CSV نظيف وجاهز للاستخدام في التحليل أو بناء النماذج.