قمت بتطوير خط بيانات (Data Pipeline) لمعالجة بيانات قطاع التجزئة باستخدام أدوات التحليل والبرمجة. الهدف هو تنظيف، دمج، وتحويل البيانات الخام إلى بيانات نظيفة قابلة للتحليل واتخاذ القرار.
المشروع شمل:
استيراد البيانات من مصادر متعددة (CSV وParquet).
تنظيف البيانات من القيم المفقودة والأخطاء.
تحويل وتجميع البيانات للحصول على مؤشرات أداء رئيسية (KPIs) مثل المبيعات الشهرية والإجمالية.
حفظ المخرجات في ملفات نظيفة وجاهزة (clean_data.csv, agg_data.csv).
توثيق جميع العمليات داخل Notebook منظم.