عملت على تطوير نظام متكامل لمعالجة وتحليل بيانات مبيعات Walmart، بهدف مساعدة الإدارة في اتخاذ قرارات مبنية على البيانات. يشمل المشروع:
استخراج البيانات (ETL): سحب بيانات المبيعات من مصادر متعددة (ملفات CSV، قواعد بيانات)
تنظيف وتحويل البيانات: باستخدام Python وSpark لتحسين جودة البيانات وتوحيدها
جدولة العمليات: عبر Apache Airflow لتنفيذ الـ ETL بشكل أوتوماتيكي يوميًا
تخزين البيانات: رفع البيانات النظيفة إلى AWS S3، ثم تحميلها إلى Redshift Data Warehouse
تحليل البيانات: بناء جداول Aggregated لإظهار مبيعات الفروع، الأقسام، والفترات الزمنية
لوحات تحكم: تصميم Dashboards تفاعلية على Power BI لعرض المؤشرات الرئيسية (KPI) مثل:
المبيعات اليومية والشهرية
المنتجات الأعلى مبيعًا
أداء الفروع حسب المنطقة
تحسين الأداء: تسريع الاستعلامات عبر تحسين تصميم الجداول وبناء Indexes على Redshift
الفائدة المحققة:
ساعد المشروع إدارة Walmart على:
معرفة الفروع ذات الأداء الضعيف
توقع المخزون المطلوب
تحسين العروض الترويجية حسب بيانات المبيعات الفعلية