قمتُ بالخطوات التالية لتحليل وتنبؤ مبيعات Adidas في الولايات المتحدة:
تحميل البيانات واستكشافها
استوردتُ ملف المبيعات الذي يحتوي على 9,648 سجلّاً يتضمّن أعمدة التاريخ (Date)، وحدات البيع (Sales)، الترويج (Promotions)، والعطلات الرسمية.
أطلعتُ على الإحصاءات الوصفية (المتوسط، الوسيط، الانحراف المعياري) ورسمتُ توزيع المبيعات عبر الزمن لاكتشاف الأنماط الأولية.
إعداد البيانات ومعالجتها
حولتُ عمود التاريخ إلى نوع زمني واستخرجتُ منه السنة والشهر واليوم واليوم في الأسبوع.
أتممت التعامل مع القيم المفقودة وأضفتُ مؤشرات للربع السنوي وتأثير العطلات الرسمية.
التحليل الزمني الاستكشافي
رسمتُ نمودجاً زمنياً لمبيعات Adidas الشهرية للكشف عن الاتجاه العام (Trend) والدورات الموسمية (Seasonality). استخدمتُ مخطط صندوقي (Boxplot) للكشف عن القيم الشاذة خلال فترات التخفيضات.
بناء نموذج Prophet
درّبتُ نموذج Prophet مع إضافة مؤثرات العطلات والفعاليات الترويجية.
حقق النموذج خطأ متوسط مطلق (MAE) حوالي 220 وحدة مبيع، مما أعطاني تنبؤات جيدة للاتجاهات طويلة الأمد.
بناء نموذج XGBoost
جهزتُ بيانات XGBoost بإدراج جميع المتغيرات الزمنية والعطلات وحسنتُ معاييره باستخدام RandomizedSearchCV.
حقق النموذج خطأ جذر تربيعي متوسط (RMSE) حوالي 400 وحدة مبيع، مما ساعد في التقاط التقلبات القصيرة.
مقارنة النماذج والتقييم
قارنتُ Prophet وXGBoost عبر MAE وRMSE، إذ تفوق Prophet في التنبؤ المتوسط بعيد المدى، بينما تفوق XGBoost في دقة التقلبات قصيرة الأمد.
عرضت التنبؤات الفعلية مقابل المتوقعة لكل نموذج باستخدام مخططات تفاعلية من Altair.
الاستنتاجات والرؤى
لاحظتُ ارتفاعات في فترات العطلات والفعاليات الموسمية (Back-to-School، Black Friday).
وجدتُ أن دمج طريقتي Prophet وXGBoost في تجميعة بسيطة (Ensemble) يمكن أن يزيد من دقة التنبؤ.
أوصيتُ بإضافة بيانات تسويقية واجتماعية مستقبلية لتحسين قوة النموذج.