وصف المشروع:
يُقدّم هذا المشروع نموذجاً متكاملاً لتحليل بيانات التجارة الإلكترونية على طول دورة البيانات الكاملة، حيث قُدّ في إطار تعاوني كقائد فريق. يهدف التحليل إلى جمع البيانات وتنظيفها ونمذجتها وتصورها بالإضافة إلى استنتاج رؤى قابلة للتنفيذ وتطبيقات تنبؤية مدعومة بالتعلم الآلي.
الأدوات والتقنيات المستخدمة:
منصة سحابية: قاعدة بيانات Azure SQL Database كبيئة مركزية لتخزين البيانات ومعالجتها.
SQL Server & Python (pandas, pyodbc, Mito): لتنظيف البيانات والتحقق من جودتها (audit)، وإجراء المعالجات مثل إزالة التكرارات وتوحيد تنسيقات التواريخ والتحقق من القيم غير الصحيحة.
Power BI: لإنشاء لوحات معلومات تفاعلية تعرض مؤشرات الأداء الأساسية (KPIs) وأهم التحليلات.
التعلّم الآلي: باستخدام scikit-learn وXGBoost لبناء نماذج تنبؤية تعزز استراتيجيات الأعمال.
الخطوات المنفذة في المشروع:
إعداد وربط قاعدة البيانات على Azure لضمان بيئة مركزية وقابلة للوصول.
تدقيق شامل للبيانات باستخدام SQL ديناميكي، والتحقق من المفاتيح الخارجية، والقيم الخالية، ومراقبة البيانات غير الصالحة مثل الطلبات بقيمة صفر أو سلبية، المخزون غير المستهلك، أو العملاء دون نشاط.
تطوير استعلامات تحليلية متقدمة تشمل تحليل الاحتفاظ بالعملاء، معدل دوران المخزون (بمتوسط متحرك لمدة 30 يوماً)، تحليلات تجميع المنتجات (product bundling)، وتقييم أوقات التسليم. كما تم إنشاء عروض (views) حسب القسم لتحقيق وصول بيانات آمن حسب الأدوار.
بناء لوحة معلومات Power BI تتضمن مؤشرات أداء رئيسية مثل الإيرادات (45 مليون دولار بزيادة 24.6٪)، عدد الطلبات (10.2 ألف بزيادة 24.57٪)، ومعدل الإرجاع المنخفض 1٪، مما يعكس رضا العملاء.
دمج التعلّم الآلي عبر scikit-learn وXGBoost لتعزيز الرؤى التنبؤية ودعم اتخاذ القرار.
القيمة المضافة:
يمنح هذا المشروع المؤسسة بنية متكاملة تجمع بين تخزين البيانات السحابية، تنظيف البيانات الدقيق، التحليلات العميقة، التمثيل المرئي الفعّال، والنمذجة التنبؤية. النتيجة؟ تحسين الأداء المالي من خلال زيادة الإيرادات والطلبات، خفض معدلات الإرجاع، وتأمين احتفاظ أفضل بالعملاء - مع دعم اتخاذ القرارات المستندة إلى البيانات.