1– Project Overview
المشروع ده اتنفذ كمشروع تخرج ضمن مبادرة Digital Egypt Pioneers Initiative (DEPI) التابعة لوزارة الاتصالات وتكنولوجيا المعلومات، وهدفه تطبيق دورة تحليل البيانات الكاملة على حالة أعمال قريبة من الواقع.
تم اختيار Apple كدراسة حالة بسبب تنوع منتجاتها، وكبر حجم عمليات البيع، وتعدد المبيعات، وده وفر بيئة مناسبة لتحليل أداء المبيعات بشكل متقدم.
المشروع اعتمد على عدة بيانات مختلفة، منها:
Categories - Warranty - Stores - Sales - Products
الهدف الأساسي كان تحويل ملفات بيانات خام ومفصولة إلى نموذج بيانات منظم، وبناء لوحات تحكم تفاعلية توصل رؤى واضحة وقابلة للاستخدام في اتخاذ القرار.
2– Challenges faces us
1- Data Quality Challenges
أحد التحديات الأساسية في هذا المشروع كان متعلقا بعدم اتساق التواريخ.
تواريخ إنشاء المنتجات وتواريخ الإطلاق الرسمية للأجهزة كانت إما مفقودة أو غير دقيقة، وهو ما تطلّب عمليات تحقق وتصحيح إضافية لضمان دقة التحليلات المعتمدة على الوقت.
تم التعامل مع هذه المشكلة من خلال:
مراجعة وتوحيد تنسيقات التواريخ
تصحيح تواريخ الإطلاق غير المنطقية أو غير المتسقة
استبعاد حقول التواريخ غير الموثوقة من بعض التحليلات الزمنية عند الحاجة
2- Dashboard Design
تحقيق توازن بين عرض رؤى تفصيلية والحفاظ على تصميم نظيف وسهل الاستخدام
ضمان الوضوح أثناء عرض عدد كبير من مؤشرات الأداء (KPIs) والأبعاد المختلفة
تصميم عناصر بصرية تدعم سرد القصة التحليلية للأعمال بدلًا من إرباك المستخدم
3- Scope & Focus Decisions
تضمنت البيانات الأصلية مجموعة واسعة من منتجات Apple، ولكن لضمان الوضوح والدقة واستخراج رؤى ذات معنى، تم التركيز في التحليل على أكثر ثلاث فئات منتجات تحقيقا للمبيعات:
MacBook-iPad-iPhone
ساعد هذا القرار على:
تقليل الضوضاء في التحليل
تحسين أداء وسهولة قراءة لوحات التحكم
تقديم رؤى أعمق حول المنتجات الأكثر تأثيرا
يعكس هذا الأسلوب ممارسة شائعة في تحليلات الأعمال الواقعية، حيث يركز المحللون على الشرائح الأعلى تأثيرا عند التعامل مع مجموعات بيانات كبيرة ومعقدة.
3- Process & Solution: Phase
1: Data Exploration & Cleaning (Excel)
تم استخدام Excel كخطوة أولية للتحقق من البيانات. ركزت هذه المرحلة على تقييم جودة البيانات بشكل عام وتحضيرها للمعالجة المتقدمة.
الأنشطة الرئيسية شملت:
فحص اكتمال ودقة البيانات
توحيد أنواع البيانات
تحديد القيم المفقودة، المكررة والغير متسقة
تحضير البيانات للدمج والنمذجة
2: Initial Data Integration (SQL Server)
استخدمنا SQL Server لدمج البيانات وفهم العلاقات بين المبيعات، المنتجات، الفئات، المتاجر، والضمان.
تحققنا من العلاقات واتساق البيانات
لاحظنا أن كثرة الـ joins تؤثر على الأداء، فقمنا بالاعتماد على Star Schema لاحقًا لتحسين المرونة والتحليل
3: ETL & Transformation (Power Query – Power BI)
داخل Power BI، تم استخدام Power Query لإجراء عمليات ETL وتحويل البيانات الإضافية.
شملت هذه العمليات:
إنشاء حقول مشتقة مثل Sub-category لتوحيد أسماء منتجات Apple
التعامل مع القيم المفقودة وغير المتسقة
تهيئة البيانات لتناسب التحليل
4: Data Modeling & DAX (Power BI)
تم تصميم نموذج بيانات Star Schema لتحسين الأداء والمرونة التحليلية، ومعالجة القيود التي ظهرت خلال مرحلة SQL.
باستخدام DAX، تم تطوير عدة مقاييس، منها:
Market Share %: قياس مساهمة كل منتج في إجمالي الإيرادات
Defect Rate: تقييم جودة المنتج باستخدام بيانات الضمان والصيانة
Total Sales KPIs: حساب الإيرادات، الكميات المباعة، ومؤشرات الأداء العامة
هذه المقاييس شكلت أساس لوحات التحكم التحليلية.
5: Predictive Analytics (Python)
لتوسيع التحليل ليشمل تنبؤات مستقبلية، تم تطبيق التحليلات التنبؤية باستخدام Python و Prophet library
تحليل السلاسل الزمنية للبيانات التاريخية للمبيعات
التنبؤ بالمبيعات للسنة القادمة كاملة
النموذج قدم رؤية مستقبلية لدعم التخطيط الاستراتيجي والمالي
Solution Summary
الحل النهائي قدم تحليل متكامل من البداية للنهاية، حول البيانات الخام والمجزأة إلى نماذج منظمة، رؤى قابلة للتنفيذ، وتوقعات مبيعات مستقبلية عبر أدوات تحليل وعرض حديثة.