في هذا المشروع، قمت باستخدام أداة Power Query لتحويل البيانات من صيغتها الخام إلى صيغة منظمة وجاهزة للتحليل الإحصائي، وشملت العملية الخطوات التالية:
تنقيح وتنسيق البيانات (Data Formatting):
تعديل أنواع البيانات (Data Types) لكل عمود لضمان دقة العمليات الحسابية، مثل تحويل التواريخ إلى صيغة (Date) والأرقام إلى (Decimal/Whole Number).
تنظيف عمود الأسماء (Full name) وربطه ببيانات العملاء لتوحيد السجلات.
معالجة التواريخ (Date Transformation):
استخراج وتفصيل البيانات الزمنية من عمود التاريخ (Order Date) إلى أعمدة منفصلة تشمل: السنة (Year_ID)، الربع السنوي (QTR_ID)، والشهر (MONTH_ID) لتسهيل التحليل الزمني.
هندسة الميزات وإضافة الأعمدة المحسوبة (Calculated Columns):
حساب إجمالي المبيعات (SALES) لكل طلب بناءً على الكمية وسعر الوحدة.
إضافة عمود "Profit margin" (هامش الربح) باستخدام معادلات مخصصة لتقييم ربحية كل منتج وطلب.
تصنيف حجم الصفقات (DEAL SIZE) إلى فئات (مثل Small, Medium) بناءً على قيم المبيعات.
تطهير البيانات وتصحيح الأخطاء:
التعامل مع القيم المفقودة وتنسيق العناوين الجغرافية (City, Country, Postal Code) لضمان ظهورها بشكل صحيح على الخرائط التفاعلية.
إزالة الأعمدة غير الضرورية وتبسيط هيكل الجدول لرفع كفاءة الأداء عند بناء التقارير.