هذا المشروع يركز على تحليل بيانات معاملات التجزئة وسلوك العملاء بهدف التعرف على الأنماط، الاتجاهات، والقيم الشاذة. يشمل التحليل تنظيف البيانات، التحليل الاستكشافي (EDA)، وعرض مؤشرات الأداء الرئيسية من خلال التصوير البياني لتقديم رؤى قابلة للتنفيذ.
البيانات المستخدمة
المشروع يعتمد على مجموعتي بيانات رئيسيتين:
QVI_transaction_data.csv – يحتوي على بيانات المعاملات:
تاريخ ورقم المعاملة
تفاصيل المنتج (الاسم، الكمية، الحجم)
قيم المبيعات
رقم المتجر وبطاقات الولاء
QVI_purchase_behaviour.csv – يحتوي على بيانات العملاء الديموغرافية:
رقم بطاقة الولاء
المرحلة الحياتية للعميل (مثل "YOUNG SINGLES/COUPLES")
حالة العميل المتميز (Premium أو Mainstream)
خطوات التحليل
1. إعداد البيانات
دمج بيانات المعاملات مع بيانات سلوك العملاء
تنظيف أسماء المنتجات واستخراج:
اسم العلامة التجارية
حجم العبوة (بالجرام)
التعامل مع القيم المفقودة
تحويل أعمدة التواريخ إلى صيغة صحيحة
2. التحليل الاستكشافي للبيانات (EDA)
دراسة اتجاهات المبيعات على مر الوقت
تحديد العلامات التجارية الأكثر مبيعًا
تحليل توزيع أحجام العبوات
كشف القيم الشاذة في المبيعات
تحليل شرائح العملاء
3. التصوير البياني
مخططات زمنية للمبيعات الإجمالية
مخططات أعمدة للعلامات التجارية الأعلى مبيعًا
هيستوجرام لأحجام العبوات
مخططات Box للكشف عن القيم الشاذة
مخططات Scatter لتوزيع المبيعات
أبرز النتائج
اتجاهات المبيعات: وجود نمط موسمي واضح في البيانات
أفضل العلامات التجارية: Smiths، Doritos، Kettle
أحجام العبوات: معظم المنتجات تتراوح بين 150–200 جم
القيم الشاذة: تم تحديد وتحليل معاملات ذات مبيعات عالية جدًا
شرائح العملاء: العملاء المتميزون يظهرون سلوك شراء مختلف عن العملاء العاديين
التقنيات والأدوات
اللغة: Python
المكتبات: pandas، numpy، matplotlib، seaborn
التقنيات:
كشف القيم الشاذة باستخدام IQR
التحليل الزمني للمبيعات
تقسيم العملاء إلى شرائح