يهدف هذا المشروع إلى تحليل بيانات التسوق لاكتشاف الأنماط والاتجاهات المتعلقة بالمشترين، المنتجات الأكثر مبيعًا، وتأثير العوامل المختلفة مثل الجنس، الموقع، وطريقة الدفع على عمليات الشراء.
مراحل المشروع:
تحميل البيانات واستكشافها
استيراد البيانات وعرض عينة عشوائية منها.
فحص المعلومات العامة حول البيانات والتأكد من عدم وجود قيم مفقودة.
التحليل الاستكشافي للبيانات (EDA)
تحليل فردي (Univariate Analysis) لكل من الميزات الرقمية والفئوية.
حساب الإحصائيات الوصفية للميزات الرقمية والفئوية لاستخلاص رؤى أولية.
تحليل الميزات الفئوية باستخدام المخططات البيانية
الجنس: توزيع المشتريات بين الذكور والإناث.
العنصر المشتَرى: العناصر الأكثر شراءً، مثل البلوزات التي تحتل المركز الأول.
الفئة: الملابس هي الفئة الأكثر شراءً.
الموقع: ولاية كانساس تمتلك أعلى عدد من المشتريات، بينما مونتانا لديها الأدنى.
الحجم (Size): الحجم المتوسط (M) هو الأكثر شراءً.
اللون: الفضي هو اللون الأكثر شراءً.
الموسم: المشتريات موزعة بالتساوي بين المواسم.
حالة الاشتراك: المشترون غير المشتركين في العروض يشترون أكثر من المشتركين.
طريقة الدفع: طرق الدفع مثل PayPal، البطاقة الائتمانية، والنقد تستخدم بنفس التكرار تقريبًا.
نوع الشحن: خيارات الشحن المختلفة مثل الشحن المجاني، القياسي، والتوصيل في اليوم التالي لها نفس التوزيع تقريبًا.
الخصومات والعروض الترويجية: معظم المعاملات تمت بدون خصم أو كود ترويجي.
النتائج المتوقعة:
تحديد الفئات الأكثر شراءً وتحليل سلوك المستهلكين.
فهم تأثير العروض الترويجية والخصومات على قرارات الشراء.
تحديد أنماط الشراء حسب الجنس والموقع وطريقة الدفع.
تقديم توصيات لتحسين استراتيجيات التسويق والعروض الترويجية.