تحليل بيانات سلوك الشراء – Shopping Trends Analysis
قمت بتنفيذ مشروع متكامل لتحليل بيانات العملاء وسلوك الشراء باستخدام Python و Power BI، بهدف استخراج رؤى قابلة للتنفيذ تساعد في اتخاذ قرارات تسويقية وتجارية مبنية على البيانات.
المهام المنجزة:
1- جمع البيانات وربطها بقاعدة بيانات SQL Server
استخدام مكتبة pyodbc للاتصال بقاعدة البيانات (SQL Server).
استدعاء البيانات مباشرة من الجدول shopping_trends.
2- معالجة البيانات (Data Cleaning & Preprocessing)
فحص البيانات (Null values, duplicates, datatypes).
التعامل مع القيم المفقودة والبيانات المكررة.
تصنيف الأعمار إلى مجموعات (Youth, Adults, Seniors).
إنشاء متغيرات إضافية مثل فئات "الزوار حسب عدد المشتريات السابقة" وفئات "تقييم العملاء".
3- تحليل استكشافي للبيانات (EDA)
استخدام pandas و numpy و seaborn و plotly لعمل تحليلات بصرية تفاعلية.
كشف القيم المتطرفة (Outliers) عبر مخططات الصندوق Boxplots.
استخراج إحصائيات وصفية: المتوسطات، القيم العظمى والصغرى، الانحراف المعياري.
4- التحليل الإحصائي (Statistical Analysis)
استخدام اختبار ANOVA (f_oneway) لقياس الفروق في متوسطات الإنفاق بين المواسم والفئات.
التحقق من دلالة النتائج إحصائيًا (p-value).
5- التحليل التفصيلي حسب الخصائص
النوع (Gender): النساء ينفقن أكثر في المتوسط، بينما الرجال يساهمون بأكبر إجمالي في الإيرادات.
المواسم (Season): الخريف هو الأكثر ربحية، الصيف الأقل.
طرق الدفع (Payment Method): بطاقة الائتمان تحقق أعلى إنفاق كلي، بينما Venmo الأعلى في المتوسط.
الأعمار (Age Groups): كبار السن (50–75) هم الأكثر مساهمة في الإيرادات.
الفئات (Category): الملابس هي الأكثر طلبًا عبر المواسم، والأحذية تزداد في الصيف والربيع، والـ Outerwear الأقل.
تكرار المشتريات السابقة (Previous Purchases): العملاء الجدد والمتوسطين هم الأكثر قيمة، بينما الزوار المتكررين يساهمون بأقل الإيرادات.
تقييم العملاء (Review Rating): العملاء الراضون ينفقون أكثر.
6- اللوحات التفاعلية (Dashboards)
بناء Dashboard باستخدام Power BI لعرض:
توزيع الإنفاق حسب النوع والفئة.
الفروق بين المواسم.
تحليل طرق الدفع.
شرائح العملاء حسب العمر والمشتريات السابقة.
العلاقات بين التقييمات وقيمة الإنفاق.
7- تصدير النتائج
حفظ نسخة نهائية من البيانات بعد المعالجة والتحليلات في ملف Excel (Final_sheet.xlsx).
أدوات وتقنيات مستخدمة:
Python (Pandas, NumPy, Matplotlib, Seaborn, Plotly, SciPy).
SQL Server (PyODBC).
Power BI (لوحات تفاعلية).