في هذا المشروع قمتُ بتحليل مجموعة بيانات تسوق تتكون من 3900 سجل و18 خاصية تشمل (العمر، الجنس، المشتريات، الفئة، التقييم، …).
ما تم إنجازه:
إعداد التحليل: استخدام Pandas، NumPy، Seaborn، Matplotlib داخل بيئة Jupyter Notebook.
تنظيف البيانات: معالجة القيم المفقودة والتكرارات، فحص الأبعاد والأنواع.
تحليل البيانات: إجراء إحصاءات وصفية، وتحليل أحادي/ثنائي/متعدد المتغيرات، مع اختبار الارتباطات (مثل معامل Pearson بين العمر وعدد المشتريات).
تصور البيانات: تصميم رسوم بيانية متنوعة (bar charts، pie charts، histograms، word clouds) لعرض توزيع الفئات، الألوان، والمواقع.
رؤى وتوصيات: استخراج اتجاهات واضحة مثل متوسط المشتريات حسب الخصومات أو الفصول، وتحديد الأنماط الأكثر شيوعًا بين العملاء.