قمت في هذا المشروع بإجراء تحليل شامل لمجموعة بيانات ضخمة تحتوي على أكثر من 149,000 عملية بيع. يهدف المشروع إلى استخراج رؤى تجارية دقيقة تساعد في فهم سلوك المستهلك وتحسين الأداء المالي.
أبرز المهام التي قمت بها في المشروع:
تنظيف ومعالجة البيانات (Data Cleaning): التعامل مع القيم المفقودة، وتحويل أنواع البيانات لضمان دقة التحليل.
معالجة القيم الشاذة (Outliers Handling): استخدام تقنية الـ (IQR) لمعالجة القيم المتطرفة في الأسعار والكميات لضمان عدم تأثر النتائج.
هندسة البيانات (Feature Engineering): إنشاء أعمدة جديدة مثل عماد "المبيعات" (Sales) عبر ضرب الكمية في سعر الوحدة لاستخراج إجمالي الدخل لكل عملية.
تحليل البيانات الاستكشافي (EDA): تحليل مبيعات الفئات المختلفة (قهوة، شاي، شوكولاتة) وتوزيعها حسب مواقع الفروع (مثل Lower Manhattan و Hell's Kitchen).
التحليل الإحصائي: استخراج الإحصاءات الوصفية لفهم متوسط الأسعار والكميات المباعة الأكثر تكرا