قمت بإجراء تحليل استكشافي شامل ومعالجة مسبقة لبيانات مبيعات **Walmart** التي تحتوي على أكثر من **421,000 سجل** أسبوعي، وذلك كمرحلة أولى لبناء نموذج التنبؤ بالمبيعات.
**ما تم إنجازه:**
- **تحميل ودمج البيانات:** دمج 4 ملفات منفصلة (train, test, stores, features) باستخدام merge منظم على أعمدة متعددة
- **الاستكشاف الأولي:** فحص الأنواع، الإحصاءات الوصفية، والقيم المفقودة — حيث وُجدت قيم مفقودة ضخمة في أعمدة MarkDown تصل إلى 310,000 قيمة
- **تحليل التوزيعات:** رسم Boxplots لأهم المتغيرات مثل المبيعات الأسبوعية، الحجم، درجة الحرارة، سعر الوقود، والبطالة
- **تحليل القيم الشاذة (Outliers):** حساب حدود IQR لكل عمود رقمي وتحديد عدد القيم الخارجة عن النطاق الطبيعي
**الأدوات المستخدمة:**
`Python` | `Pandas` | `NumPy` | `Matplotlib` | `Seaborn