تفاصيل العمل

قمت بإجراء تحليل استكشافي شامل ومعالجة مسبقة لبيانات مبيعات **Walmart** التي تحتوي على أكثر من **421,000 سجل** أسبوعي، وذلك كمرحلة أولى لبناء نموذج التنبؤ بالمبيعات.

**ما تم إنجازه:**

- **تحميل ودمج البيانات:** دمج 4 ملفات منفصلة (train, test, stores, features) باستخدام merge منظم على أعمدة متعددة

- **الاستكشاف الأولي:** فحص الأنواع، الإحصاءات الوصفية، والقيم المفقودة — حيث وُجدت قيم مفقودة ضخمة في أعمدة MarkDown تصل إلى 310,000 قيمة

- **تحليل التوزيعات:** رسم Boxplots لأهم المتغيرات مثل المبيعات الأسبوعية، الحجم، درجة الحرارة، سعر الوقود، والبطالة

- **تحليل القيم الشاذة (Outliers):** حساب حدود IQR لكل عمود رقمي وتحديد عدد القيم الخارجة عن النطاق الطبيعي

**الأدوات المستخدمة:**

`Python` | `Pandas` | `NumPy` | `Matplotlib` | `Seaborn

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
تاريخ الإضافة
تاريخ الإنجاز
المهارات