قمت بتنفيذ مشروع تحليل بيانات مبيعات التجزئة باستخدام لغة Python ومكتباتها القوية مثل Pandas, NumPy, Matplotlib, Seaborn.
الهدف الرئيسي كان تحليل مجموعة بيانات كبيرة تحتوي على معلومات المبيعات (مثل المنتجات، الفئات، أساليب الدفع، العملاء، وغيرها) واستخراج رؤى قيّمة لمساعدة متخذي القرار على فهم أداء المبيعات وتحسين الاستراتيجيات.
الأدوات والتقنيات المستخدمة
• Python كلغة برمجة رئيسية.
• Pandas لمعالجة البيانات وتنظيفها.
•NumPy لإجراء العمليات الحسابية.
•Matplotlib & Seaborn لإنشاء الرسوم التوضيحية والتصورات.
• ydata-profiling لاستكشاف البيانات تلقائياً.
خطوات العمل الرئيسية
1.تحميل البيانات وتفحصها
2.تنظيف البيانات ومعالجة القيم المفقودة والمكررة
3.تحويل أنواع البيانات وإضافة أعمدة جديدة (Feature Engineering)
4.حساب الإحصائيات وعمليات التجميع (Grouping & Aggregation)
5.إنشاء رسوم بيانية متنوعة لفهم الأنماط
6.تطبيع عمود عمر العميل (Normalization)
7.استخراج استنتاجات واضحة وقابلة للتنفيذ
نتائج واستنتاجات مفتاحية
1.أعلى فئة من حيث الإيراد Electronics
2.أكثر وسيلة دفع استخدام Credit Card
3.أفضل شهر في المبيعات December
4.المتوسط الإنفاق في عطلة نهاية الأسبوع ١٢٠٠ دولار
5.أفضل متجر أداءً Store D
6.المنتج الأكثر ربحي Laptop
7.أكثر فئة مبيعاتها مستقرة Groceries
8.أقل شهور المبيعاتJanuary
هذا المشروع يبرز قدرتي على:
•معالجة البيانات وتنظيفها باحترافية.
•استخدام Python ومكتباتها لتحليل البيانات.
•استخلاص رؤى عملية من البيانات الخام.
•تقديم نتائج واضحة عبر رسومات وتقارير احترافية