نوع العمل:
تحليل بيانات المبيعات باستخدام Python (Pandas, NumPy, Matplotlib, Seaborn) – تنظيف وتحليل واستخراج رؤى وتصورات بيانية.
ميزاته:
استيراد البيانات من ملف Excel (5000 صف، 24 عمود).
تنظيف البيانات ومعالجة القيم المفقودة (null values).
تحويل أنواع البيانات (Dates, Numeric).
إضافة أعمدة جديدة مثل Year من Order Date.
إجراء تحليلات استكشافية (EDA):
عدد العملاء حسب الولاية (NSW vs VIC)
عدد الطلبات حسب المدينة (Melbourne vs Sydney)
اتجاه الطلبات عبر السنوات (2013–2017)
توزيع الفئات (Product Categories) باستخدام Pie Chart
عدد الطلبات لكل سنة باستخدام Bar Chart و Line Chart
توزيع كمية الطلب (Order Quantity Distribution)
كثافة كمية الطلب (Density Plot)
نمط الخصم بناءً على الكمية (Discount % vs Order Quantity)
توزيع كمية الطلب حسب الفئة (Boxen Plot)
طريقة التنفيذ:
استخدام مكتبات Python:
pandas لتحميل وتنظيف البيانات
numpy للعمليات الحسابية
matplotlib و seaborn للتصورات البيانية
معالجة القيم المفقودة باستخدام fillna()
تحويل الأعمدة النصية التي تحتوي على أرقام (مثل Cost Price, Retail Price, Profit Margin) إلى numeric types
إنشاء visualizations تفاعلية وثابتة (static plots)
استخراج الرؤى والتوصيات بناءً على التحليل
النتائج والرؤى المستخلصة:
أكثر فئة منتجات مبيعًا هي Office Supplies (79%).
Technology تمثل 17.6%، Furniture 3.4% فقط.
Melbourne و Sydney هما أكبر مدن الطلبات.
اتجاه الطلبات عبر السنوات يظهر ذروة في 2015 و 2016.
معظم الطلبات بكميات صغيرة