مشروع: تنظيف البيانات وتحليلها وعرضها على Dashboard
نظرة عامة
قمت باستكشاف مجموعة بيانات خاصة بالمنتجات، وتنظيفها بشكل كامل للتأكد من جودتها وصلاحيتها للتحليل، ثم إعداد Dashboard تفاعلي للإجابة على الأسئلة التحليلية المطلوبة.
خطوات التنفيذ
تنظيف أسماء المنتجات (Product Title):
توحيد صيغة الأسماء (أحرف صغيرة/كبيرة).
إزالة أي تكرارات.
معالجة الأسعار (Product Price & Original Price):
تعويض القيم الفارغة بالمتوسط.
تقريب القيم العشرية إلى خانتين.
تقييمات المنتجات (Star Rating):
استخراج القيم الرقمية الصحيحة.
استبدال القيم الفارغة بـ 0 استنادًا إلى عدد التقييمات.
الأسعار المخفضة (Minimum Offer Price):
احتساب العروض المفقودة بطرح Original Price – Price.
معالجة القيم Null باستخدام Conditional Column.
توحيد العلامات التجارية (Brand):
إنشاء عمود جديد لتصنيف المنتجات (Samsung – iPhone – Moto – Nokia – Panasonic – Other).
حذف الأعمدة غير المهمة:
مثل عمود Product Availability لعدم جدواه.
تنظيف حجم المبيعات (Sales Volume):
معالجة القيم النصية.
استبدال "k" بـ "000".
تعويض القيم الفارغة بـ 0.
الفروق السعرية:
إنشاء عمود لاحتساب الفرق بين السعر الأصلي وسعر البيع.
ملاحظة ومعالجة القيم السالبة الناتجة عن أخطاء الإدخال.
المخرجات على الـ Dashboard
إجمالي حجم المبيعات (Total Sales Volume)
إجمالي عدد المنتجات (Total Products)
حصة السوق حسب المبيعات (Brand Market Share)
الفرق بين السعر الأصلي وسعر البيع
توزيع الأسعار (Price Distribution)
مستويات الأسعار (High – Mid – Low) حسب متوسط التقييم
أعلى 5 منتجات من حيث السعر (Top 5 Products by Price)