تفاصيل العمل

نوع العمل ومميزاته (Nature of the Work and its Features)

العمل هو تحليل البيانات وتنقيتها، مع التركيز على إنشاء رؤى قيمة من خلال جداول محورية (Pivot Tables) لاستخراج معلومات مهمة من البيانات، والإجابة على أسئلة العمل الرئيسية.

مميزات هذا العمل تشمل:

تنقية البيانات: عملية دقيقة لتصحيح الأخطاء في البيانات، ومعالجة القيم المفقودة، وتوحيد التنسيقات لضمان دقتها.

التحليل الإحصائي: استخدام الجداول المحورية لتحليل البيانات بسرعة واستخلاص معلومات دقيقة مثل إجمالي المبيعات، ومشاركات العلامات التجارية، وتوزيع الأسعار.

توفير رؤى مهمة: تحويل البيانات الخام إلى رؤى قابلة للتنفيذ لمساعدة الشركة على اتخاذ قرارات أفضل بشأن الأسعار، والمنتجات، والعلامات التجارية.

طريقة التنفيذ (Execution Methodology)

تم تنفيذ العمل بطريقة منهجية لضمان دقة وجودة المخرجات النهائية. إليك الخطوات الرئيسية للمنهجية:

1. تنقية البيانات (Data Cleaning)

عنوان المنتج (product title): تم توحيد أسماء المنتجات باستخدام تنسيقات clean و trim و Capitalize Each Word للتخلص من التكرار والاختلافات في الكتابة.

سعر المنتج والسعر الأصلي (product price & original price): تم حساب المتوسط لتعويض القيم المفقودة (null) وتقريب الأرقام العشرية إلى منزلتين عشريتين.

تقييم النجوم (star rating): تم معالجة الأخطاء التي كانت في صيغة بيانات نصية عن طريق تقسيم العمود بناءً على فاصل (delimiter) واستبدال القيم الفارغة (null) بـ 0.

الحد الأدنى لسعر العرض (product_minimum_offer_price): تم حساب هذا العمود بطرح السعر الحالي من السعر الأصلي، ثم استخدام عمود شرطي لتعويض القيم المفقودة (null).

العلامة التجارية (Brand): تم إنشاء عمود جديد للعلامات التجارية باستخدام عمود شرطي لتصنيف المنتجات إلى علامات تجارية محددة (Samsung, iPhone, Moto, Nokia, Panasonic) وغيرها.

توفر المنتج (product_availability): تم حذف هذا العمود لأنه يحتوي على قيم فارغة في الغالب وغير ضروري للحسابات.

حجم المبيعات (sales volume): تم استبدال القيم النصية غير المعروفة بقيم فارغة (null)، ثم تم تقسيم العمود واستبدال حرف "k" بـ "000" لتحويل القيم إلى أرقام.

2. إنشاء الجداول المحورية (Creating Pivot Tables)

بعد تنظيف البيانات، تم إنشاء جداول محورية لاستخراج الرؤى التالية:

إجمالي حجم المبيعات (Total Sales Volume): لمعرفة إجمالي حجم المبيعات.

إجمالي عدد المنتجات (Total Products): لمعرفة العدد الإجمالي للمنتجات المتاحة.

حصة السوق للعلامة التجارية (Brand Market Share): لمعرفة حصة كل علامة تجارية في السوق بناءً على حجم المبيعات.

الفرق بين السعر الأصلي وسعر المنتج: لمعرفة الفرق بين السعرين، مع الإشارة إلى أن القيم السالبة في هذا العمود قد تكون أخطاء في البيانات.

توزيع الأسعار (Price Distribution): لفهم كيفية توزيع الأسعار عبر المنتجات المختلفة.

مستوى السعر حسب متوسط تقييم النجوم: لتحديد ما إذا كانت المنتجات ذات الأسعار العالية أو المتوسطة أو المنخفضة تحصل على تقييمات أعلى.

أعلى 5 منتجات حسب السعر: لتحديد أغلى 5 منتجات.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
2
تاريخ الإضافة
تاريخ الإنجاز
المهارات