تفاصيل العمل

1. استكشاف البيانات (Data Explore)

الخطوات التالية لاستكشاف البيانات:

عرض أول 5 صفوف من البيانات باستخدام head()

معرفة حجم البيانات: 2150 صف و 12 عمود

التأكد من وجود أعمدة مكررة: عمود Gender مكرر مرتين

معرفة أنواع البيانات: أعمدة رقمية وأخرى نصية

اكتشاف القيم المفقودة: توجد قيم فارغة في عدة أعمدة مثل Age و Gender و Phone

اكتشاف قيم غير منطقية: مثل وجود أعمار بقيمة -1

2. تنظيف البيانات (Data Cleaning)

قام المحلل بتنظيف البيانات كالتالي:

أولاً: حذف الأعمدة غير المرغوب فيها

تم حذف الأعمدة المكررة Unnamed و Gender

ثانياً: معالجة التكرارات

تم حذف الصفوف المكررة

ثالثاً: معالجة القيم المفقودة

تم تعبئة القيم المفقودة في عمود Age باستخدام المتوسط

تم تعبئة القيم المفقودة في عمود ProductCategory باستخدام كلمة "unknown"

تم تعبئة القيم المفقودة في عمود Phone باستخدام "Unknown"

تم تعبئة القيم المفقودة في عمود PurchaseDate باستخدام القيمة الأكثر تكراراً (mode)

تم تعبئة القيم المفقودة في عمود Rating باستخدام الوسيط (median)

تم تعبئة القيم المفقودة في عمود Purchaseamount باستخدام الوسيط (median)

تم تعبئة القيم المفقودة في عمود Gender باستخدام القيمة الأكثر تكراراً (mode)

رابعاً: معالجة القيم الشاذة

تم تحويل عمود PurchaseDate إلى صيغة تاريخ صحيحة

تم استبدال القيم السالبة في عمود Age بقيمة المتوسط

تم تحديد القيم المتطرفة (Outliers) في عمود Age باستخدام طريقة IQR (الربعيات)

تم حذف القيم المتطرفة والاحتفاظ فقط بالأعمار بين 0 و 100

3. تصور البيانات (Data Visualization)

إنشاء عدة رسوم بيانية لفهم البيانات:

رسوم توزيع المتغيرات العددية (Histogram):

توزيع الأعمار (Age)

توزيع قيمة المشتريات (Purchaseamount)

توزيع التقييمات (Rating)

رسوم إحصائية للفئات (Countplot):

توزيع العملاء حسب الجنس (Gender)

توزيع العملاء حسب فئة المنتج (ProductCategory)

توزيع العملاء حسب البريد الإلكتروني (Email)

4. تحليل البيانات (Data Analysis)

العلاقات بين المتغيرات:

تم حساب مصفوفة الارتباط (Correlation Matrix) بين المتغيرات العددية

تم إنشاء خريطة (Heatmap) لتوضيح الارتباطات

النتيجة: العلاقات بين العمر وقيمة المشتريات والتقييم ضعيفة جداً (قريبة من الصفر)

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
5
تاريخ الإضافة
المهارات