تحليل بيانات متجر إلكتروني والتنبؤ بالعملاء ذوي القيمة العالية

تفاصيل العمل

في هذا المشروع قمت بتنفيذ عملية كاملة لتحليل البيانات وبناء نموذج تعلم آلي باستخدام بيانات حقيقية لمعاملات متجر إلكتروني. كان الهدف من المشروع هو فهم سلوك العملاء والتنبؤ بالعملاء ذوي القيمة العالية.

تتكون البيانات من 392,692 عملية شراء لعملاء من عدة دول. في البداية قمت بمرحلة تنظيف البيانات، والتي تضمنت معالجة القيم المفقودة، إزالة عمليات إرجاع المنتجات (القيم السالبة في الكمية)، حذف التكرارات، بالإضافة إلى إنشاء متغيرات جديدة مثل القيمة الإجمالية للطلب.

من خلال تحليل البيانات الاستكشافي (EDA) ظهرت عدة ملاحظات مهمة، حيث أن المملكة المتحدة تمثل النسبة الأكبر من المبيعات، تليها دول مثل هولندا وأيرلندا وألمانيا. كما أظهر تحليل المنتجات أن بعض المنتجات مثل

Paper Craft Little Birdie و Medium Ceramic Top Storage Jar من أكثر المنتجات مبيعًا.

بعد ذلك قمت بإنشاء مجموعة بيانات على مستوى العميل تضمنت عدة خصائص مهمة مثل:

عدد مرات الشراء (Frequency)

إجمالي عدد المنتجات المشتراة

إجمالي الإنفاق (Monetary Value)

تم تحويل المشكلة إلى مشكلة تصنيف بهدف التنبؤ بالعملاء ذوي القيمة العالية. بعد ذلك تم تقسيم البيانات إلى بيانات تدريب واختبار، ثم تطبيق تقييس البيانات (Scaling) قبل استخدام تحليل المكونات الرئيسية (PCA) لتقليل الأبعاد وعرض البيانات بصريًا.

أوضحت نتائج PCA أن أول مكونين يفسران 100٪ من التباين في البيانات (72.9٪ و27.1٪)، مما سمح بتمثيل البيانات في بعدين.

تم تدريب عدة نماذج تعلم آلي باستخدام تقنيات Ensemble Learning مثل:

Random Forest

Bagging Classifier

Voting Classifier

وقد حقق نموذج Random Forest دقة تقارب 90٪ في التنبؤ بالعملاء ذوي القيمة العالية، مما يدل على قدرة النموذج على التعرف على أنماط سلوك العملاء.

يعرض هذا المشروع دورة كاملة لمشروع علم بيانات حقيقي، بدءًا من تنظيف البيانات وتحليلها وصولًا إلى بناء النماذج التنبؤية، كما يمكن أن يساعد هذا النوع من التحليل شركات التجارة الإلكترونية على فهم عملائها بشكل أفضل وتحسين استراتيجيات التسويق.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
المهارات