Retail Data Analysis & Machine Learning Project
مشروع متكامل في تحليل البيانات وتعلم الآلة يهدف إلى استخراج رؤى عملية من بيانات البيع بالتجزئة، من خلال تقسيم العملاء والتنبؤ بقيمة المبيعات لدعم اتخاذ القرار.
---
Customer Segmentation (تقسيم العملاء)
تم استخدام تقنيات التعلم غير المراقب لتحليل سلوك العملاء اعتمادًا على نموذج RFM (Recency, Frequency, Monetary)، بهدف تصنيف العملاء إلى شرائح واضحة تساعد في تحسين الاستهداف التسويقي.
تم تطبيق خوارزميات:
* K-Means لتقسيم العملاء إلى مجموعات مثل العملاء المميزين والعملاء غير النشطين
* DBSCAN لاكتشاف القيم الشاذة
كما تم استخدام PCA لتقليل الأبعاد وتحسين عرض النتائج بصريًا.
النتائج أظهرت أن K-Means قدم أداء أفضل من حيث جودة التقسيم، مما ساعد في تحديد شرائح قابلة للاستخدام في الحملات التسويقية.
---
Sales Classification (التنبؤ بالمبيعات)
تم بناء نموذج تصنيف للتنبؤ بما إذا كانت عملية البيع تحقق قيمة مرتفعة أو منخفضة، وذلك من خلال:
* إنشاء متغير هدف بناءً على أعلى 30% من المبيعات
* معالجة البيانات (القيم الناقصة، الترميز، اختيار الخصائص)
* التعامل مع مشكلة عدم توازن البيانات
تم استخدام عدة نماذج:
* Logistic Regression كنموذج أساسي
* Decision Tree
* CatBoost
حقق نموذج Decision Tree أفضل أداء بدقة وصلت إلى حوالي 98.6%، متفوقًا على باقي النماذج.
---
مميزات المشروع
* دمج بين التحليل الاستكشافي وتطبيقات تعلم الآلة
* مقارنة بين عدة خوارزميات واختيار الأفضل بناءً على الأداء
* تقديم نتائج مدعومة بتحليل بصري واضح
* إمكانية تطبيق النتائج في تحسين التسويق وزيادة الأرباح
---
التقنيات المستخدمة
* Python
* Pandas وNumPy
* Scikit-learn
* CatBoost
* Matplotlib وSeaborn
الهدف من المشروع
مساعدة الشركات على فهم سلوك العملاء بشكل أعمق، تحسين استراتيجيات التسويق، والتنبؤ بالمبيعات لدعم اتخاذ قرارات مبنية على البيانات.
.