ملخص المشروع:
يحلل هذا المشروع بيانات التجارة الإلكترونية الحقيقية من البرازيل (Olist Brazilian E-commerce Dataset) لفهم سلوك العملاء والتنبؤ بتأخيرات التوصيل. شمل المشروع تنظيف البيانات، إنشاء الميزات، التحليل الاستكشافي للبيانات، وبناء نماذج التعلم الآلي.
أهم النقاط:
يحتوي dataset على 100,756 طلب و21 ميزة، وتم تحليل 96,478 طلب مسلَّم. أغلب العملاء موجودون في SP (41,746)، RJ (12,852)، وMG (11,635). طرق الدفع تشمل بطاقة ائتمان (76,795)، boleto (19,784)، قسائم (5,775)، وبطاقة خصم (1,529). كانت تقييمات العملاء إيجابية بشكل عام، حيث حصل 57,328 على تقييم 5 و19,142 على تقييم 4.
أفكار من التحليل الاستكشافي:
تظهر الطلبات نموًا واضحًا مع مرور الوقت، مع ذروة في 2018. أظهر تحليل الارتباط أن تكلفة الشحن، القيمة الإجمالية للطلب، وعدد دفعات الدفع تؤثر بشكل كبير على مدة التوصيل.
نتائج النمذجة وأهمية الميزات:
حقق نموذج XGBoost دقة 92.7%، بينما وصل Random Forest إلى 91.4%. أهم الميزات المؤثرة على مدة التوصيل كانت تكلفة الشحن (37.6%)، القيمة الإجمالية للطلب (34.0%)، وعدد دفعات الدفع (28.3%).
أفكار تجارية:
الطلبات ذات تكلفة شحن أعلى أو قيمة إجمالية أكبر تميل إلى تأخير التوصيل قليلاً. عدد دفعات الدفع وموقع العميل عوامل مهمة لتوقع التأخيرات. يمكن للمنصات الإلكترونية تحسين اللوجستيات بالتركيز على الولايات ذات حجم الطلبات الكبير مثل SP وRJ وMG.
الخلاصة:
يوضح المشروع كيف يمكن لتقنيات التعلم الآلي التنبؤ بتأخيرات التوصيل بفاعلية وتقديم رؤى عملية لتحسين رضا العملاء وكفاءة العمليات اللوجستية.