يسعدني أن أشارككم مشروعي الأول، حيث عملت على مجموعة بيانات مبيعات سيارات واقعية تضم 30 مصنعًا و157 طرازًا من السيارات، حيث جمعت بين تنظيف البيانات والتعلم الآلي ولوحات المعلومات لتوليد رؤى تجارية فعّالة. ما قمتُ به:
تنظيف ومعالجة البيانات الخام التي تحتوي على قيم ناقصة في أعمدة مهمة مثل السعر، وقوة الحصان، وحجم المحرك، وكفاءة استهلاك الوقود.
استخدام بايثون (scikit-learn) للتنبؤ بالقيم الناقصة باستخدام نماذج التعلم الآلي.
إصلاح صيغ التواريخ غير المتسقة لتحليل دقيق قائم على الوقت.
إنشاء لوحات معلومات تفاعلية باستخدام Power Query وPower Pivot وDAX في Excel للسماح بالاستكشاف الديناميكي للاتجاهات ومقاييس الأداء.
الرؤى الرئيسية:
إجمالي الوحدات المباعة: أكثر من 8.3 مليون وحدة.
إجمالي الإيرادات: 181.8 مليار دولار.
السيارات الخفيفة = 70.7% من إجمالي الأرباح.
أكبر 5 شركات مصنعة = 53.14% من الأرباح (فورد، دودج، تويوتا، هوندا، شيفروليه).
اكتشاف علاقات قوية بين السعر وميزات مثل قوة الحصان، وحجم المحرك، وكفاءة استهلاك الوقود.
جميع الرؤى قابلة للاستكشاف بالكامل عبر أدوات التقطيع ولوحات المعلومات في Excel.