تفاصيل العمل

فك شفرة سوق مبيعات السيارات باستخدام بايثون

متحمس جداً لمشاركة نتائج مشروعي الثاني في تحليل البيانات! بعد استكشاف بيانات الطلاب، كان الهدف التالي هو الغوص في بيانات مبيعات السيارات لفهم العوامل التي تؤثر على أسعارها. كان هذا المشروع فرصة ممتازة لتطبيق تقنيات تحليلية أكثر عمقاً ورسومات بيانية أكثر تفصيلاً باستخدام Pandas و Matplotlib و Seaborn.

ما الذي تعلمته من البيانات؟

قمت بتحليل العلاقة بين خصائص السيارة وسعرها، وإليك بعض الرؤى الرئيسية التي توصلت إليها من خلال الرسوم البيانية:

1. توزيع أسعار السيارات (Distribution of Car Prices):

هذه الرسمة البيانية التكرارية (Histogram) توضح أن غالبية السيارات في مجموعة البيانات تقع في نطاق سعري منخفض. يمكننا ملاحظة أن معظم مبيعات السيارات تتركز في نطاق الأسعار الأقل، مع وجود عدد قليل من السيارات الفاخرة ذات الأسعار المرتفعة.

2. مصفوفة الارتباط (Correlation Matrix):

تُظهر مصفوفة الارتباط كيف ترتبط المتغيرات الرقمية ببعضها البعض. اللون الداكن يشير إلى ارتباط قوي. الرؤية الأهم هنا هي:

علاقة قوية بين السعر وسنة الصنع: يوجد ارتباط سلبي قوي بين price (السعر) و year (سنة الصنع)، مما يؤكد أن السيارات الأحدث أغلى ثمناً.

علاقة قوية بين السعر وعدد الكيلومترات: يوجد أيضاً ارتباط سلبي واضح بين price (السعر) و mileage (عدد الكيلومترات المقطوعة)، وهذا يعني أن السيارات ذات الكيلومترات الأقل لها أسعار أعلى.

3. توزيع السعر حسب نوع المحرك (Price Distribution by Engine Type):

توضح هذه الرسمة البيانية (Box Plots) أن السيارات ذات المحركات التي تعمل بالبنزين (Petrol) والغاز (Gas) لديها متوسط سعر أعلى مقارنة بالسيارات التي تعمل بالديزل (Diesel). هذه الرؤية تساعد في فهم أنماط التسعير المختلفة بناءً على نوع المحرك، مما قد يكون مهماً للمشترين أو البائعين المحتملين.

الخلاصة:

لقد كانت رحلة رائعة في عالم البيانات! هذا المشروع عزز فهمي لكيفية استخدام التحليل الإحصائي والتمثيل المرئي في اتخاذ قرارات عمل مستنيرة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
4
تاريخ الإضافة
المهارات