مقدمة:
موقع هتلاقي (Hatla2ee) هو أحد أشهر المنصات في العالم العربي لبيع وشراء السيارات الجديدة والمستعملة. يتيح الموقع للمستخدمين البحث عن السيارات بناءً على معايير مختلفة مثل الموديل، السعر، الحالة، ونوع الوقود. يهدف هذا التحليل إلى دراسة بيانات الموقع لاستخراج رؤى قيّمة حول سوق السيارات المستعملة، اتجاهات الأسعار، والعوامل التي تؤثر على قرارات الشراء والبيع.
أهداف التحليل:
تحليل السوق: فهم توزيع أسعار السيارات المستعملة وعوامل تحديد الأسعار.
اكتشاف الاتجاهات: تحديد أشهر الموديلات والعلامات التجارية الأكثر تداولًا.
العوامل المؤثرة: تحليل تأثير عدد الكيلومترات، سنة الصنع، ونوع الوقود على السعر.
توقع الأسعار: بناء نموذج تنبؤي لتقدير سعر السيارة بناءً على خصائصها.
المنهجية:
1. جمع البيانات:
استخراج البيانات من موقع هتلاقي باستخدام Web Scraping أو الحصول عليها من مصادر رسمية إن أمكن.
تشمل البيانات الأعمدة التالية:
الماركة (Brand) – مثل تويوتا، هيونداي، كيا، مرسيدس.
الموديل (Model) – مثل كورولا، إلنترا، سيراتو.
سنة الصنع (Year) – السنة التي تم فيها تصنيع السيارة.
عدد الكيلومترات (Kilometers Driven) – المسافة التي قطعتها السيارة.
نوع الوقود (Fuel Type) – بنزين، ديزل، كهرباء، هجين.
السعر (Price) – السعر المعروض للبيع.
الموقع الجغرافي (Location) – المدينة أو الدولة التي تُعرض فيها السيارة.
2. استكشاف وتحليل البيانات (EDA):
حساب المتوسطات والانحرافات المعيارية للأسعار بناءً على الماركة والموديل.
تحليل توزيع الأسعار باستخدام المخططات البيانية مثل الهيستوغرامات (Histograms).
إنشاء مصفوفة الارتباط (Correlation Matrix) لمعرفة العوامل الأكثر تأثيرًا على السعر.
تحليل اتجاهات السوق مثل أكثر الماركات مبيعًا، وأفضل الفترات للشراء أو البيع.
3. معالجة البيانات:
تنظيف البيانات من القيم المفقودة والقيم غير المنطقية.
ترميز البيانات الفئوية (مثل الماركة والموديل) إلى أرقام لاستخدامها في التحليل الإحصائي.
التعامل مع القيم المتطرفة (Outliers) مثل الأسعار المبالغ فيها.
4. بناء نموذج تنبؤي لتقدير الأسعار:
تجربة خوارزميات مثل:
Linear Regression لتوقع الأسعار بناءً على العوامل المتاحة.
Random Forest & XGBoost للحصول على تنبؤات دقيقة تأخذ في الاعتبار العلاقات غير الخطية.
تقييم أداء النماذج باستخدام مقاييس مثل RMSE (Root Mean Square Error) وR² Score.
5. استخلاص التوصيات والتقارير:
تقديم توصيات للمشترين حول أفضل الأوقات لشراء السيارات.
تحديد السيارات التي تحافظ على قيمتها بعد عدة سنوات من الاستخدام.
تحليل تأثير الوقود والتكنولوجيا على قرارات الشراء في المستقبل.