تحليل وتصنيف أسعار السيارات المستعملة باستخدام Machine Learning (K-Means & Logistic Regression)

تفاصيل العمل

تم تنفيذ مشروع تحليل بيانات لسيارات مستعملة باستخدام لغة Python ومكتبات تحليل البيانات والتعلم الآلي بهدف:

تنظيف ومعالجة البيانات (Data Cleaning & Preprocessing)

تطبيق خوارزمية K-Means لتجميع السيارات حسب الخصائص المختلفة

استخدام Elbow Method لتحديد العدد الأمثل للعناقيد (Clusters)

بناء نموذج Logistic Regression لتصنيف السيارات إلى رخيصة أو مرتفعة السعر

تقييم أداء النموذج باستخدام ROC Curve وقياس AUC

الأدوات المستخدمة:

Pandas لمعالجة البيانات

NumPy للحسابات العددية

Matplotlib لعرض الرسوم البيانية

Scikit-learn لبناء نماذج التعلم الآلي

النتائج:

تحديد عدد مناسب من المجموعات باستخدام Elbow Method

بناء نموذج تصنيف حقق أداء قوي (AUC مرتفع)

استخراج Insights تساعد في فهم العوامل المؤثرة على سعر السيارة

المشروع قابل للتطوير ليصبح نظام توقع أسعار كامل أو Dashboard تفاعلي.

المشروع قابل للتطبيق على أي Dataset مشابه، وإن الكود منظم وقابل لإعادة الاستخدام.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
2
تاريخ الإضافة
تاريخ الإنجاز
المهارات