تم تنفيذ مشروع تحليل بيانات لسيارات مستعملة باستخدام لغة Python ومكتبات تحليل البيانات والتعلم الآلي بهدف:
تنظيف ومعالجة البيانات (Data Cleaning & Preprocessing)
تطبيق خوارزمية K-Means لتجميع السيارات حسب الخصائص المختلفة
استخدام Elbow Method لتحديد العدد الأمثل للعناقيد (Clusters)
بناء نموذج Logistic Regression لتصنيف السيارات إلى رخيصة أو مرتفعة السعر
تقييم أداء النموذج باستخدام ROC Curve وقياس AUC
الأدوات المستخدمة:
Pandas لمعالجة البيانات
NumPy للحسابات العددية
Matplotlib لعرض الرسوم البيانية
Scikit-learn لبناء نماذج التعلم الآلي
النتائج:
تحديد عدد مناسب من المجموعات باستخدام Elbow Method
بناء نموذج تصنيف حقق أداء قوي (AUC مرتفع)
استخراج Insights تساعد في فهم العوامل المؤثرة على سعر السيارة
المشروع قابل للتطوير ليصبح نظام توقع أسعار كامل أو Dashboard تفاعلي.
المشروع قابل للتطبيق على أي Dataset مشابه، وإن الكود منظم وقابل لإعادة الاستخدام.