الهدف كان توضيح كيفية تطبيق أشجار القرار على مهام التصنيف، مع ممارسة تحليل البيانات الاستكشافي وبناء مسار كامل للتعلم الآلي و استخدمت لتوضيح ذلك الاتي :
حليل البيانات الاستكشافي (EDA)
فهم بنية مجموعة البيانات
التحقق من توزيع الفئات
تصوّر العلاقات بين السمات والفئات المستهدف.
معالجة البيانات مسبقًا
معالجة السمات الفئوي
تقسيم البيانات إلى مجموعات تدريب واختبار
بناء النموذج
تدريب مُصنّف شجرة القرار للتنبؤ بفئات تقييم السيارات
ضبط المعاملات الفائقة مثل أقصى عمق ومعايير التقسيم (جيني/إنتروبيا)
تقييم النموذج
حساب درجة الدقة
إنشاء تقرير تصنيف (الدقة، التذكير، درجة F1)
تصوّر مصفوفة الارتباك
رسم شجرة القرار لتفسير قرارات النموذج