يستكشف هذا المشروع نموذجين شائعين للتعلم الآلي، مصنف ناقل الدعم (SVC) ومصنف شجرة القرار، للتعرف على الأرقام المكتوبة بخط اليد. الهدف هو مقارنة أداء كلا النموذجين باستخدام مجموعة بيانات معروفة.
نظرة عامة على المشروع:
يستخدم الكود مجموعة بيانات load_digits من Scikit-learn، والتي تحتوي على مجموعة من صور 8x8 بكسل للأرقام المكتوبة بخط اليد من 0 إلى 9. يتضمن المشروع الخطوات التالية:
تحميل البيانات وتصورها: يتم تحميل مجموعة البيانات وعرض بعض نماذج الصور لتوفير فهم مرئي للبيانات.
تقسيم البيانات: يتم تقسيم البيانات إلى مجموعات تدريب واختبار لتقييم أداء النموذج على البيانات غير المرئية.
التدريب النموذجي والمقارنة: يتم تدريب نموذجين:
SVC (مصنف ناقل الدعم): نموذج قوي للتصنيف، هنا مع نواة rbf لحدود القرار غير الخطية.
شجرة القرار: نموذج بسيط ولكنه فعال قائم على الشجرة.
تقييم الأداء: يتم تقييم النماذج باستخدام درجة الدقة وتقارير التصنيف ومصفوفات الارتباك لتقييم مدى قدرتها على التنبؤ بالأرقام الصحيحة. يتم أيضًا حفظ النتائج في ملف result.txt لسهولة الرجوع إليها.
تصور مصفوفة الارتباك: يتم رسم مصفوفات الارتباك لكلا النموذجين لتحديد الأرقام التي يتم تصنيفها بشكل خاطئ بصريًا.