يركز هذا المشروع على تنفيذ خوارزمية Naive Bayes لمهام التصنيف. الهدف من المشروع هو تدريب نموذج Naive Bayes على مجموعة بيانات MNIST ، والتي تتكون من صور رقمية مكتوبة بخط اليد ، ثم تقييم أدائها.
يستخدم المشروع مكتبات Python المختلفة لمعالجة البيانات والتصور والتعلم الآلي. يتم استخدام المكتبات التالية:
NumPy: يستخدم للحسابات العددية ومعالجة الصفيف.
الباندا: تستخدم لمعالجة البيانات وتحليلها.
Matplotlib: يستخدم لإنشاء تصورات ، مثل المؤامرات والمخططات.
Seaborn: يستخدم لتعزيز الجماليات البصرية للقسائم.
Scikit-Learn: يستخدم لتقييم النموذج والمقاييس ، بما في ذلك مصفوفة الارتباك ودرجة F1.
Keras: تُستخدم لجلب مجموعة بيانات MNIST وتحميل بيانات التدريب والاختبار.
SciPy: يستخدم للحسابات الإحصائية ، وتحديدا في حساب الاحتمالات.
os: يُستخدم للتفاعل مع نظام التشغيل ، على الرغم من عدم استخدامه صراحةً في مقتطف الشفرة المقدم.
تطبق فئة NaiveBayes في مقتطف الشفرة خوارزمية Naive Bayes. يتضمن طرقًا لحساب الاحتمالات السابقة ، وإحصاءات المتوسط والتباين ، والاحتمالات ، والاحتمالات اللاحقة ، وملاءمة النموذج للبيانات ، وإجراء التنبؤات ، وحساب الدقة. يفترض الفصل توزيعًا غاوسيًا للمعالم.
يتضمن المشروع أيضًا رمزًا لتحميل مجموعة بيانات MNIST ، وتقسيمها إلى مجموعات تدريب واختبار ، وتدريب نموذج Naive Bayes باستخدام بيانات التدريب. ثم يقوم بتقييم دقة النموذج ويعرض مصفوفة الارتباك. بالإضافة إلى ذلك ، فإنه يقارن النتائج مع مصنف Naive Bayes من scikit-Learn.
للتلخيص ، يعرض هذا المشروع تنفيذ خوارزمية Naive Bayes للتصنيف ، وتحديدًا على مجموعة بيانات MNIST ، ويوضح دقة وأداء النموذج باستخدام مقاييس التقييم المختلفة.