المشروع يهدف إلى بناء نموذج ذكي لتصنيف الرسائل النصية (Text Classification) باستخدام تقنيات تعلم الآلة (Machine Learning). تم تنفيذ الخطوات الأساسية التالية:
تنظيف البيانات ومعالجتها (Data Cleaning & Preprocessing)
إزالة البيانات غير الضرورية وتنظيم النصوص لتجهيزها للنموذج.
تحويل النصوص إلى مميزات رقمية باستخدام TF-IDF Vectorizer
تمثيل الكلمات في صورة أرقام تعكس أهميتها داخل النصوص.
ترميز الفئات (Encoding) باستخدام Label Encoder
تحويل تصنيفات الرسائل النصية إلى قيم رقمية قابلة للمعالجة.
تدريب نموذج Naive Bayes متعدد الحدود (Multinomial Naive Bayes)
بناء وتدريب النموذج لاكتساب القدرة على التنبؤ بتصنيفات الرسائل بدقة.
بناء واجهة تفاعلية باستخدام Streamlit
تصميم تطبيق بسيط يمكن من خلاله إدخال نصوص جديدة ورؤية تصنيف النموذج لها بشكل مباشر.