يهدف هذا العمل إلى بناء نموذج ذكي لتصنيف الرسائل النصية (SMS) إلى Ham (غير مزعجة) أو Spam (مزعجة) باستخدام تقنيات معالجة النصوص والذكاء الاصطناعي.
تم استخدام تقنيات التنظيف النصي (إزالة الرموز، تحويل النصوص للحروف الصغيرة، إزالة الكلمات الشائعة، التجذير)، وتحويل النصوص إلى تمثيل عددي باستخدام CountVectorizer.
تم تدريب النموذج باستخدام خوارزمية Multinomial Naive Bayes وحقق دقة عالية بلغت حوالي 97.9% على بيانات الاختبار.
ميزات العمل:
معالجة نصوص احترافية للتعامل مع الضوضاء في البيانات.
أداء عالي في التعرف على الرسائل المزعجة وتقليل الأخطاء.
إمكانية تحسين النموذج بتجربة تقنيات أخرى مثل TF-IDF أو خوارزميات بديلة.
تقرير مفصل عن الأداء مع مصفوفة الالتباس، ودقة، واسترجاع، وF1-score.