قمت بتطوير نظام ذكي للكشف عن الرسائل المزعجة (Spam) باستخدام تقنيات معالجة اللغة الطبيعية (NLP). يهدف هذا المشروع إلى تصنيف الرسائل النصية إلى فئتين: رسائل مزعجة (Spam) ورسائل عادية (Ham)، مما يساهم في تقليل الرسائل غير المرغوب فيها وتحسين تجربة المستخدم.
تفاصيل المشروع:
تم استخدام مجموعة بيانات تحتوي على رسائل نصية مصنفة مسبقًا.
تم تطبيق خطوات معالجة نصوص مثل: إزالة الرموز، تحويل الحروف إلى صغيرة، إزالة الكلمات الشائعة (stop words)، والتقطيع (tokenization).
استخدمت تقنيات تحويل النص إلى تمثيل عددي مثل TF-IDF أو CountVectorizer.
تم تدريب النموذج باستخدام خوارزميات تعلم الآلة مثل:
Naive Bayes, Logistic Regression أو Support Vector Machine (SVM).
تم تقييم أداء النموذج باستخدام مقاييس مثل: الدقة (Accuracy)، الدقة النوعية (Precision)، والاستدعاء (Recall).
نتائج المشروع:
حقق النموذج دقة عالية في التنبؤ بنوع الرسائل، مما يدل على فعاليته في تصنيف الرسائل المزعجة بدقة وموثوقية.