قمت بتطوير نظام ذكي لاكتشاف وتصنيف الرسائل المزعجة (Spam Detection) باستخدام تقنيات معالجة اللغة الطبيعية (NLP) والتعلم الآلي (Machine Learning).
يعتمد النظام على تحليل نصوص الرسائل واستخراج الخصائص اللغوية المهمة، ثم تدريب نموذج تصنيف قادر على التمييز بين الرسائل العادية (Ham) والرسائل المزعجة (Spam) بدقة عالية.
? مراحل تنفيذ المشروع:
تنظيف البيانات (Text Cleaning)
إزالة كلمات التوقف (Stopwords Removal)
Tokenization و Text Preprocessing
تحويل النصوص إلى تمثيل رقمي باستخدام TF-IDF / Count Vectorizer
تدريب نماذج تصنيف مثل:
Logistic Regression
Naive Bayes
Support Vector Machine (SVM)
مقارنة أداء النماذج لاختيار الأفضل
تقييم الأداء باستخدام:
Accuracy
Precision
Recall
F1-score
Confusion Matrix
النتائج:
حقق النموذج دقة عالية في اكتشاف الرسائل المزعجة مع تقليل معدل الإنذارات الخاطئة (False Positives).
التقنيات المستخدمة:
Python – Scikit-learn – NLP – Pandas – Numpy – Matplotlib – Machine Learning – Text Classification
يمكن تطوير المشروع ليعمل ضمن:
أنظمة البريد الإلكتروني
تطبيقات الرسائل
أنظمة الحماية السيبرانية
API للكشف التلقائي عن الرسائل المزعجة