مشروع لتصنيف الرسائل النصية إلى رسائل عادية (Ham) أو رسائل مزعجة (Spam) باستخدام تقنيات معالجة اللغة الطبيعية (NLP) وخوارزميات التعلم الآلي.
? خطوات التنفيذ:
تنظيف النصوص (Text Cleaning)
إزالة الكلمات الشائعة (Stopwords)
تحويل النصوص إلى تمثيل عددي باستخدام TF-IDF
تقسيم البيانات إلى Training و Testing
تدريب نموذج تصنيف (مثل Logistic Regression أو Naive Bayes)
تقييم الأداء باستخدام:
Accuracy
Precision
Recall
F1-Score
Confusion Matrix
? التقنيات المستخدمة:
Python
Pandas
Scikit-learn
TF-IDF Vectorizer
NLP Preprocessing
? الهدف من المشروع:
بناء نظام قادر على كشف الرسائل المزعجة بدقة عالية يمكن دمجه في أنظمة البريد الإلكتروني أو تطبيقات المراسلة.