تصنيف الرسائل المزعجة (Spam Detection) باستخدام Machine Learning
فكرة المشروع
يهدف هذا المشروع إلى بناء نموذج ذكاء اصطناعي قادر على تصنيف الرسائل النصية إلى رسائل مزعجة (Spam) أو رسائل عادية (Ham).
تستخدم هذه الأنظمة في العديد من التطبيقات مثل أنظمة البريد الإلكتروني ومنصات التواصل لمنع الرسائل غير المرغوب فيها.
ما الذي تم تنفيذه في المشروع
1️⃣ معالجة البيانات
تم تحميل مجموعة من الرسائل النصية ثم تجهيزها للتحليل من خلال:
تنظيف النصوص
إزالة الكلمات غير المهمة
تحويل النصوص إلى صيغة قابلة لمعالجة الخوارزميات
2️⃣ تحليل البيانات
تم إجراء تحليل أولي للبيانات لفهم:
توزيع الرسائل بين Spam و Ham
الكلمات الأكثر استخدامًا في الرسائل المزعجة
3️⃣ تحويل النصوص إلى بيانات رقمية
تم استخدام تقنيات Text Vectorization لتحويل النصوص إلى تمثيل رقمي باستخدام:
Bag of Words
TF-IDF
4️⃣ بناء نموذج تعلم آلي
تم تدريب نموذج تصنيف باستخدام مكتبة Scikit-learn للتعرف على الرسائل المزعجة بدقة عالية.
5️⃣ تقييم النموذج
تم اختبار النموذج باستخدام عدة مقاييس مثل:
Accuracy
Precision
Recall
=> واجهة تفاعلية للمشروع
تم تطوير Dashboard تفاعلي يسمح للمستخدم بتجربة النموذج بسهولة وإدخال البيانات والحصول على النتائج مباشرة
التقنيات المستخدمة
Python
Pandas
NumPy
Scikit-learn
Natural Language Processing
Jupyter Notebook
نتيجة المشروع
تم بناء نموذج قادر على اكتشاف الرسائل المزعجة تلقائيًا وتصنيف الرسائل النصية بدقة عالية، مما يساعد في تحسين تجربة المستخدم وتقليل الرسائل غير المرغوب فيها.