مشروع متكامل لاكتشاف الرسائل الإلكترونية المزعجة (Spam Detection) باستخدام تقنيات تعلم الآلة ومعالجة اللغة الطبيعية (NLP)، وذلك من خلال بيئة Google Colab بلغة Python.
تفاصيل المشروع:
استخدام مكتبة scikit-learn لتطبيق نماذج تصنيف.
تطبيق معالجة نصوص متقدمة (NLP) باستخدام مكتبة spaCy.
تنظيف البيانات وتحليلها باستخدام pandas.
تحويل النصوص إلى تمثيلات عددية باستخدام TF-IDF.
تدريب النموذج على مجموعة بيانات تحتوي على رسائل "Spam" و"Ham".
تقييم دقة النموذج باستخدام مقاييس مثل الدقة (accuracy) والمصفوفة التشويشية (confusion matrix).
نتائج النموذج:
النموذج حقق نسبة دقة عالية في التنبؤ +%97.
جاهز للاستخدام أو التطوير كجزء من أنظمة البريد الإلكتروني أو التطبيقات الذكية.
التقنيات المستخدمة:
Python
pandas
scikit-learn
spaCy
Google Colab
المشروع قابل للتطوير: مثل تحويله إلى واجهة ويب باستخدام Flask أو دمجه مع نظام بريد إلكتروني فعلي.