التنبؤ بالرسائل والايميلات (spam - ham)

تفاصيل العمل

تصنيف الرسائل المزعجة (Spam Detection) باستخدام Machine Learning

فكرة المشروع

يهدف هذا المشروع إلى بناء نموذج ذكاء اصطناعي قادر على تصنيف الرسائل النصية إلى رسائل مزعجة (Spam) أو رسائل عادية (Ham).

تستخدم هذه الأنظمة في العديد من التطبيقات مثل أنظمة البريد الإلكتروني ومنصات التواصل لمنع الرسائل غير المرغوب فيها.

ما الذي تم تنفيذه في المشروع

1️⃣ معالجة البيانات

تم تحميل مجموعة من الرسائل النصية ثم تجهيزها للتحليل من خلال:

تنظيف النصوص

إزالة الكلمات غير المهمة

تحويل النصوص إلى صيغة قابلة لمعالجة الخوارزميات

2️⃣ تحليل البيانات

تم إجراء تحليل أولي للبيانات لفهم:

توزيع الرسائل بين Spam و Ham

الكلمات الأكثر استخدامًا في الرسائل المزعجة

3️⃣ تحويل النصوص إلى بيانات رقمية

تم استخدام تقنيات Text Vectorization لتحويل النصوص إلى تمثيل رقمي باستخدام:

Bag of Words

TF-IDF

4️⃣ بناء نموذج تعلم آلي

تم تدريب نموذج تصنيف باستخدام مكتبة Scikit-learn للتعرف على الرسائل المزعجة بدقة عالية.

5️⃣ تقييم النموذج

تم اختبار النموذج باستخدام عدة مقاييس مثل:

Accuracy

Precision

Recall

=> واجهة تفاعلية للمشروع

تم تطوير Dashboard تفاعلي يسمح للمستخدم بتجربة النموذج بسهولة وإدخال البيانات والحصول على النتائج مباشرة

التقنيات المستخدمة

Python

Pandas

NumPy

Scikit-learn

Natural Language Processing

Jupyter Notebook

نتيجة المشروع

تم بناء نموذج قادر على اكتشاف الرسائل المزعجة تلقائيًا وتصنيف الرسائل النصية بدقة عالية، مما يساعد في تحسين تجربة المستخدم وتقليل الرسائل غير المرغوب فيها.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة