Twitter Spam Detection using Natural Language Processing (NLP)

تفاصيل العمل

تم تطوير نظام ذكاء اصطناعي يهدف إلى تصنيف التغريدات على منصة تويتر إلى رسائل مزعجة (Spam) أو غير مزعجة (Ham)، بالاعتماد على تقنيات معالجة اللغة الطبيعية (NLP) وخوارزميات تعلم الآلة.

يرتكز المشروع على تحويل النصوص الخام إلى تمثيلات رقمية يُمكن للآلة فهمها، مثل:

تنظيف البيانات النصية وإزالة الكلمات غير المفيدة

تحويل الكلمات إلى تمثيلات عددية (TF-IDF, CountVectorizer)

تدريب نماذج تصنيف مثل Naive Bayes وLogistic Regression

أهداف المشروع ومكوناته الرئيسية

تنظيف البيانات النصية (إزالة الرموز، الروابط، الكلمات الشائعة)

تحليل المشاعر والكلمات المفتاحية في التغريدات

تحويل النصوص إلى شكل قابل للتعلم باستخدام تقنيات التمثيل الرقمي

بناء نموذج تصنيفي يميز الرسائل المزعجة بدقة

تقييم أداء النموذج باستخدام المقاييس المناسبة (الدقة، الاسترجاع، F1-score)

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
5
تاريخ الإضافة
تاريخ الإنجاز