يهدف هذا المشروع إلى تصنيف المقالات الإخبارية إلى "زائفة" أو "حقيقية" باستخدام نموذج مبني بلغة Python. يعتمد المشروع على تقنيات معالجة اللغة الطبيعية (NLP) وخوارزمية Passive Aggressive Classifier من مكتبة scikit-learn، بالإضافة إلى تحويل النصوص إلى متجهات باستخدام TF-IDF.
⭐ الميزات:
معالجة أولية للنصوص:
تحويل الأحرف إلى صغيرة
إزالة علامات الترقيم
إزالة الكلمات الشائعة (stopwords)
استخدام TF-IDF Vectorization لتمثيل النصوص.
تدريب نموذج باستخدام Passive Aggressive Classifier.
تقييم النموذج من خلال دقة التصنيف ومصفوفة الالتباس (Confusion Matrix).
يستخدم مكتبات مشهورة مثل:
NLTK
pandas
scikit-learn