قمت بتطوير نموذج لتصنيف مراجعات الأفلام على موقع IMDB إلى إيجابية أو سلبية باستخدام تقنيات معالجة اللغة الطبيعية (NLP) وتعلم الآلة.
المشروع اعتمد على عدة طرق لتمثيل النصوص مثل:
Count Vectorizer
TF-IDF
Word2Vec
ثم جربت أكثر من خوارزمية مثل:
(Logistic Regression)
(Naive Bayes)
(Decision Trees)
كما استخدمت GridSearchCV لاختيار أفضل المعاملات (Hyperparameters) وتحسين دقة النماذج.
وفي النهاية تم اختبار النموذج على بيانات جديدة (Test Set) وحقق نتائج جيدة في تصنيف المراجعات بشكل دقيق.