قمت بتنفيذ مشروع NLP لتحليل مشاعر مراجعات Amazon Fine Food باستخدام Python على Google Colab، بهدف تصنيف المراجعات إلى (Positive / Negative / Neutral) اعتمادًا على النص. بدأت بتحميل البيانات من ملف CSV واختيار الحقول الأساسية (Id, Score, Text) وأخذ عيّنة عشوائية (500 سجل) لتجربة المعالجة وبناء النموذج الأولي بسرعة.
خطوات العمل الأساسية:
قراءة البيانات ومعالجة مشاكل الصفوف غير الصالحة أثناء الاستيراد (on_bad_lines='skip').
تنظيف النصوص (Text Cleaning): تحويل لحروف صغيرة، إزالة الرموز والأرقام، Tokenization، وإزالة Stopwords باستخدام NLTK.
إنشاء عمود cleaned_text للنص بعد التنظيف لتجهيز البيانات للتحليل.
تطبيق تحليل المشاعر باستخدام TextBlob (polarity) ثم تحويل النتيجة إلى تصنيفات: Positive / Negative / Neutral.
إضافة عمود sentiment النهائي داخل الـ DataFrame وعرض أمثلة مقارنة بين النص الأصلي والنص المنظّف.
التقنيات المستخدمة: Python، Pandas، NLTK، TextBlob، Google Colab.