في هذا المشروع، قمت ببناء نموذج تعلم آلة (Machine Learning Model) يهدف إلى تحليل مشاعر المستخدمين على منصة تويتر (Twitter Sentiment Analysis). الهدف الرئيسي هو تصنيف التغريدات إلى (إيجابية، سلبية، محايدة) لفهم توجهات الرأي العام حول موضوع معين أو علامة تجارية.
الخطوات التي قمت بتنفيذها:
1- جمع وفهم البيانات: استخدام مجموعة بيانات تحتوي على آلاف التغريدات المتنوعة.
2- تجهيز وتنظيف النصوص (Text Preprocessing):
إزالة الرموز غير الضرورية، الروابط، وعلامات الترقيم.
تنظيف النصوص (Stop-words removal, Tokenization, Stemming/Lemmatization).
3- تحويل النصوص إلى أرقام (Feature Engineering): استخدام تقنيات مثل TF-IDF و CountVectorizer لتحويل النصوص إلى متجهات رقمية يمكن للنموذج فهمها.
4- بناء النموذج (Model Building): تدريب عدة خوارزميات مثل (Logistic Regression, Naive Bayes, SVM) واختيار الأفضل بينهم من حيث الدقة.
5- تقييم النموذج: استخدام مصفوفة الارتباك (Confusion Matrix) وقياس الدقة (Accuracy Score) لضمان كفاءة النتائج.