تفاصيل العمل

تم تنفيذ مشروع في مجال Sentiment Analysis باستخدام تقنيات (NLP)، حيث كان الهدف هو اكتشاف المحتوى العنصري في التغريدات. بدأ المشروع بتحميل ملف CSV الذي يحتوي على 31,962 تغريدة مع تسميات تشير إلى وجود محتوى عنصري أو عدم وجوده. تم عمل في البدايه Text Preprossing، حيث تمت إزالة ال stop words وال Puctuation وعمل Stemming للكلمات ، وكذلك ازاله المستخدمين (@user).

ثم تم تحويل التغريدات إلى مصفوفة من الميزات باستخدام تقنية Bag of Words (BoW) لتمثيل النصوص بشكل رقمي. بعد ذلك، تم تقسيم البيانات إلى مجموعة تدريب واختبار، وتم تدريب نموذج Logistic Regression على مجموعة التدريب. تم تقييم أداء النموذج باستخدام مقاييس مثل accuracy score حيث وصلت دقه الModel الي اكثر من 94%.

ثم تم إجراء تحليل تصاعدي للكلمات الشائعة في التغريدات باستخدام Word Cloud لفهم المزيد حول المحتوى.

وفي الختام، تم تصميم واجهة مستخدم تسمح للمستخدم بإدخال جملة لتحليلها والحصول على تقييم حول وجود محتوى عنصري فيها. يعكس المشروع قدرتي على التعامل مع تحليل النصوص وتدريب نماذج التعلم الآلي بغرض فحص المحتوى بطريقة فعّالة وتوضيحية.

وقمت ايضا بعمل برزنتيشن يوضح فكره المشروع مع ارفاق بعض الصور للتوضيح اكثر.

ملفات مرفقة

بطاقة العمل

اسم المستقل Mohamed D.
عدد الإعجابات 0
عدد المشاهدات 55
تاريخ الإضافة
تاريخ الإنجاز