مشروع تحليل وتصنيف الآراء والمشاعر في مقالات شبكة BBC الإخبارية

تفاصيل العمل

الهدف من المشروع:

بناء وتدريب نموذج تعلم آلة قادر على تصنيف المقالات الإخبارية تلقائيًا إلى فئاتها الصحيحة (مثل: رياضة، تكنولوجيا، أعمال)، ثم نشر هذا النموذج في تطبيق ويب تفاعلي سهل الاستخدام ومتاح للجميع.

الميزات الرئيسية:

نموذج تصنيف عالي الأداء: تم تحقيق نتائج متقدمة بدقة (Accuracy) تصل إلى 97%، ومستوى دقة (Precision) يبلغ 97%، ومعدل استدعاء (Recall) يصل إلى 98%، مما يضمن تصنيفًا موثوقًا للمقالات.

تطبيق ويب تفاعلي (Gradio on AWS): واجهة بسيطة تتيح لأي مستخدم إدخال نص مقال والحصول على تصنيفه بشكل فوري ومباشر عبر الإنترنت.

قدرة على التنبؤ اللحظي: النظام مصمم لتقديم نتائج فورية، مما يجعله مناسبًا للتطبيقات التي تتطلب سرعة في الاستجابة.

تم إنجاز هذا المشروع باتباع خطوات واضحة في مجال علم البيانات وتعلم الآلة:

1. المعالجة المسبقة للنصوص (TF-IDF):

تم تحويل النصوص من المقالات إلى متجهات رقمية (Vectors) باستخدام تقنية TF-IDF (Term Frequency-Inverse Document Frequency)، وهي خطوة أساسية لتجهيز البيانات لتكون مفهومة لنموذج تعلم الآلة.

2. بناء وتدريب النموذج (Logistic Regression):

تم اختيار وتدريب نموذج الانحدار اللوجستي (Logistic Regression) نظرًا لفعاليته وسرعته في مهام التصنيف النصي. تم تقييم أداء النموذج بدقة باستخدام مقاييس التقييم المذكورة أعلاه.

3. نشر النموذج (Deployment on AWS):

تم تغليف النموذج النهائي وتطوير واجهة مستخدم تفاعلية له باستخدام مكتبة Gradio في Python، ومن ثم تم نشر التطبيق على منصة الحوسبة السحابية AWS ليكون متاحًا للاستخدام العام وقادرًا على استقبال الطلبات في الوقت الفعلي.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
2
تاريخ الإضافة
تاريخ الإنجاز
المهارات