قمت بتطوير مشروع News Headline Classifier، وهو أول مشروع NLP لي، يهدف لتصنيف عناوين الأخبار إلى أربع فئات: SPORTS, CRIME, EDUCATION, COMEDY باستخدام تقنيات تعلم الآلة التقليدية.
أبرز المميزات:
خوارزمية: Multinomial Naive Bayes مع CountVectorizer (1-3 n-grams)
واجهة تفاعلية باستخدام Gradio لتجربة سهلة وسريعة
نشر المشروع على Hugging Face Spaces للوصول العام
معالجة البيانات مع Balanced Sampling لضمان دقة التصنيف
التقنيات المستخدمة:
Python, Scikit-learn
Gradio (UI)
Data Processing: Pandas, NumPy
Deployment: Hugging Face Spaces
ميزات التطبيق:
تصنيف العناوين بشكل مباشر وسريع
عرض احتمالات كل فئة لكل عنوان
واجهة نظيفة وسهلة الاستخدام
مناسب للمبتدئين في NLP
تدريب سريع على مجموعة بيانات صغيرة
رحلتي التعليمية:
هذا المشروع يمثل خطوتي الأولى في معالجة اللغة الطبيعية (NLP) ويغطي كل خطوات العمل من تحضير البيانات → تدريب النموذج → النشر. كل خطوة كانت تجربة تعليمية قيّمة.