هذا المشروع Text Classification LST هو نموذج لتصنيف النصوص باستخدام الشبكات العصبية التكرارية (LSTMs). يهدف المشروع إلى تصنيف النصوص إلى فئات محددة بناءً على بيانات التدريب المتوفرة.
مميزات المشروع:
استخدام LSTM: يتم توظيف شبكات الذاكرة طويلة المدى (LSTM) لاستخراج الأنماط من النصوص وتحسين دقة التصنيف.
تنظيف البيانات ومعالجتها: يشمل المشروع تقنيات معالجة اللغة الطبيعية (NLP) مثل إزالة التكرارات، تحويل النصوص إلى أعداد صحيحة، واستخدام التضمين (Embeddings).
التدريب والتقييم: يتم تدريب النموذج على مجموعة بيانات محددة مع تقسيمها إلى بيانات تدريب واختبار لضمان دقة التوقعات.
إمكانية التخصيص: يمكن تعديل النموذج ليتناسب مع تطبيقات مختلفة مثل تحليل المشاعر، تصنيف الأخبار، وتصفية البريد العشوائي.
تقنيات مستخدمة:
Python – لغة البرمجة الأساسية للمشروع.
TensorFlow/Keras – لإنشاء وتدريب النموذج العصبي.
NLTK & spaCy – لمعالجة وتحليل النصوص.
Pandas & NumPy – لتحليل البيانات ومعالجتها.
المشروع مفيد للأشخاص المهتمين بتصنيف النصوص باستخدام التعلم العميق، ويمكن تطويره ليشمل مزيدًا من الميزات مثل الترجمة الآلية أو إنشاء ملخصات النصوص