مشروع تصنيف رسائل SMS (مزعجة أو عادية) باستخدام الذكاء الاصطناعي
المشروع ده بيطبق نظام كامل من الذكاء الاصطناعي علشان يصنّف الرسائل النصية تلقائيًا إلى
: رسائل عادية (Ham)_ رسائل مزعجة (Spam)
وبيحل مشكلة حقيقية وهي التخلص من الرسائل المزعجة، وتحسين تجربة المستخدم، وكمان الحماية من النصب أو الرسائل الوهمية.
أهم مميزات المشروع:
_معالجة النصوص (Text Preprocessing)
بيتم تنظيف الرسائل من: الرموز _الأرقام _الكلمات غير المهمة
وكمان بيتم تبسيط الكلمات علشان الكمبيوتر يفهمها بسهولة.
_ تحويل الكلام لأرقام (Feature Extraction)
بيتم تحويل الرسائل إلى أرقام باستخدام طريقة TF-IDF، علشان الكمبيوتر يقدر يحللها ويفهم أهمية كل كلمة
_تدريب النموذج (Model Training)
المشروع بيستخدم نموذج اسمه:
Linear Support Vector Classifier (LinearSVC)
وده نموذج قوي جدًا في تصنيف النصوص بدقة عالية.
_تقييم الأداء (Model Evaluation)
بيتم قياس كفاءة النموذج باستخدام: الدقة _(Accuracy) الإحكام (Precision) _الاسترجاع (Recall) _مقياس F1
علشان نضمن إن التوقعات بتاعته موثوقة.
_تجربة التوقع (Prediction Interface)
تقدر تدخلي رسالة جديدة، والنموذج يقولك:هل هي Spam ولا رسالة عادية وده بيبين التطبيق العملي للمشروع.
تحليل البيانات (Data Insights)
المشروع بيساعدنا نفهم:إيه الكلمات اللي بتظهر كتير في الرسائل المزعجة وإيه الفرق بينها وبين الرسائل العادية
خطوات تنفيذ المشروع:
1. تحميل بيانات الرسائل (Spam و Ham)
2. تنظيف النصوص (تحويل لحروف صغيرة + إزالة الرموز والكلمات غير المهمة)
3. تحويل النصوص لأرقام باستخدام TF-IDF
4. تقسيم البيانات (تدريب + اختبار)
5. تدريب النموذج (LinearSVC)
6. اختبار النموذج على بيانات جديدة
7. تجربة رسائل جديدة ومعرفة النتيجة فورًا
قيمة المشروع:
• تطبيق عملي قوي لمعالجة اللغة الطبيعية (NLP)
• مفيد في تطبيقات حقيقية زي: الفلترة في الموبايل _البريد الإلكتروني _ يضيف قيمة قوية للـ Portfolio لأنه بيبين:
شغلك في البيانات _ قدرتك تبني نموذج ذكي _وتحليلك للنتائج