تفاصيل العمل

عنوان المشروع: نظام ذكي لتصنيف وكشف البريد الإلكتروني العشوائي (Spam) باستخدام تعلم الآلة

وصف المشروع: قمت بتطوير نموذج تعلم عميق (Deep Learning) متطور يهدف إلى حماية المستخدمين من رسائل البريد الإلكتروني غير المرغوب فيها (Spam) والاحتيالية. يعتمد المشروع على معالجة اللغات الطبيعية (NLP) لتحليل محتوى الرسائل وتصنيفها بدقة عالية إلى رسائل موثوقة (Ham) أو رسائل عشوائية (Spam).

الخطوات التقنية التي تم تنفيذها في المشروع:

تحليل واستكشاف البيانات (EDA):

العمل على مجموعة بيانات ضخمة تحتوي على أكثر من 80,000 رسالة بريد إلكتروني.

تنظيف البيانات من القيم المكررة لضمان جودة تدريب النموذج.

تحليل توزيع البيانات (Label distribution) لضمان توازن النموذج بين الرسائل العادية والعشوائية.

المعالجة المسبقة للنصوص (NLP Preprocessing):

استخدام مكتبة NLTK لإزالة الكلمات الشائعة (Stopwords) التي لا تؤثر على المعنى.

تطبيق تقنيات Tokenization لتحويل النصوص إلى رموز رقمية، واستخدام Padding لتوحيد أطوال النصوص المدخلة للنموذج.

توليد سحابة الكلمات (WordCloud) لتصور الكلمات الأكثر تكراراً في الرسائل العشوائية.

بناء وتطوير النموذج:

استخدام مكتبة TensorFlow و Keras لبناء شبكة عصبية قادرة على فهم السياق النصي.

تطبيق تقنيات التحسين مثل EarlyStopping و ReduceLROnPlateau لتفادي "التعلم الزائد" (Overfitting) ولضمان وصول النموذج لأفضل أداء ممكن أثناء التدريب.

التقييم والنتائج:

تم تقييم النموذج باستخدام مقاييس دقيقة مثل Mean Squared Error و F1-Score.

تحديد "أفضل عتبة قرار" (Best Threshold) لتحسين دقة التصنيف وتقليل الأخطاء.

التقنيات المستخدمة:

لغة البرمجة: Python

المكتبات الأساسية: Pandas, NumPy, Matplotlib, Seaborn

الذكاء الاصطناعي: TensorFlow, Keras, Scikit-learn

معالجة النصوص: NLTK, WordCloud

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
7
تاريخ الإضافة
تاريخ الإنجاز
المهارات