هذا المشروع يهدف إلى بناء خط أنابيب متكامل لتحليل وتصنيف تدفقات الشبكة إلى فئتين رئيسيتين: سليمة وهجمات (DDoS، DoS، Mirai، Recon، MITM).
يتضمن العمل الخطوات الرئيسية التالية:
إعداد البيانات: تنظيف وإزالة التكرارات والتعامل مع القيم الشاذة.
التحليل الاستكشافي: توليد تقارير yData Profiling وفحص توزيع الفئات والارتباطات بين الميزات.
هندسة الميزات: استخراج خصائص إضافية مثل نسبة المعدل، وحجم الحزمة المتوسط، وعوامل الزمن الدورية.
معالجة الاختلال: استخدام تقنيات SMOTE وEasyEnsemble ومعاملات التوازن.
النمذجة: تدريب نماذج XGBoost وLightGBM وCatBoost، بالإضافة إلى نموذج تجميعي (Stacking).
التقييم والتسليم: الوصول إلى معدل دقة خاص 0.9163 (خاصة) و0.9146 (عامة) على منصة Kaggle، مع إعداد ملف التسليم النهائي Our_Competition_Submission.csv.