تطبيق Streamlit لاكتشاف الروابط الضارة
انتهيت مؤخرًا من بناء تطبيق بسيط باستخدام Streamlit يقوم بتصنيف الروابط (URLs) إلى روابط آمنة أو ضارة.
يعتمد النموذج على مجموعة من الخصائص المهمة لتحليل الرابط، مثل:
ما إذا كان الرابط يستخدم بروتوكول HTTPS
طول الرابط
وجود عنوان IP داخل الرابط
وغيرها من الخصائص المفيدة
تم تدريب النموذج باستخدام خوارزمية Naive Bayes، وركزت خلال المشروع على تحسين خصائص البيانات (Feature Engineering) لزيادة دقة التنبؤ.
من أهم التحسينات التي أضفتها كانت زيادة عدد الخصائص في TfidfVectorizer من 3000 إلى 5000، مما ساعد النموذج على التعرف بشكل أفضل على الروابط المشبوهة التي كان يخطئ في تصنيفها سابقًا.