الأدوات المستخدمة
Python (Pandas، NumPy، Scikit-learn، Matplotlib، Seaborn)
وصف المشروع
مشروع نمذجة تنبؤية يهدف للتنبؤ باحتمالية استمرار الطلاب في الدراسة، اعتمادًا على بيانات أكاديمية وديموغرافية منظمة.
المشكلة
ارتفاع معدلات تسرب الطلاب بدون معرفة واضحة من المعرّض للخطر أو الأسباب الحقيقية، ما يجعل التدخلات متأخرة وغير فعّالة.
الحل
تم تحليل 3,400 سجل طالب يحتوي على 56 متغير أكاديمي، ديموغرافي ومالي.
تم تقليص البيانات واشتقاق 10 متغيرات قوية بعد استبعاد 46 عمود ضعيف التأثير، مع التركيز على مؤشرات مثل: CGPA، معدل النجاح، GPA، والاحتياج المالي.
تم بناء ومقارنة نموذجين:
• Logistic Regression بدقة 81.5% و F1-Score 89.7%
• SVM بدقة 81.2%
أظهرت النتائج أن أهم العوامل المؤثرة على بقاء الطلاب هي: CGPA، إجمالي الساعات المكتسبة، ومعدل النجاح، ما سمح بتحديد الطلاب المعرّضين للخطر بشكل استباقي.
Key Numbers
• 56 → 10 متغيرات بعد الهندسة
• 81.5% دقة النموذج
• 89.7% F1-Score