تم تطوير نموذج تعلم آلي للتنبؤ بالدرجة النهائية للطلاب (G3) اعتمادًا على بيانات أكاديمية وسلوكية. شمل المشروع مراحل متكاملة:
تحميل وتنظيف البيانات باستخدام Pandas
تنفيذ Feature Engineering عبر إنشاء متغير جديد (متوسط G1 و G2)
معالجة البيانات باستخدام:
StandardScaler للخصائص العددية
OneHotEncoder للخصائص الفئوية
بناء Pipeline متكامل عبر ColumnTransformer
تدريب نموذج Linear Regression
تقييم الأداء باستخدام:
R² Score
RMSE
عرض النتائج وتحليل الفروقات بين القيم الفعلية والمتوقعة
الأدوات المستخدمة:
Python, NumPy, Pandas, Scikit-learn
النتيجة:
حقق النموذج دقة جيدة في التنبؤ مع تفسير واضح للعلاقات الخطية بين المتغيرات.