قمت بتطوير مشروع متكامل للتنبؤ بالدرجات النهائية للطلاب وتصنيفهم إلى مستويات خطورة (Low – Medium – High) باستخدام خوارزميات تعلم الآلة. يهدف المشروع إلى مساعدة المؤسسات التعليمية على التعرف المبكر على الطلاب الأكثر عرضة للتراجع ودعمهم بشكل استباقي.
المراحل الأساسية في المشروع:
Data Cleaning & Preprocessing: تحويل البيانات الفئوية إلى رقمية، التعامل مع القيم المفقودة، وإنشاء ميزات جديدة مثل Social Index وAlcohol Consumption Average.
Exploratory Data Analysis (EDA): دراسة تأثير العوامل المختلفة مثل الحضور، الدعم العائلي، والأنشطة الاجتماعية على أداء الطالب.
Machine Learning Models: تدريب نماذج متعددة (Logistic Regression، Decision Tree، Random Forest، SVM، Neural Networks) للتنبؤ بالدرجات.
Evaluation Metrics: استخدام Accuracy، F1-Score، وConfusion Matrix لقياس جودة النماذج.
Sentiment Analysis (NLP): تطبيق TextBlob وVADER لتحليل تعليقات الطلاب النصية وإضافة بُعد تفسيري إضافي للتنبؤ.
أبرز الميزات:
-يدعم المؤسسات التعليمية في اتخاذ قرارات مبكرة لمساعدة الطلاب.
-يجمع بين Structured Data Analysis وText Sentiment Analysis.
-رسومات بيانية توضح أهم العوامل المؤثرة في أداء الطلاب
-Notebook منظم وموثق بكود واضح لسهولة إعادة الاستخدام.
-بناء واجهة ويب UI للتفاعل بسهولة مع النظام.
الأدوات والتقنيات المستخدمة: Python، Pandas، NumPy، Scikit-learn، Matplotlib، Seaborn، TextBlob، VADER، Jupyter Notebook.