مشروع تحليل وتنبؤ بأداء الطلاب باستخدام Python
في هذا المشروع قمت بتحليل بيانات مجموعة من الطلاب باستخدام لغة Python داخل بيئة Jupyter Notebook، بهدف دراسة العوامل المؤثرة في الأداء الأكاديمي وبناء نموذج تنبؤي يساعد على تقدير النتائج المستقبلية للطلاب بناءً على بياناتهم الحالية.
بدأت أولًا بتحميل البيانات من ملف Math-Students.csv وتحليلها باستخدام مكتبات Pandas وNumPy لاكتشاف عدد الأعمدة، أنواع البيانات، والقيم المفقودة. بعد ذلك قمت بعملية تنظيف وتنظيم البيانات (Data Cleaning) من خلال إزالة التكرارات ومعالجة أي بيانات ناقصة لضمان جودة التحليل.
تم بعد ذلك إجراء تحليل استكشافي (EDA) لفهم العلاقات بين العوامل المختلفة مثل عدد ساعات المذاكرة، الحضور، الدرجات في الاختبارات السابقة، وتأثيرها على الأداء العام. استخدمت مكتبات Matplotlib وSeaborn لإنشاء الرسوم البيانية والتوضيحات الإحصائية التي تسهّل فهم النتائج.
وفي الجزء التطبيقي من المشروع، تم بناء نموذج تنبؤ (Prediction Model) باستخدام خوارزميات تعلم الآلة (Machine Learning) لتقدير درجات الطلاب المستقبلية بناءً على خصائصهم وسلوكهم الدراسي. تم تدريب النموذج واختباره على البيانات، وتحليل دقته باستخدام مقاييس مثل R² Score وMean Squared Error.
يهدف المشروع إلى تقديم أداة تحليلية وتنبؤية تساعد على تحديد الطلاب المعرضين للخطر الأكاديمي مبكرًا، وتساعد المؤسسات التعليمية على تحسين أساليب الدعم واتخاذ قرارات مبنية على البيانات.