يهدف هذا المشروع إلى تحليل بيانات أداء الطلاب لفهم العوامل التي تؤثر على نتائجهم الدراسية. باستخدام تقنيات تحليل البيانات و التعلم الآلي، يتم استخراج الرؤى التي يمكن أن تساعد في تحسين أداء الطلاب على المستوى الفردي والجماعي. يتضمن المشروع دراسة العلاقة بين المتغيرات المختلفة مثل الجنس، الخلفية التعليمية، وعوامل أخرى، وأدائها على الاختبارات المختلفة (مثل الرياضيات، القراءة، الكتابة).
1️⃣ معالجة البيانات (Data Preprocessing)
تنظيف البيانات: التعامل مع القيم المفقودة أو غير المناسبة وضمان أن البيانات جاهزة للتحليل.
تحويل البيانات الفئوية إلى قيم عددية باستخدام Label Encoding أو One-Hot Encoding.
تقسيم البيانات إلى مجموعات تدريب واختبار لتقييم النموذج بشكل جيد.
2️⃣ التحليل الاستكشافي للبيانات (Exploratory Data Analysis - EDA)
استخراج الرؤى الأساسية من البيانات باستخدام التصورات التالية:
التحقق من توزيعات الدرجات عبر اختبارات الرياضيات، القراءة، والكتابة.
دراسة تأثير العوامل الاجتماعية والتعليمية مثل الجنس أو الأنشطة اللامنهجية على الأداء الدراسي.
تحليل العلاقات بين المتغيرات باستخدام الرسوم البيانية مثل المخططات المبعثرة (scatter plots) أو المخططات الشريطية (bar charts).
التنبؤ بالأداء باستخدام التعلم الآلي (Performance Prediction - ML Model)
? بناء نموذج تعلم آلي لتوقع درجات الطلاب في اختبارات الرياضيات، القراءة، الكتابة بناءً على المتغيرات الاجتماعية والتعليمية.
الخوارزميات المستخدمة:
الانحدار الخطي (Linear Regression) للتنبؤ بالدرجات.
4️⃣ تحليل المتغيرات المؤثرة (Feature Analysis)
تحليل التأثير النسبي لكل متغير على أداء الطلاب باستخدام تقنيات مثل تحليل الأهمية النسبية للميزات (Feature Importance).
البحث عن العلاقات المعقدة بين العوامل المختلفة باستخدام التعلم الآلي وتحليل المتغيرات المتعددة.
5️⃣ تصور البيانات (Data Visualization)
رسم المخططات البيانية لتوضيح الأنماط:
المخططات الشريطية لتوزيع الدرجات عبر الاختبارات.
المخططات المبعثرة لفحص العلاقة بين المتغيرات مثل الأنشطة اللامنهجية و الدرجات النهائية.
المخططات الدائرية لعرض توزيع الطلاب حسب الجنس أو فئات الأداء.