هذا العمل عبارة عن مشروع أكاديمي في مادة تنقيب البيانات، حيث قمتُ بتحليل مجموعة بيانات حول استخدام الذكاء الاصطناعي في حياة الطالب (10,000 سجل، 10 سمات).
تمت معالجة البيانات وتنظيفها ثم تطبيق عدة خوارزميات للتصنيف باستخدام برنامج Orange، وهي:
K-Nearest Neighbors (KNN)
Naïve Bayes
Decision Tree
Artificial Neural Networks (ANN)
التحليل شمل:
معالجة البيانات المفقودة وتطبيع القيم.
اختيار الخصائص الأكثر ارتباطًا بالنتيجة.
مقارنة أداء الخوارزميات من حيث الدقة، F1-Score، Recall، Precision.
استخلاص الاستنتاجات حول أي نموذج يحقق أفضل أداء في التنبؤ بإعادة استخدام الذكاء الاصطناعي من قِبل الطلبة.
النتيجة:
أظهرت الخوارزميات أداء متقاربًا بنسبة دقة حوالي 75%، مع تميّز خوارزمية Decision Tree في تحقيق أفضل توازن بين الأداء والوضوح التفسيري.