مشروع تعلم آلي يهدف إلى تصنيف الأحداث المرصودة بواسطة تلسكوب MAGIC Gamma إلى إشارات أشعة جاما (Gamma) أو إشارات خلفية (Hadron) باستخدام مجموعة من خوارزميات التصنيف وتحليل الأداء بينها.
شمل المشروع جميع مراحل بناء نموذج تعلم الآلة بدءًا من معالجة البيانات وتجهيزها، مرورًا بمعالجة عدم توازن الفئات (Class Imbalance)، وانتهاءً بتدريب النماذج وضبط المعاملات وتقييم النتائج باستخدام عدة مقاييس أداء.
المهام المنفذة:
تنظيف البيانات ومعالجتها.
موازنة البيانات باستخدام Undersampling.
ترميز المتغير الهدف (Label Encoding).
تقسيم البيانات إلى مجموعات تدريب واختبار.
تطبيق خوارزميات:
Decision Tree
Random Forest
AdaBoost
Naive Bayes
استخدام GridSearchCV و Cross Validation لتحسين الأداء.
تقييم النماذج باستخدام Accuracy وPrecision وRecall وF1-Score.
إنشاء Confusion Matrix وVisualizations للمقارنة بين النماذج.
تحليل أهمية المتغيرات (Feature Importance).
التقنيات المستخدمة:
Python
Pandas
NumPy
Scikit-learn
Matplotlib
Seaborn
Jupyter Notebook
النتائج:
حقق المشروع دقة وصلت إلى حوالي 96%، مع تفوق نماذج Random Forest وAdaBoost على النماذج الأخرى، مما يؤكد فعالية أساليب Ensemble Learning في مسائل التصنيف.