مشروع متقدم في علم البيانات يهدف إلى بناء نموذج ذكاء اصطناعي قادر على تصنيف مستويات اللياقة البدنية للأفراد بناءً على مجموعة من البيانات الحيوية والأداء الرياضي. يتضمن المشروع دورة حياة البيانات كاملة، بدءاً من تحليل البيانات الاستكشافي (EDA) وصولاً إلى تحسين النموذج للحصول على أعلى دقة ممكنة.
ماذا قدمت في هذا المشروع؟
تحليل البيانات الاستكشافي (EDA): دراسة العلاقات بين المتغيرات (مثل العمر، الوزن، وعدد تمرينات البطن) وتأثيرها على مستوى اللياقة باستخدام مكتبات Seaborn و Matplotlib.
معالجة البيانات (Pre-processing): التعامل مع القيم المفقودة، وتحويل البيانات النصية إلى أرقام (Encoding)، وتوحيد المقاييس (Scaling) لضمان كفاءة النموذج.
بناء النماذج (Modeling): مقارنة واختيار أفضل الخوارزميات، مع التركيز على Decision Tree.
تحسين النموذج (Hyperparameter Tuning): استخدام تقنيات متقدمة للوصول إلى أفضل "بارامترات" تمنع مشكلة الـ Overfitting وتضمن تعميم النتائج على بيانات جديدة.
تقييم شامل: استخدام مصفوفة الارتباك (Confusion Matrix) وتقارير التصنيف لقياس الـ Accuracy والـ F1-Score.