نبذة عن الخدمة
أقدّم مشروع تحليل بيانات وتعلّم آلة (Machine Learning) لتوقّع الحالة الصحية للأفراد وتصنيفهم إلى Healthy / Diseased اعتمادًا على بيانات صحية ونمط حياة حقيقي.
المشروع مبني باستخدام Pipeline احترافي يبدأ من معالجة البيانات وتنظيفها، مرورًا بهندسة الخصائص، ومعالجة عدم توازن البيانات، وحتى تدريب وتقييم نماذج التنبؤ بدقة عالية.
ما الذي يشمله المشروع؟
تنظيف البيانات ومعالجة القيم المفقودة
Encoding و Scaling للبيانات
معالجة عدم توازن البيانات باستخدام SMOTE
بناء وتدريب نماذج Random Forest و XGBoost
تحسين الأداء باستخدام GridSearchCV
تقييم النموذج باستخدام ROC-AUC و F1-score و Recall
مميزات الخدمة
نموذج دقيق وقابل للتطبيق
كود منظم واحترافي
مناسب للمشاريع الأكاديمية والعملية
شرح واضح لكل خطوة