قمتُ بتنفيذ مشروع تحليل وتصنيف مرض السكّري باستخدام تقنيات Machine Learning على بيانات طبية حقيقية (Healthcare-Diabetes.csv).
يهدف المشروع إلى بناء نموذج قادر على التنبؤ باحتمالية إصابة المريض بالسكري اعتماداً على مجموعة من القياسات الطبية.
ما الذي قمتُ به في المشروع؟
تحليل البيانات وإجراء Data Cleaning ومعالجة القيم الناقصة.
تنفيذ EDA لاستكشاف العلاقات بين الخصائص ومعرفة أهم المؤشرات المؤثرة.
تطبيق أكثر من خوارزمية تصنيف، منها:
Naive Bayes
Logistic Regression
SVM
Decision Tree
Random Forest
KNN
مقارنة النماذج باستخدام مقاييس التقييم المختلفة:
Accuracy
Precision
Recall
F1-Score
أبرز النتائج
أفضل أداء كان بواسطة خوارزمية KNN بنسبة دقة وصلت إلى 95%.
خوارزميات الشجر (Decision Tree & Random Forest) حققت أيضاً أداءً قوياً تجاوز 94%.
النماذج الخطية مثل اللوجستك والـSVM كانت أقل في التنبؤ بالحالات الإيجابية.