مقارنة بين اداء مجموعة من الخوارزميات فى عملية التصنيف

تفاصيل العمل

قمتُ بتنفيذ مشروع تحليل وتصنيف مرض السكّري باستخدام تقنيات Machine Learning على بيانات طبية حقيقية (Healthcare-Diabetes.csv).

يهدف المشروع إلى بناء نموذج قادر على التنبؤ باحتمالية إصابة المريض بالسكري اعتماداً على مجموعة من القياسات الطبية.

ما الذي قمتُ به في المشروع؟

تحليل البيانات وإجراء Data Cleaning ومعالجة القيم الناقصة.

تنفيذ EDA لاستكشاف العلاقات بين الخصائص ومعرفة أهم المؤشرات المؤثرة.

تطبيق أكثر من خوارزمية تصنيف، منها:

Naive Bayes

Logistic Regression

SVM

Decision Tree

Random Forest

KNN

مقارنة النماذج باستخدام مقاييس التقييم المختلفة:

Accuracy

Precision

Recall

F1-Score

أبرز النتائج

أفضل أداء كان بواسطة خوارزمية KNN بنسبة دقة وصلت إلى 95%.

خوارزميات الشجر (Decision Tree & Random Forest) حققت أيضاً أداءً قوياً تجاوز 94%.

النماذج الخطية مثل اللوجستك والـSVM كانت أقل في التنبؤ بالحالات الإيجابية.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
4
تاريخ الإضافة
تاريخ الإنجاز