تفاصيل العمل

تحليل تنبؤ الإصابة بالسكري باستخدام خوارزميات الانحدار اللوجستي والشجرة القرار (Pima Indians Diabetes Dataset)

نبذة عن المشروع

قمت ببناء نموذجين للتصنيف الثنائي (Binary Classification) باستخدام خوارزمية الانحدار اللوجستي (Logistic Regression) وخوارزمية شجرة القرار (Decision Tree) لتحديد احتمالية إصابة شخص بالسكري من خلال بيانات طبية من Pima Indians Diabetes Dataset.

ما تم تنفيذه

استكشاف البيانات

استعراض أول صفوف البيانات

تحليل الخصائص الإحصائية

التحقق من وجود قيم مفقودة

تحضير البيانات

فصل الميزات (Features) عن المتغير الهدف (Outcome)

تقسيم البيانات بنسبة 70% تدريب و30% اختبار

بناء النماذج

تدريب نموذج الانحدار اللوجستي

تدريب نموذج شجرة القرار

تقييم الأداء

حساب الدقة (Accuracy)

مصفوفة الالتباس (Confusion Matrix)

حساب Precision, Recall, F1-Score

عرض مصفوفة الالتباس باستخدام heatmap

تجارب إضافية تمت لتنفيذ التحليل المتقدم

تجربة 1: تأثير مقياس الخصائص (Feature Scaling)

تطبيق StandardScaler

إعادة تدريب النموذج ومقارنة الأداء قبل وبعد المقياس

تجربة 2: تغيير نسبة التقسيم بين التدريب والاختبار

تغيير النسبة إلى 80% تدريب و20% اختبار

ملاحظة وتحليل التغير في الأداء

تجربة 3: تطبيق الانتظام (Regularization) على نموذج الانحدار اللوجستي

استخدام L1 (Lasso) وL2 (Ridge)

مقارنة النتائج وتحديد تأثير كل نوع على النموذج

أهم المهارات والتقنيات المستخدمة

Python

scikit-learn

pandas, matplotlib, seaborn

StandardScaler

خوارزميات التصنيف

تقييم النماذج باستخدام المقاييس المختلفة

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
11
تاريخ الإضافة
تاريخ الإنجاز
المهارات