قمت بتحليل بيانات طبية تحتوي على عوامل مرتبطة بأمراض القلب مثل العمر، الجنس، ضغط الدم، الكوليسترول، وسرعة نبض القلب.
استخدمت تقنيات التحليل الإحصائي لتحديد العوامل الأكثر تأثيرًا على وجود المرض.
نفذت خوارزمية الانحدار اللوجستي (Logistic Regression) داخل Pipeline مع تقنيات تحجيم البيانات (StandardScaler) لتحسين أداء النموذج.
بلغت دقة النموذج أكثر من 81% مع تقييم دقيق لمقاييس الأداء مثل الدقة والاسترجاع وAMSE.
تم إنشاء مصفوفة التشتت (Confusion Matrix) وتفسير نتائج النموذج لتحسين الفهم السريري للنموذج التنبؤي.