يهدف المشروع إلى التنبؤ باحتمالية الإصابة بأمراض القلب اعتمادًا على بيانات طبية حقيقية للمرضى، باستخدام تقنيات تعلم الآلة. الفكرة الأساسية هي مساعدة الأطباء أو المستخدمين على تقييم الخطر مبكرًا قبل الوصول لمراحل متقدمة من المرض.
البيانات المستخدمة
بيانات طبية منظمة (Structured Clinical Data)
تشمل مؤشرات أساسية مثل:
العمر
ضغط الدم
مستوى الكوليسترول
معدل ضربات القلب
نتائج ECG
نوع ألم الصدر
ST Depression
البيانات تم تنظيفها وتجهيزها لتكون مناسبة للتدريب.
مراحل العمل (Pipeline)
معالجة البيانات (Data Preprocessing)
التعامل مع القيم المفقودة.
تحويل البيانات الفئوية إلى رقمية.
Normalization / Scaling للخصائص.
بناء Pipeline قابلة لإعادة الاستخدام.
تحليل البيانات (EDA)
دراسة العلاقة بين المؤشرات الطبية وأمراض القلب.
فهم توزيع البيانات واكتشاف الأنماط المهمة.
تحليل عدم توازن الفئات (Class Imbalance).
بناء النماذج (Modeling)
تم تدريب ومقارنة عدة نماذج:
Logistic Regression
Random Forest
XGBoost
تقييم الأداء
استخدام مقاييس دقيقة مثل:
ROC-AUC
F1-score
Precision-Recall
اختيار أفضل نموذج بناءً على الأداء والاستقرار.
النشر والتطبيق (Deployment)
تم بناء نظام تنبؤ كامل End-to-End.
تحويل النموذج النهائي إلى ملف جاهز للاستخدام.
تطوير Web Application بسيطة تتيح:
إدخال بيانات المريض
الحصول على نتيجة فورية لاحتمالية الإصابة