يهدف هذا المشروع إلى التنبؤ باحتمالية الإصابة بأمراض القلب والأوعية الدموية باستخدام تقنيات التعلم الآلي، وذلك من خلال تحليل السجلات الطبية (العمر، مؤشر كتلة الجسم، التدخين، العادات الغذائية، الفحوصات الطبية) لتحديد عوامل الخطر.
أهداف المشروع:
* تطوير نموذج تنبؤي دقيق لأمراض القلب.
* تحديد العوامل الرئيسية المسببة للمخاطر.
* تقييم نماذج التعلم الآلي واختيار الأنسب للاستخدام الطبي.
منهجية العمل:
* المعالجة المسبقة للبيانات: تنظيف، إزالة القيم الشاذة (IQR)، تحويل البيانات النوعية لرقمية، وإزالة الأعمدة الزائدة مع الاحتفاظ بمؤشر كتلة الجسم.
* تحليل البيانات الاستكشافي (EDA): دراسة العلاقات بين المتغيرات وتأثيرها على أمراض القلب، وإنشاء تصورات بيانية.
* تطبيق نماذج التعلم الآلي: تدريب وتقييم Random Forest، Decision Tree، و Logistic Regression باستخدام الدقة، الدقة الجزئية، الاستدعاء، و F1 Score.
* التصور والتقييم: إنشاء مخططات حرارية (Confusion Matrix) وتحليل النتائج لاختيار النموذج الأمثل.
النتائج الرئيسية:
* العوامل المؤثرة: العمر المتقدم وارتفاع مؤشر كتلة الجسم يزيدان المخاطر. التدخين والبطاطس المقلية مرتبطان بزيادة المخاطر، بينما الفواكه والخضروات الخضراء تقلل المخاطر. قد تزيد التمارين الرياضية لدى كبار السن المخاطر. التاريخ الطبي (السرطان أو الاكتئاب) لم يؤثر بشكل كبير.
* أداء النماذج: Logistic Regression (دقة 91.47%، استدعاء منخفض) مناسب للدقة العالية. Random Forest (دقة 91.38%، استدعاء منخفض) يوفر توازنًا جيدًا. Decision Tree (دقة 71.89%، استدعاء مرتفع) مثالي لتقليل التنبؤات السلبية الخاطئة.
الأثر والتطبيقات:
يوفر المشروع أداة للكشف المبكر عن مخاطر أمراض القلب، مما يساعد الأطباء على اتخاذ تدابير وقائية وتحسين تشخيص المرضى وتخصيص العلاج. يمكن دمج النماذج في أنظمة الرعاية الصحية.