نظام تنبؤ بأمراض القلب باستخدام تقنيات تعلم الآلة

تفاصيل العمل

مشروع تعلم آلة يهدف إلى التنبؤ باحتمالية الإصابة بأمراض القلب اعتمادًا على مجموعة من المؤشرات الصحية مثل ضغط الدم، الكوليسترول، مستوى السكر، التدخين ونمط الحياة. تم تنفيذ المشروع باستخدام Python داخل بيئة Google Colab، بدايةً بمرحلة تحليل البيانات الاستكشافي (EDA) لفحص التوزيعات، القيم المفقودة، التكرارات، القيم الشاذة وعلاقات الارتباط بين المتغيرات، ثم إجراء تنظيف شامل للبيانات شمل معالجة القيم المفقودة، حذف التكرارات، إزالة القيم الشاذة باستخدام IQR، تحويل بعض المتغيرات الرقمية إلى فئات (Binning)، وترميز المتغيرات الفئوية باستخدام Label Encoding، بالإضافة إلى تطبيق Min-Max Scaling لضبط نطاق القيم العددية. بعد ذلك تم تقسيم البيانات إلى مجموعة تدريب واختبار لتجنب تسرب البيانات (Data Leakage)، وبناء عدة نماذج تصنيفية تشمل Logistic Regression و Random Forest و XGBoost مع ضبط المعاملات باستخدام RandomizedSearchCV، مع مراعاة مشكلة عدم توازن الفئات (Imbalanced Dataset) من خلال استخدام class_weight وتحليل الأداء باستخدام Accuracy و Precision و Recall و F1-score. أظهر التحليل أن مشكلة عدم التوازن تؤثر بشكل كبير على دقة التنبؤ بالفئة الأقل، مما يؤكد أهمية اختيار المقاييس المناسبة وتحسين استراتيجيات التعامل مع البيانات غير المتوازنة. يعكس هذا المشروع قدرة عملية على تنفيذ دورة كاملة لمشروع تعلم آلة بدءًا من تحليل البيانات وحتى تقييم النماذج واستخلاص النتائج بطريقة منهجية.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
2
تاريخ الإضافة
تاريخ الإنجاز
المهارات