مشروع متكامل يعتمد على تحليل البيانات الضخمة والتعلم الآلي (Machine Learning) للتنبؤ باحتمالية إصابة المرضى بأمراض القلب بناءً على مؤشرات حيوية وطبية دقيقة. تم استخدام مجموعة بيانات UCI Heart Disease الشهيرة لبناء نموذج تصنيف (Classification Model) عالي الدقة.
ما قمت بتنفيذه في هذا المشروع:
استكشاف وتحليل البيانات (EDA): تحليل إحصائي شامل لفهم الارتباطات (Correlations) بين المتغيرات الطبية مثل ضغط الدم، الكوليسترول، ومعدل ضربات القلب.
معالجة البيانات (Data Preprocessing): تنظيف البيانات، التعامل مع القيم المفقودة، وعمل Feature Scaling لضمان استقرار النموذج.
بناء النماذج البرمجية: تجربة واختبار عدة خوارزميات مثل:
Logistic Regression
Random Forest
Support Vector Machines (SVM)
تقييم الأداء: الوصول إلى أعلى نسبة دقة (Accuracy) مع التركيز على مقاييس الـ Recall والـ F1-Score لضمان تقليل نسبة الخطأ في التشخيص الطبي.
الأدوات والتقنيات المستخدمة:
اللغة: Python
المكتبات: Pandas, NumPy, Scikit-learn
التصور البياني: Matplotlib, Seaborn