تفاصيل العمل

مشروع: نظام توقع أمراض القلب باستخدام تعلم الآلة

قمت ببناء مشروع متكامل لتوقع احتمالية الإصابة بأمراض القلب باستخدام بيانات

UCI Heart Disease Dataset

المشروع تم تنفيذه كـ Pipeline كاملة لتعلم الآلة بداية من تنظيف البيانات وحتى نشر النموذج.

ما تم تنفيذه في المشروع:

? معالجة البيانات (Data Preprocessing):

تنظيف البيانات والتعامل مع القيم المفقودة

ترميز المتغيرات الفئوية

توحيد القيم العددية باستخدام StandardScaler

تنفيذ تحليل استكشافي شامل (EDA) باستخدام الرسوم البيانية وخرائط الارتباط

? تقليل الأبعاد (PCA):

تطبيق تحليل المكونات الرئيسية لتقليل عدد الخصائص

تحديد عدد المكونات المثالي بناءً على نسبة التباين المفسر

عرض النتائج بيانياً

? اختيار الخصائص (Feature Selection):

استخدام Feature Importance من Random Forest

تطبيق Recursive Feature Elimination (RFE)

استخدام اختبار Chi-Square لاختيار أهم المتغيرات

? تدريب نماذج التصنيف:

تم تدريب ومقارنة عدة نماذج:

Logistic Regression

Decision Tree

Random Forest

Support Vector Machine (SVM)

وتم تقييم الأداء باستخدام:

Accuracy – Precision – Recall – F1-Score – ROC Curve – AUC

? التعلم غير الخاضع للإشراف:

تطبيق K-Means Clustering

تنفيذ Hierarchical Clustering وتحليل Dendrogram

مقارنة نتائج التجميع مع النتائج الفعلية لاكتشاف الأنماط

? تحسين الأداء (Hyperparameter Tuning):

استخدام GridSearchCV و RandomizedSearchCV

اختيار النموذج الأفضل بعد التحسين

? تصدير النموذج والنشر:

حفظ النموذج بصيغة .pkl

بناء واجهة تفاعلية باستخدام Streamlit

نشر التطبيق باستخدام Ngrok

رفع المشروع على GitHub

المهارات التي يبرزها المشروع:

بناء Pipeline كاملة لتعلم الآلة

معالجة البيانات وتحليلها

اختيار الخصائص وتقليل الأبعاد

تقييم وتحسين النماذج

نشر النماذج وبناء واجهات تفاعلية

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
2
تاريخ الإضافة
تاريخ الإنجاز
المهارات