مشروع: نظام توقع أمراض القلب باستخدام تعلم الآلة
قمت ببناء مشروع متكامل لتوقع احتمالية الإصابة بأمراض القلب باستخدام بيانات
UCI Heart Disease Dataset
المشروع تم تنفيذه كـ Pipeline كاملة لتعلم الآلة بداية من تنظيف البيانات وحتى نشر النموذج.
ما تم تنفيذه في المشروع:
? معالجة البيانات (Data Preprocessing):
تنظيف البيانات والتعامل مع القيم المفقودة
ترميز المتغيرات الفئوية
توحيد القيم العددية باستخدام StandardScaler
تنفيذ تحليل استكشافي شامل (EDA) باستخدام الرسوم البيانية وخرائط الارتباط
? تقليل الأبعاد (PCA):
تطبيق تحليل المكونات الرئيسية لتقليل عدد الخصائص
تحديد عدد المكونات المثالي بناءً على نسبة التباين المفسر
عرض النتائج بيانياً
? اختيار الخصائص (Feature Selection):
استخدام Feature Importance من Random Forest
تطبيق Recursive Feature Elimination (RFE)
استخدام اختبار Chi-Square لاختيار أهم المتغيرات
? تدريب نماذج التصنيف:
تم تدريب ومقارنة عدة نماذج:
Logistic Regression
Decision Tree
Random Forest
Support Vector Machine (SVM)
وتم تقييم الأداء باستخدام:
Accuracy – Precision – Recall – F1-Score – ROC Curve – AUC
? التعلم غير الخاضع للإشراف:
تطبيق K-Means Clustering
تنفيذ Hierarchical Clustering وتحليل Dendrogram
مقارنة نتائج التجميع مع النتائج الفعلية لاكتشاف الأنماط
? تحسين الأداء (Hyperparameter Tuning):
استخدام GridSearchCV و RandomizedSearchCV
اختيار النموذج الأفضل بعد التحسين
? تصدير النموذج والنشر:
حفظ النموذج بصيغة .pkl
بناء واجهة تفاعلية باستخدام Streamlit
نشر التطبيق باستخدام Ngrok
رفع المشروع على GitHub
المهارات التي يبرزها المشروع:
بناء Pipeline كاملة لتعلم الآلة
معالجة البيانات وتحليلها
اختيار الخصائص وتقليل الأبعاد
تقييم وتحسين النماذج
نشر النماذج وبناء واجهات تفاعلية