Project Title: Heart Health AI Predictor
Project Overview:
نظام ذكي متكامل بيستخدم الـ Machine Learning عشان يتوقع احتمالية الإصابة بأمراض القلب بدقة عالية. المشروع بيوفر واجهة مستخدم (Web Interface) تفاعلية بتسمح للأطباء أو المستخدمين العاديين بإدخال البيانات الطبية والحصول على تحليل فوري للحالة.
Technical Architecture (System Design)
المشروع متقسم لـ 3 أجزاء أساسية:
1. Data Processing Pipeline:
• معالجة البيانات الخام (Raw Data) باستخدام تقنيات الـ Encoding (Binary & One-Hot).
• توحيد مقاييس البيانات الرقمية باستخدام الـ StandardScaler.
• تقليل الأبعاد باستخدام الـ PCA لضمان سرعة الموديل ودقته.
2. Machine Learning Core:
• تدريب ومقارنة 4 موديلات مختلفة: (Logistic Regression, Random Forest, SVM, Decision Tree).
• نظام اختيار تلقائي لأفضل موديل (Best Model Selection) بناءً على الـ Accuracy و الـ AUC.
• حفظ الموديل النهائي والـ Preprocessors في ملف joblib لاستخدامه في الـ Production.
3. Web Interface (The Product):
• واجهة عصرية مبنية بـ Streamlit.
• تجربة مستخدم (UX) مرنة باستخدام Sliders و Toggles لإدخال البيانات.
• تحليل فوري للنتائج مع إظهار نسبة الاحتمالية (Probability) لكل حالة.
Key Features
• High Precision: الموديل بيركز على دقة التوقع لتقليل الإنذارات الخاطئة (False Positives).
• End-to-End Pipeline: المشروع بياخد الداتا من أول الـ CSV لحد ما تظهر على الويب سايت.
• Interactive Visuals: عرض الـ Confusion Matrix لكل موديل لتقييم أداؤه بوضوح.
• Real-time Prediction: معالجة البيانات وتوقع النتيجة بيحصل في أقل من ثانية.
Tech Stack
• Language: Python 3.x
• Data Science: Pandas, NumPy, Scikit-learn
• Encoding: Category Encoders
• Visualization: Matplotlib, Seaborn
• Deployment: Streamlit, GitHub, Joblib
How it Works?
الموديل بيستلم بيانات زي (السن، ضغط الدم، الكوليسترول، ألم الصدر).
الـ Pipeline بيحول الكلام لبيانات رقمية الموديل يفهمها.
الـ PCA بيختار أهم الخصائص اللي بتأثر في صحة القلب.
الموديل بيطلع نتيجة (Risk Detected) أو (Low Risk) مع نسبة ثقة في النتيجة.