نبذة عن المشروع:
تم تنفيذ مشروع علمي متكامل يهدف إلى التنبؤ المبكر بسرطان الثدي اعتمادًا على بيانات طبية حقيقية من Breast Cancer Wisconsin Diagnostic Dataset.
يهدف المشروع إلى دعم القرارات الطبية من خلال بناء نموذج تصنيف دقيق يعتمد على تقنيات الذكاء الاصطناعي وتعلم الآلة.
تفاصيل التنفيذ:
- تحليل البيانات طبيًا وإحصائيًا عبر تحليل استكشافي (EDA) وتحديد السمات المؤثرة باستخدام خرائط الارتباط (Correlation Heatmap).
- تطبيق تطبيع الخصائص (Standardization) لتحسين دقة النماذج.
- بناء نظام تصنيف ذكي باستخدام خوارزميات متعددة:
Logistic Regression – Decision Tree – Random Forest – SVM.
- تطوير ML Pipeline احترافي بأسلوب البرمجة الكينونية (OOP) يشمل:
معالجة الأخطاء (Error Handling)
ضبط العتبة (Threshold Tuning)
تحسين النماذج باستخدام GridSearchCV
- تقييم شامل للأداء باستخدام ROC Curve وClassification Report.
النتائج:
حقق النظام دقة تصنيف تجاوزت 97%، مما يؤكد قدرته العالية على الكشف المبكر والدقيق عن الأورام الخبيثة، ويسهم في دعم التطبيقات الطبية الذكية.
التقنيات المستخدمة:
Python – Scikit-learn – Pandas – NumPy – Matplotlib – Seaborn – OOP – GridSearchCV