ملخص المشروع (Project Summary)
يهدف هذا المشروع إلى تصنيف الأورام (حميدة أو خبيثة) باستخدام مجموعة بيانات "ويسكونسن" لسرطان الثدي. يتضمن المشروع التعامل مع 30 خاصية طبية مستخرجة من صور الخزعات الرقمية، مع التركيز على تحديد القياسات الأكثر أهمية للتشخيص الدقيق.
الجوانب الرئيسية للمشروع (Key Project Aspects)
البيانات (The Data): تحليل القياسات الخلوية مثل نصف القطر (Radius)، الملمس (Texture)، النعومة (Smoothness)، والتقعر (Concavity).
التحليل والاستكشاف (EDA): استخدام "الخرائط الحرارية" (Heatmaps) لفهم الارتباط بين القياسات المختلفة.
المعالجة التقنية (Technical Processing): اختيار الخصائص الهامة وحذف البيانات المكررة لتحسين كفاءة النموذج.
النمذجة (Modeling): تطبيق خوارزميات مثل KNN أو SVM (آلات المتجهات الداعمة) للتصنيف.
التقييم (Evaluation): استخدام "مصفوفة الارتباك" (Confusion Matrix) لتقليل نسبة "السلبيات الكاذبة" لضمان سلامة المرضى.