في هذا المشروع قمت بالعمل على بيانات سرطان الثدي (Breast Cancer Dataset) بهدف تطوير نموذج تعلم آلة يساعد في التمييز بين الحالات الحميدة (Benign) والخبيثة (Malignant) بشكل دقيق وسريع. تكمن أهمية هذا المشروع في كونه يقدم أداة داعمة للأطباء تساعدهم في التشخيص المبكر واتخاذ القرارات الطبية المناسبة.
بدأت العملية من خلال استكشاف البيانات ومعالجتها، حيث قمت بتنظيف القيم المفقودة والتأكد من توازن البيانات بين الفئات المختلفة. ثم نفذت تحليلًا استكشافيًا (EDA) لفهم طبيعة السمات (Features) مثل حجم الخلية، نسيجها، وخصائص النواة، مع استخدام المخططات الإحصائية لتوضيح الفروق بين الفئات.
بعد ذلك، قمت ببناء عدة نماذج تعلم آلة مثل Logistic Regression، Random Forest، Support Vector Machine (SVM)، ومقارنة أدائها باستخدام مقاييس مثل الدقة (Accuracy)، الاستدعاء (Recall)، الدقة الإيجابية (Precision)، و F1-score. كما استخدمت تقنيات مثل Feature Selection لاختيار أهم السمات المؤثرة على التشخيص وتحسين أداء النماذج.
أظهرت النتائج أن النماذج قادرة على تحقيق مستوى عالٍ من الدقة في التنبؤ، مما يعكس إمكانية استخدامها كأداة داعمة للأطباء لتقليل نسبة الأخطاء البشرية وتحسين جودة التشخيص المبكر