في هذا المشروع قمت ببناء نظام تعلم آلي لتصنيف أورام سرطان الثدي إلى حميدة أو خبيثة باستخدام لغة بايثون وعدد من المكتبات من بيئة Scikit-learn
بدأت أولاً باستيراد المكتبات اللازمة مثل Pandas و NumPy و Matplotlib و Scikit-learn للتعامل مع البيانات ومعالجتها وبناء النماذج. بعد تحميل مجموعة البيانات، قمت بتنظيفها عن طريق حذف الأعمدة غير الضرورية مثل عمود معرف المريض (ID) والأعمدة الفارغة التي لا تفيد في عملية التنبؤ.
بعد ذلك قمت بتحويل متغير الهدفdiagnosis إلى قيم رقمية باستخدام Label Encodingحتى تتمكن نماذج التعلم الآلي من التعامل معه. ثم قمت بتقسيم البيانات إلى الخصائص (X) ومتغير الهدف (y).
ولضمان تقييم عادل للنموذج، قمت بتقسيم البيانات إلى مجموعة تدريب ومجموعة اختبار مع الحفاظ على توازن الفئات باستخدام التقسيم الطبقي (Stratified Sampling) بعد ذلك استخدمت Standard Scaling لتوحيد مقياس الخصائص، مما يساعد على تحسين أداء النماذج ويضمن أن جميع المتغيرات تؤثر بشكل متوازن في عملية التعلم.
ثم استخدمت تقنيةتحليل المكونات الرئيسية (PCA) لتقليل أبعاد البيانات. في البداية قمت بتمثيل البيانات في بعدين فقط من أجل تصور توزيع الفئات (الحميدة والخبيثة) بصريًا وفهم مدى إمكانية فصلها في مساحة ذات أبعاد أقل.
ولإيجاد العدد الأمثل من المكونات الرئيسية، قمت بتجربة عدة قيم تتراوح بين 2 و 30 مكونًا. في كل مرة كنت أقوم بتدريب نموذجRandom Forest وتقييم دقته على بيانات الاختبار، ثم اخترت عدد المكونات الذي أعطى أفضل دقة تنبؤ
بعد تحديد العدد الأفضل من المكونات، قمت بتدريب عدة نماذج تعلم آلي، منها:
Random Forest Classifier
Bagging Classifier باستخدام Decision Trees
Logistic Regression
وفي النهاية قمت بدمج بعض هذه النماذج باستخدامVoting Classifier، حيث يتم جمع توقعات عدة نماذج للحصول على قرار نهائي أكثر دقة وثباتًا.
لتقييم أداء النموذج النهائي، قمت بحساب الدقة (Accuracy) بالإضافة إلى إنشاء تقرير التصنيف (Classification Report) الذي يعرض مقاييس مهمة مثل Precision و Recall و F1-score، مما يساعد على فهم مدى قدرة النموذج على التمييز بين الأورام الحميدة والخبيثة.
بشكل عام، يوضح هذا المشروع قدرتي على معالجة البيانات، وتقليل الأبعاد، وبناء نماذج تعلم آلي، واستخدام تقنيات التعلم الجماعي (Ensemble Learning)، وتقييم أداء النماذج لبناء نظام فعال للتنبؤ بسرطان الثدي.