قمت بتنفيذ مشروع لتحليل بيانات سرطان الثدي باستخدام تقنيات تحليل البيانات وتعلم الآلة بهدف فهم خصائص الخلايا وتحديد العوامل التي تساعد في التمييز بين الأورام الحميدة (Benign) و الخبيثة (Malignant).
? أهداف المشروع:
تحليل خصائص الخلايا المرتبطة بسرطان الثدي.
اكتشاف الأنماط والعلاقات بين المتغيرات المختلفة.
تحديد أهم العوامل التي تساعد في تشخيص الورم.
بناء نموذج تنبؤي يساعد في تصنيف الحالات.
? الأدوات والتقنيات المستخدمة:
Python
Pandas & NumPy لمعالجة البيانات
Matplotlib & Seaborn لعمل الرسوم البيانية
Scikit-learn لبناء نماذج تعلم الآلة
Jupyter Notebook لتوثيق التحليل
? خطوات العمل:
تنظيف البيانات ومعالجة القيم المفقودة.
إجراء Exploratory Data Analysis (EDA) لفهم البيانات.
تحليل العلاقات بين الخصائص المختلفة للخلايا.
استخدام Machine Learning Models لتصنيف الأورام.
تقييم أداء النموذج باستخدام مقاييس مثل Accuracy و Confusion Matrix.
? النتائج:
تحديد أهم الخصائص المرتبطة بسرطان الثدي.
إنشاء Visualization توضح الأنماط داخل البيانات.
بناء نموذج قادر على تصنيف الحالات بدقة جيدة.