وصف المشروع:
قمت بتنفيذ مشروع تحليل بيانات متكامل باستخدام مجموعة بيانات سرطان الثدي (Breast Cancer Dataset) من Kaggle، بهدف استخراج الأنماط والمؤشرات التي تساعد في فهم خصائص الأورام والتمييز بين الحالات الحميدة (Benign) والخبيثة (Malignant).
أهداف المشروع:
- تحليل الخصائص المختلفة للأورام مثل: نصف القطر (Radius)، الملمس (Texture)، المساحة (Area) وغيرها
- دراسة التشتت (Standard Deviation) والمتوسطات لكل خاصية
- مقارنة الفروقات بين الحالات الحميدة والخبيثة
- تحديد أهم المؤشرات التي تؤثر في التشخيص
الأدوات المستخدمة:
- Microsoft Excel (Pivot Tables & Charts) / Power BI
- Data Cleaning & Data Visualization
- Statistical Analysis
محتوى الداشبورد:
- عرض متوسط القيم لكل خاصية
- تحليل التشتت والانحراف المعياري
- مقارنة بين الخصائص (Mean / Worst / SE)
- رسومات بيانية توضح الفروق بين أنواع الحالات
- استخدام Filters و Slicers لتسهيل استكشاف البيانات
النتائج:
يساعد هذا التحليل في تقديم رؤية واضحة حول أهم العوامل المرتبطة بسرطان الثدي، مما يدعم فهم البيانات الطبية واتخاذ قرارات مبنية على البيانات