تحليل بيانات سرطان الثدي باستخدام تقنيات تحليل البيانات والتصور البياني

تفاصيل العمل

نوع العمل

تحليل بيانات طبية يهدف لفهم خصائص بيانات سرطان الثدي واستخدام الإحصاء والرسوم البيانية لاستخراج أنماط وعلاقات.

يعتمد على لغة Python ومكتبات مثل:

pandas و numpy لمعالجة البيانات.

matplotlib و seaborn للتصور البياني.

(ممكن يكون فيه تعلم آلي لاحقًا باستخدام sklearn).

ميزاته

تنظيف البيانات: التعامل مع القيم المفقودة والمكررة.

التحليل الوصفي: استخراج المتوسطات، التوزيعات، والانحرافات.

التصور البياني: استخدام الرسوم (Boxplot, Histogram, Heatmap) لفهم العلاقات بين المتغيرات.

سهولة التطبيق والتوسع: يمكن تطويره لإضافة خوارزميات تعلم آلي للتصنيف (تحديد ما إذا كان الورم حميد أو خبيث).

قيمة عملية: يدعم الأبحاث الطبية ويُسهل فهم العوامل المؤثرة في المرض.

طريقة التنفيذ

استيراد البيانات (من CSV أو مكتبة sklearn).

استكشاف البيانات: df.head(), df.info(), df.describe().

تنظيف البيانات: إزالة القيم الناقصة والمكررات.

التحليل الاستكشافي (EDA):

جداول إحصائية (المتوسط، الوسيط).

رسوم بيانية لفحص العلاقة بين المتغيرات.

(اختياري) بناء نموذج تعلم آلي مثل Logistic Regression أو Random Forest للتنبؤ بنوع الورم.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
4
تاريخ الإضافة
تاريخ الإنجاز
المهارات