السلام عليكم و رحمة الله, في هذا المشروع قمتُ بتحليل مجموعة بيانات عالمية لمرضى السرطان بين عامي 2015 و2024 بهدف فهم الأنماط والتنبؤ بدرجة خطورة الحالات.
المهام المنجزة:
تنظيف ومعالجة البيانات (إزالة التكرارات، معالجة القيم المفقودة).
إجراء التحليل الاستكشافي للبيانات (EDA) واستخراج الرؤى الأولية.
إنشاء تصورات بيانية باستخدام Matplotlib و Seaborn لتوضيح الاتجاهات.
بناء نموذج تعلم آلي باستخدام Random Forest Regressor للتنبؤ بدرجة الخطورة.
تقييم النموذج باستخدام MSE و R² لقياس دقة الأداء.
استخراج أهمية الخصائص (Feature Importance) لتحديد العوامل الأكثر تأثيرًا.
الأدوات والتقنيات المستخدمة:
Python – Pandas – NumPy – Matplotlib – Seaborn – Scikit-learn
هذا المشروع يوضح قدرتي على الجمع بين تحليل البيانات و تطبيق نماذج تعلم الآلة لتحويل البيانات الخام إلى رؤى عملية يمكن الاعتماد عليها.