عملت على بيانات تحتوي على 10 أعمدة و 984 صف من المرضى الذين تم علاجهم وتشمل التكاليف الطبية, الحالة المرضية الحالية, العملية الجراحية اللازمة, مدة البقاء في المستشفى , المعلومات الديمةغرافية, ونتيجة العلاج إلخ. الهدف من المشروع هو استخراج أنماط تساعد على فعالية العلاجات المختلفة.
قمت بتنظيف البيانات ومعالجة القيم المفقودة وأداء التحليل الاستكشافي EDA. و تنفيذ feature engineering لتحسين أداء النماذج . بالإضافة إلى data visualization. النماذج التي قمت بها هي KNN & logistic regression.