في هذا المشروع قمت بتحليل بيانات طبية من ملف medical_hospital_dataset.csv باستخدام Jupyter Notebook وPython بهدف استخراج رؤى تحليلية تساعد في فهم أداء المستشفى وسلوك المرضى وتحسين عملية اتخاذ القرار.
بدأت العملية بتحميل البيانات واستكشافها للتعرف على طبيعتها وعدد الأعمدة والصفوف، ثم تم تنفيذ مرحلة تنظيف البيانات (Data Cleaning) من خلال فحص القيم المفقودة والمكررة والتأكد من جاهزية البيانات للتحليل.
بعد ذلك قمت بإجراء مجموعة من التحليلات الإحصائية مثل حساب متوسط مدة الإقامة لكل قسم (Department) لمعرفة الأقسام التي تتطلب وقتًا أطول في العلاج، وتحليل التكلفة الإجمالية حسب مستوى الخطورة (Risk Level) لتحديد العلاقة بين درجة الخطورة وتكلفة الرعاية، بالإضافة إلى تحليل عدد المرضى في كل مستوى خطورة باستخدام الرسوم البيانية.
استخدمت في هذا المشروع مكتبات Pandas وNumPy لتحليل البيانات وتنفيذ العمليات الحسابية، إلى جانب Matplotlib وSeaborn لإنشاء مخططات بيانية احترافية تُظهر النتائج بشكل واضح وسهل الفهم.
يهدف المشروع في النهاية إلى مساعدة المستشفى في تحديد نقاط الضعف والقوة في الأقسام المختلفة، وتحسين توزيع الموارد واتخاذ قرارات مبنية على البيانات لتحسين جودة الرعاية الصحية.