قمت بتحليل مجموعة بيانات طبية تحتوي على أكثر من 100,000 سجل لمرضى يحددون مواعيد طبية، بهدف معرفة العوامل التي تؤثر على حضور المرضى لمواعيدهم.
تفاصيل العمل:
- تنظيف البيانات والتأكد من جودتها باستخدام مكتبة pandas
- معالجة القيم المفقودة والبيانات غير المنطقية مثل الأعمار السالبة
- تحويل التواريخ وتحليل الفرق بين موعد الحجز وموعد الزيارة
- استخدام تحليل إحصائي للإجابة على الأسئلة مثل:
- هل العمر يؤثر على نسبة عدم الحضور؟
- هل تلقي رسالة SMS يؤثر على الحضور؟
- هل يؤثر الجنس أو نوع المرض أو الحيّ السكني على الحضور؟
أدوات التحليل والتصور:
- Python (Pandas, NumPy)
- Matplotlib و Seaborn لتصوير النتائج بشكل مرئي جذاب
تم عرض النتائج النهائية في شكل رسوم بيانية تسهّل فهمها واتخاذ قرارات مبنية على البيانات
النتائج النهائية:
قدّمت تقريرًا شاملاً يوضح العوامل المؤثرة في عدم الحضور مما يساعد الجهات الطبية على اتخاذ إجراءات تحسينية مستقبلًا.