وصف العمل
قمت بتطوير لوحة بيانات تفاعلية (Dashboard) باستخدام مكتبات Pandas، Plotly، Dash لتحليل بيانات مواعيد طبية (Medical Appointments Dataset).
الخطوات المنفذة:
استكشاف البيانات (EDA):
عرض الشكل العام للبيانات (Shape, Head, Describe).
فحص أنواع البيانات والقيم المفقودة والمكررة.
حساب عدد القيم الفريدة لكل عمود.
تنظيف البيانات (Data Cleaning):
توحيد صياغة أسماء الأعمدة (lowercase + إزالة المسافات).
استبعاد القيم غير المنطقية مثل الأعمار الأقل من 0.
تحويل الأعمدة الخاصة بالتواريخ إلى صيغة تاريخية (Datetime).
إنشاء أعمدة مشتقة مثل days_diff (عدد الأيام بين الحجز والموعد).
حذف القيم السالبة في عدد أيام الانتظار.
تحليل إحصائي (Statistical Analysis):
حساب عدد المرضى الكلي.
مقارنة من حضر ومن لم يحضر الموعد.
متوسط الأعمار، نسبة استقبال الرسائل النصية (SMS)، ومتوسط أيام الانتظار.
لوحة مؤشرات (KPIs Cards):
عرض عدد المرضى، من حضروا، من لم يحضروا.
متوسط العمر.
نسبة استقبال الرسائل النصية.
متوسط أيام الانتظار.
تصوير البيانات (Visualizations):
أنشأت عدة رسوم بيانية تفاعلية باستخدام Plotly:
توزيع الأعمار حسب الحضور.
تأثير النوع (Gender) على الحضور.
توزيع المواعيد حسب أيام الأسبوع.
تأثير الرسائل النصية على الحضور.
العلاقة بين الأمراض المزمنة (ضغط/سكر) والحضور.
زمن الانتظار وتأثيره على الحضور.
توزيع الحضور حسب الأحياء (Neighborhood).
تطوير لوحة تفاعلية (Interactive Dashboard):
استخدام Dash لعرض جميع الإحصائيات والرسوم بشكل منظم.
تصميم عصري (ألوان هادئة، Grid Layout، بطاقات KPIs).
إمكانية التفاعل مع الرسوم (Hover, Zoom, Filter).