مشروع تحليل بيانات الرعاية الصحية
تحليل 55 ألف سجل صحي باستخدام Excel و Power Query
رابط مجموعة البيانات على Kaggle:
خطوات تعديل البيانات قبل عملية التحليل
1. أضفت عموداً شرطياً يسمى "Age Group"
لتحديد الفئة العمرية للحالة وفقاً لعدد سنوات عمرها وذلك لتسهيل عملية التحليل
وفهم أي الفئات العمرية هي الأكثر مرضاً وما هي الأمراض التي تؤثر عليها، وفهم ما إذا كانت هناك علاقة بين
زيادة عمر الحالة وعدد الحالات وغيرها من التحليلات.
2. أضفت عموداً يسمى "Duration"
لحساب مدة إقامة الحالة في المنشأة الصحية (بالأيام) لدراسة العلاقات المختلفة مع مدة إقامة الحالة وما هو متوسط المدة لكل حالة
مرضية.
3. أضفت عموداً لـ "السنة" (Year)
السنة الخاصة بالحالة المرضية من أجل إجراء مقارنات في
عدد الحالات في كل عام ووضع مخطط زمني لمعدل الحالات،
وكذلك الميزانية التي أنفقتها شركات التأمين الصحي خلال كل عام.
ماذا فعلت لتصور البيانات (Visualize)؟
لقد قمت بإنشاء لوحتي تحكم Dashboards
الأولى للتحليل المالي (Financial Analysis)
تتعامل مع الرسوم البيانية التي تدرس معدل الإنفاق السنوي لشركات التأمين، وأكثر الشركات من حيث إجمالي مبالغ الإنفاق، وإجمالي الإنفاق المالي لكل مرض وغيرها.
وذلك للإجابة على أسئلة مختلفة، أشهرها:
1. هل الإنفاق السنوي في ازدياد أم نقصان؟
2. هل معدل الإنفاق يتماشى مع معدل الحالات المرضية، أي هل شركات التأمين ملتزمة دائماً بمرور الوقت؟
3. ما هي الحالات الطبية التي تستنزف اقتصاد شركات التأمين أكثر من غيرها؟
[ لوحة التحكم الأخرى للتحليل الإحصائي للحالات المرضية Statistic Cases Dashboard ]
تتعامل مع الرسوم البيانية لدراسة:
المعدل الزمني للحالات - المستشفيات الأكثر استقبالاً - العلاقة بين العلاج المستخدم ومعدل الحالات
- نسبة الدخول للحالات المختلفة (طوارئ - حجز - عاجل) وغيرها.
وذلك للإجابة على أسئلة مختلفة، أشهرها:
1. هل يزداد معدل الحالات أم ينقص بمرور الوقت؟
2. هل هناك علاج له تأثير ملحوظ على معدل حالة معينة؟
3. ما هي الأمراض الأكثر شيوعاً في الحالات؟
وأسئلة أخرى.
إذا كنت تريد ملخصاً لما توصلت إليه من التحليل، فقد وضعت ملخص التحليل النهائي في ملف يسمى "Final Report.pdf".
وللاطلاع على باقى مشاريعى رابط حسابى على Git Hub: