وصف العمل المنجز لتحليل Medical Insurance Cost Dataset
قمتُ بإجراء تحليل شامل لبيانات تكاليف التأمين الطبي بهدف فهم العوامل المؤثرة على التكلفة، وذلك من خلال الخطوات التالية:
تنظيف ومعالجة البيانات: التعامل مع القيم المفقودة والتأكد من دقة المتغيرات.
التحليل الاستكشافي (EDA): دراسة توزيع الأعمار، الجنس، مؤشر كتلة الجسم (BMI)، عادة التدخين، والمنطقة الجغرافية، وربطها بمستويات تكلفة التأمين.
اكتشاف العلاقات: تحليل الترابط بين المتغيرات (مثل تأثير التدخين وارتفاع الـBMI على زيادة التكلفة).
النمذجة التنبؤية: بناء نموذج انحدار خطي للتنبؤ بتكلفة التأمين اعتمادًا على العوامل المختلفة، مع تقييم دقة النموذج.
استخلاص النتائج: تحديد أهم المتغيرات المؤثرة على التكلفة (التدخين، مؤشر كتلة الجسم، والعمر من أبرز العوامل).
التصورات البيانية: إنشاء رسوم بيانية ولوحات توضيحية تساعد على تبسيط النتائج وعرضها بشكل بصري واضح.
تقرير نهائي: تلخيص النتائج في ملف منظم يوضح الرؤى المستخلصة ويقترح كيفية الاستفادة منها في اتخاذ قرارات تخص تسعير التأمين.