هذا المشروع يهدف إلى تحليل بيانات التأمين الصحي وبناء نموذج تنبؤي لتقدير التكاليف بناءً على مجموعة من العوامل مثل العمر، مؤشر كتلة الجسم (BMI)، عدد الأطفال، حالة التدخين، والمنطقة.
تم تنفيذ المشروع من خلال عدة مراحل أساسية:
تنظيف البيانات (Data Cleaning): التعامل مع القيم المفقودة وضمان جودة البيانات
تحليل البيانات الاستكشافي (EDA): فهم العلاقات بين المتغيرات واكتشاف الأنماط
معالجة البيانات (Preprocessing):
تحويل البيانات الفئوية باستخدام One-Hot Encoding
عمل Feature Scaling للبيانات الرقمية
بناء النموذج (Model Building):
تم استخدام نماذج الانحدار (Regression Models) لتوقع التكاليف بدقة عالية
تقييم الأداء (Model Evaluation):
باستخدام مقاييس مثل:
Mean Absolute Error (MAE)
Mean Squared Error (MSE)
R² Score
المشروع يعكس فهمًا قويًا لكيفية التعامل مع البيانات وبناء نماذج تنبؤية فعالة يمكن استخدامها في مجالات التأمين والتحليل المالي.