مشروع Healthcare Insurance ML Prediction يهدف إلى التنبؤ بتكاليف التأمين الصحي للأفراد اعتمادًا على مجموعة من الخصائص مثل العمر، مؤشر كتلة الجسم (BMI)، عدد الأطفال، حالة التدخين، والمنطقة الجغرافية.
تم تنفيذ المشروع باستخدام تقنيات تعلم الآلة، حيث تم تطبيق نموذجين رئيسيين:
Linear Regression للتنبؤ بالعلاقة الخطية بين المتغيرات.
K-Nearest Neighbors (KNN) كنموذج غير خطي يعتمد على أقرب الجيران.
مراحل العمل:
Data Handling
تحميل البيانات والتأكد من سلامتها
التعامل مع القيم المفقودة (Missing Values)
إزالة القيم الشاذة (Outliers) إن وجدت
Data Preprocessing
تحويل المتغيرات الفئوية (Categorical) باستخدام Encoding
عمل Feature Scaling (خصوصًا مهم لـ KNN)
تقسيم البيانات إلى Training و Testing
Model Training
تدريب نموذج Linear Regression
تدريب نموذج KNN مع اختيار أفضل قيمة لـ K
Model Evaluation
تم تقييم النماذج باستخدام:
Mean Absolute Error (MAE)
Mean Squared Error (MSE)
R² Score
ومقارنة الأداء بينهمز