مشروع متكامل في تعلّم الآلة يهدف إلى توقع تكاليف التأمين الطبي للأفراد بناءً على العوامل الديموغرافية ونمط الحياة مثل العمر، ومؤشر كتلة الجسم (BMI)، وحالة التدخين، والمنطقة الجغرافية.
يتضمن المشروع مراحل متقدمة من معالجة البيانات، وترميز الخصائص (Feature Encoding)، وتجربة عدة خوارزميات انحدار تشمل Linear Regression و Random Forest و XGBoost، للوصول إلى أفضل أداء تنبؤي ممكن.
التقنيات المستخدمة
Python
Scikit-learn
XGBoost
Pandas
NumPy
Matplotlib
Seaborn