تفاصيل مشروع: تحليل بيانات تأمينية باستخدام الانحدار البسيط والمتعدد
في هذا المشروع، قمت بتطبيق نماذج انحدار بسيطة ومتعددة (Polynomial & Simple Regression) على بيانات تأمينية حقيقية بهدف التنبؤ بتكلفة التأمين بناءً على خصائص العملاء.
الخطوات التي تم تنفيذها:
معالجة البيانات وتحضيرها (Data Preprocessing):
شملت تنظيف البيانات، التعامل مع القيم المفقودة، وتحويل المتغيرات النوعية (Categorical) إلى شكل رقمي باستخدام الترميز (Encoding).
تطبيق نموذج الانحدار البسيط (Simple Regression):
لتحديد العلاقة بين متغير واحد (مثل العمر أو عدد الأطفال) وتكلفة التأمين.
تطبيق نموذج الانحدار المتعدد (Polynomial Regression):
لتوسيع النموذج وجعله أكثر دقة باستخدام حدود متعددة للمتغيرات (Higher Degree Terms).
اختبار الفرضيات (Hypothesis Testing):
للتحقق من مدى أهمية المتغيرات في التأثير على المتغير المستهدف.
تحليل التباين (ANOVA):
لتقييم جودة النماذج ومعرفة مدى تأثير المتغيرات المستقلة على المتغير التابع.
التقنيات والأدوات المستخدمة:
Python
مكتبة Scikit-learn (لتطبيق النماذج)
مكتبة Pandas وNumPy (لمعالجة البيانات)
مكتبة Statsmodels (لتحليل ANOVA والاختبارات الإحصائية)
مكتبة Matplotlib وSeaborn (لتحليل البيانات بصريًا)