قمت بإجراء عملية تحليل وتنظيف شاملة لمجموعة بيانات تكاليف التأمين الطبي لضمان دقتها وقابليتها للاستخدام في اتخاذ القرارات.
العمليات المنفذة في المشروع:
Data Cleaning: فحص البيانات بحثاً عن قيم مفقودة (Null values) أو مكررة (Duplicates) ومعالجتها لضمان جودة النتائج.
Data Preprocessing: تحويل المتغيرات النصية (مثل الجنس والمنطقة) إلى قيم رقمية منظمة، ومعالجة القيم المتطرفة (Outliers) التي قد تؤثر على دقة الإحصائيات.
Exploratory Data Analysis (EDA): دراسة العلاقات بين المتغيرات الأساسية (مثل تأثير التدخين على التكاليف) واستخراج مؤشرات إحصائية دقيقة.
Data Visualization: بناء رسومات بيانية توضح توزيع التكاليف والارتباطات بين العوامل الصحية والمادية المختلفة باستخدام مكتبات Python.