توقع متوسط العمر المتوقع (Life Expectancy) باستخدام الانحدار الخطي
نبذة عن المشروع:
بناء نموذج تحليل إحصائي وتنبؤي لتقدير "متوسط العمر المتوقع" للأفراد في مختلف الدول. يعتمد النموذج على تحليل بيانات منظمة الصحة العالمية (WHO)، ويدرس تأثير العوامل الصحية، والاقتصادية، والاجتماعية (مثل الناتج المحلي الإجمالي، معدلات التحصين، ومستوى التعليم) على جودة وعمر الإنسان.
ما قمت بإنجازه:
تنظيف ومعالجة البيانات: التعامل باحترافية مع القيم المفقودة (Missing Values) والبيانات غير المكتملة الشائعة في السجلات الصحية العالمية.
التحليل الاستكشافي (EDA): دراسة مصفوفة الارتباط (Correlation Matrix) لمعرفة أكثر العوامل تأثيراً على متوسط العمر (مثل العلاقة بين التعليم ومعدلات الوفيات).
بناء النموذج: تطوير وتدريب نموذج "انحدار خطي متعدد" (Multiple Linear Regression) قادر على التنبؤ بالأرقام بناءً على المعطيات المدخلة.
تقييم الأداء: قياس كفاءة النموذج ودقته باستخدام المقاييس الإحصائية المعتمدة مثل (R-squared) لمعرفة نسبة التباين المفسر، و (RMSE) لحساب نسبة الخطأ.
الأدوات والتقنيات المستخدمة:
لغة البرمجة: Python
معالجة البيانات: Pandas, NumPy
تصوير البيانات: Seaborn, Matplotlib
تعلم الآلة (ML): Scikit-Learn