تفاصيل العمل

تحليل وتوقع الصحة النفسية العالمية (Global Mental Health & Lifestyle)

ملخص المشروع

تطوير نظام تنبؤي متكامل (End-to-End) يهدف إلى تحديد احتمالية الإصابة بمشاكل الصحة النفسية بناءً على 51 عاملاً من عوامل نمط الحياة. المشروع يركز على تحويل المؤشرات السلوكية (مثل ضغوط العمل والدعم الاجتماعي) إلى بيانات تنبؤية دقيقة.

التحديات الهندسية والحلول الذكية

حل معضلة اختلال البيانات (Class Imbalance): واجهت مجموعة بيانات غير متوازنة بشكل حاد (92% حضور مقابل 8% غياب). قمت بحلها تقنياً عبر تطبيق استراتيجيات class_weight='balanced' و scale_pos_weight لضمان أن النماذج لا تتجاهل الفئة الأقلية وتتمتع بالنزاهة في التوقع.

إصلاح تسريب البيانات (Data Leakage): اكتشفت ميزات سريرية (مثل التشخيص المسبق) كانت تتسبب في دقة وهمية بنسبة 100%. قمت بحذفها لضمان اعتماد النموذج على مؤشرات نمط الحياة فقط، مما يجعله أداة حقيقية للتنبؤ المبكر قبل الوصول للمرحلة السريرية.

التحسين والضبط (Optimization): استخدمت خوارزمية GridSearchCV للوصول إلى أفضل المعايير (Hyperparameters) لنماذج SVM و XGBoost.

النتائج الفنية واختيار النموذج

النموذج المختار: تم تفضيل نموذج Linear SVM رغم أن دقته الإجمالية (64%) أقل من غيره، إلا أنه حقق أفضل معدل استدعاء (Recall) للفئة الأقلية بنسبة 67%، مما يجعله النموذج الأكثر "عدلاً" وموثوقية في التشخيص.

أهم المحركات (Key Predictors): كشف التحليل أن الدعم الاجتماعي (Social Support) والضغوط المالية (Financial Stress) هما أقوى العوامل المؤثرة في نتائج الصحة النفسية عالمياً.

الأدوات والتقنيات المستخدمة

لغة البرمجة: Python.

المكتبات: Scikit-learn, XGBoost, Pandas, NumPy.

المنهجية: Hyperparameter Tuning, Dealing with Imbalanced Data, Feature Engineering.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
4
تاريخ الإضافة
تاريخ الإنجاز
المهارات