توقع مستوى خطر السمنة باستخدام تقنيات التعلم الآلي

تفاصيل العمل

يهدف هذا المشروع إلى تصنيف مستويات السمنة بناءً على مجموعة من الخصائص باستخدام تقنيات التعلم الآلي. يحتوي dataset على 17 خاصية، مع متغير مستهدف يسمى NObesity (مستوى السمنة) الذي يتضمن الفئات التالية:

وزن غير كافٍ.

وزن طبيعي.

زيادة وزن من المستوى الأول.

زيادة وزن من المستوى الثاني.

سمنة من النوع الأول.

سمنة من النوع الثاني.

سمنة من النوع الثالث.

يتمثل الهدف في إنشاء نموذج يمكنه توقع مستوى السمنة بدقة للأفراد بناءً على بياناتهم.

التقنيات المستخدمة:

تم استخدام تقنيات تعلم الآلة التالية لتصنيف البيانات:

الانحدار اللوجستي.

الأشجار القرار.

الغابات العشوائية.

XGBoost (التقنية الرئيسية بسبب أدائها العالي).

LGBMClassifier.

النتائج:

حقق نموذج LGBMClassifier دقة بلغت 91% على مجموعة البيانات الاختبارية. تم استخدام المصفوفة التشابكية وتقارير التصنيف لتقييم الأداء من حيث الدقة والاسترجاع وF1-score لكل فئة.

الاستخدام:

إعداد البيانات:

الحصول على مجموعة البيانات وتحميلها في بيئة العمل.

معالجة البيانات:

ترميز المتغيرات الفئوية.

موازنة الخصائص العددية وتقييسها عند الحاجة.

تدريب النموذج:

تدريب نموذج XGBoost باستخدام البيانات المُعدة.

يمكن تجربة تقنيات تعلم الآلة الأخرى المذكورة أعلاه.

تقييم النموذج:

تقييم أداء النموذج باستخدام مقاييس مثل الدقة، الاسترجاع، وF1-score.

مقارنة النتائج لتحديد فعالية النموذج في تصنيف مستويات السمنة.

إجراء التوقعات:

استخدام النموذج المدرب للتنبؤ بمستويات السمنة للبيانات الجديدة أو غير المرئية.

تقييم الأداء استنادًا إلى النتائج المحققة.

المراجع:

مجموعة البيانات.

توثيق XGBoost.

توثيق LGBMClassifier.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
18
تاريخ الإضافة
تاريخ الإنجاز
المهارات