مشروع تحليل بيانات وتعلم آلة يهدف إلى التنبؤ باضطرابات النوم لدى الأفراد اعتمادًا على نمط حياتهم وبعض المؤشرات الصحية.
تم استخدام مجموعة بيانات Sleep Health and Lifestyle Dataset والتي تحتوي على معلومات مثل:
العمر، الجنس، المهنة
مدة وجودة النوم
مستوى النشاط البدني والتوتر
مؤشر كتلة الجسم (BMI)
ضغط الدم، معدل ضربات القلب، وعدد الخطوات اليومية
طريقة التنفيذ:
معالجة البيانات وتنظيفها (Data Preprocessing)
تحليل استكشافي للبيانات (EDA)
تحويل المتغيرات النصية إلى رقمية باستخدام Label Encoding
بناء نماذج تصنيف باستخدام:
Decision Tree Classifier
Random Forest Classifier
تقييم النماذج باستخدام:
Confusion Matrix
Classification Report
Accuracy و F1-score
النتائج:
نموذج Random Forest حقق أفضل أداء بدقة وصلت إلى 89%
أظهر التحليل أن المهنة، الجنس، وBMI من أكثر العوامل تأثيرًا على اضطرابات النوم
تم التنبؤ بثلاث حالات:
No Disorder
Insomnia
Sleep Apnea