يستهدف هذا المشروع تحليل العوامل الصحية والديموغرافية التي تؤدي إلى زيادة خطر الإصابة بأمراض القلب، باستخدام بيانات صحية لعام 2020. يركز التحليل على مؤشرات مثل مؤشر كتلة الجسم (BMI)، والتدخين، واستهلاك الكحول، والحالة الجسدية والنفسية، وأنماط النوم لتحديد مدى تأثيرها على الإصابة بأمراض القلب. الهدف النهائي هو تقديم توصيات عملية تعزز الصحة العامة وتقلل من معدلات الإصابة.
مراحل التنفيذ
1. جمع البيانات وتنظيفها
تم الحصول على البيانات الصحية من مصدر موثوق (مثل Kaggle أو قاعدة بيانات حكومية).
تمت معالجة البيانات باستخدام Python وpandas لتنظيف القيم الناقصة أو غير المنطقية.
تم استخدام Matplotlib وSeaborn لإنشاء رسوم بيانية استكشافية لفهم العلاقات بين المتغيرات.
2. التحليل الاستكشافي للبيانات (Exploratory Data Analysis - EDA)
تحليل توزيع كل عامل (مثل BMI، التدخين) باستخدام الرسوم البيانية التفاعلية من Plotly.
دراسة الأنماط بين الفئات العمرية والجنس لتحديد عوامل الخطر الأكثر تأثيرًا في كل مجموعة.
تحليل الفروقات في الحالة النفسية والجسدية وأثرها على القلب باستخدام Boxplots وHeatmaps.
3. بناء نماذج التعلم الآلي
تم تطوير عدة نماذج لتحليل وتوقع مخاطر الإصابة بأمراض القلب:
الانحدار اللوجستي (Logistic Regression):
لتحديد العلاقة بين العوامل الصحية وإصابة القلب.
تم ضبط النموذج باستخدام scikit-learn للوصول إلى دقة 80%.
شجرة القرار (Decision Tree):
لفهم المتغيرات الأكثر تأثيرًا بشكل بصري.
تم استخدام Graphviz لتوضيح مسار اتخاذ القرارات في الشجرة.
الغابة العشوائية (Random Forest):
لتحسين دقة التنبؤ وتقليل التحيز.
تحسين المعاملات باستخدام GridSearchCV للوصول لأفضل أداء.
4. تقييم أداء النماذج وتحليل النتائج
تقييم النماذج باستخدام مصفوفة الالتباس (Confusion Matrix) ومعامل الدقة (Accuracy Score).
دراسة المتغيرات التي ساهمت بشكل كبير في التنبؤ بالإصابة، مثل:
مؤشر كتلة الجسم (BMI)
الحالة النفسية (Mental Health)
التدخين واستهلاك الكحول
5. تقديم التوصيات
توصيات لتحسين نمط الحياة:
تقليل استهلاك الكحول والتدخين.
تحسين أنماط النوم لتقليل التوتر.
برامج توعية صحية تستهدف الفئات العمرية الأكثر عرضة للخطر.
تشجيع النشاط البدني المنتظم لتحسين الحالة الجسدية والنفسية.
6. إعداد التقارير والعروض التقديمية
إعداد تقرير شامل باستخدام Microsoft PowerPoint وGoogle Slides يتضمن:
وصف تفصيلي للمشروع ونتائج التحليل.
رسوم بيانية توضح العلاقة بين العوامل المختلفة وأمراض القلب.
التوصيات المقترحة لتحسين الصحة العامة.
إنشاء لوحات معلومات تفاعلية باستخدام Tableau لتسهيل تحليل البيانات واتخاذ القرارات.
الأدوات والبرامج المستخدمة
Python: لتحليل البيانات وبناء النماذج (باستخدام pandas وscikit-learn).
Jupyter Notebook: لتوثيق التحليل بشكل تفاعلي.
Plotly وSeaborn: لإنشاء رسوم بيانية تفاعلية واستكشافية.
Tableau وPower BI: لتطوير لوحات معلومات تفاعلية.
Excel: لتحليل البيانات الأولي وتنسيق الجداول.
Google Slides / Microsoft PowerPoint: لإعداد التقارير والعروض التقديمية.
النتائج المتوقعة
تحديد الفئات الأكثر عرضة للإصابة بأمراض القلب لاتخاذ تدابير وقائية.
اقتراح برامج توعوية لتحسين العادات الصحية.
تقديم توصيات للشركات والمستشفيات لدعم الصحة العامة وتقليل المخاطر.
تطوير لوحات معلومات للإدارة الصحية لتتبع المؤشرات الرئيسية وتحسين التخطيط الصحي.
هذا المشروع يساعد في دعم القرارات الصحية والتقليل من مخاطر الإصابة بأمراض القلب من خلال تحليل العوامل الصحية والسلوكية، مما يعزز الصحة العامة ويحسن جودة الحياة.
اسم المستقل | Abdelrahman Mohamed A. |
عدد الإعجابات | 0 |
عدد المشاهدات | 11 |
تاريخ الإضافة | |
تاريخ الإنجاز |