هدف المشروع إلى تحليل بيانات الدم (CBC) لـ 100 مريض للتمييز بين الحالات الطبيعية وحالات حمى الضنك، وبناء نموذج تعلم آلة (Machine Learning) للمساعدة في التشخيص المبكر.
ما قمت به: استخدمت لغة Python ومكتباتها التحليلية لتنفيذ الخطوات التالية:
التحليل الاستكشافي: اختبار التوزيع الطبيعي للبيانات واكتشاف القيم الشاذة (Outliers).
التحليل الإحصائي: استخدام اختبارات (Mann-Whitney U) لتحديد الفروقات الجوهرية بين المرضى والأصحاء.
تحليل المكونات الرئيسية (PCA): لتقليل الأبعاد وتصور الفوارق بين المجموعات بيانياً.
بناء النماذج: تدريب نماذج (Random Forest, Logistic Regression) للتنبؤ بالمرض.
أهم النتائج:
تحديد "نقص الصفائح الدموية" كأهم مؤشر حيوي للتمييز بين المجموعتين.
نجح نموذج الانحدار اللوجستي (Logistic Regression) في التنبؤ بالمرض بدقة وصلت إلى 93.3%.
تقديم تقرير متكامل يدعم اتخاذ القرار الطبي بناءً على الأدلة.