نوع العمل:
تحليل بيانات COVID-19 باستخدام علم البيانات والتصور البياني لفهم العوامل المؤثرة على الإصابة بالفيروس واستخراج رؤى واضحة لدعم اتخاذ القرار.
ميزات المشروع:
دراسة مجموعة واسعة من العوامل الصحية والسلوكية مثل الحمى، السعال الجاف، مشاكل التنفس، الأمراض المزمنة، السفر للخارج، والتعرض للفيروس.
عرض بصري للعلاقات بين المتغيرات المختلفة واحتمالية الإصابة بالفيروس.
استخراج الاتجاهات والأنماط باستخدام الرسوم البيانية Heatmap وCountplot وPie Charts.
تحديد الخصائص الأكثر تأثيرًا على الإصابة بالفيروس لدعم التحليل المستقبلي.
طريقة التنفيذ:
استكشاف البيانات (EDA):
الاطلاع على الأعمدة والمتغيرات، التحقق من القيم المفقودة أو المتكررة، ودراسة التوزيع لكل ميزة.
عرض إحصاءات أساسية حول تكرار الأعراض والعوامل الأخرى.
تنظيف وتحضير البيانات:
معالجة القيم الفارغة (إن وجدت).
تحويل القيم النصية إلى أرقام باستخدام Label Encoding لتسهيل التحليل والتصور البياني.
إزالة الأعمدة غير المفيدة مثل "Wearing Masks" و"Sanitization from Market" لعدم وجود تنوع في البيانات.
تحليل البيانات والتصور البياني:
إنشاء رسوم بيانية توضح تكرار الأعراض، العلاقة بين الأعراض واحتمالية الإصابة.
استخدام Heatmap لتوضيح الترابط بين العوامل المختلفة وCOVID-19.
عرض النتائج بطريقة واضحة تسهل على الباحثين أو الفرق الطبية فهم تأثير كل عامل على الإصابة.
الأدوات والتقنيات المستخدمة:
Python، Pandas، NumPy، Matplotlib، Seaborn، LabelEncoder
نتيجة المشروع:
فهم شامل للعوامل المؤثرة على الإصابة بفيروس COVID-19.
رؤى مرئية واضحة تساعد في التعرف على الأنماط الصحية والسلوكية الأكثر ارتباطًا بالإصابة.
قاعدة قوية لإجراء تحليلات تنبؤية مستقبلية أو لتطوير نماذج تصنيف الإصابة بالفيروس.