يقوم هذا المشروع بإجراء تحليل استكشافي شامل (Exploratory Data Analysis) لبيانات فيروس كورونا عالميًا، بهدف فهم أنماط الإصابات والوفيات وحالات التعافي، مع تحليل التغيرات الأسبوعية واكتشاف العلاقات الرئيسية بين المتغيرات مثل معدلات الوفيات ومعدلات التعافي.
? بيانات المشروع (Dataset)
المصادر المستخدمة:
country_wise_latest.csv
worldometer_data.csv
أهم الخصائص التي تم تحليلها:
عدد الإصابات المؤكدة (Confirmed)
عدد الوفيات (Deaths)
عدد المتعافين (Recovered)
الحالات النشطة (Active)
التغير خلال أسبوع واحد (1 week change)
نسبة الزيادة الأسبوعية (1 week % increase)
الوفيات لكل 100 حالة (Deaths / 100 Cases)
التعافي لكل 100 حالة (Recovered / 100 Cases)
الوفيات لكل 100 متعافٍ (Deaths / 100 Recovered)
عدد السكان
إقليم منظمة الصحة العالمية (WHO Region)
? أهم عناصر التحليل (EDA Highlights)
1. ترتيب أعلى 10 دول حسب:
الإصابات المؤكدة
الوفيات
معدل التعافي
2. تحليل التغيرات الأسبوعية حسب كل إقليم من أقاليم منظمة الصحة العالمية (WHO Region).
3. دراسة العلاقات بين المتغيرات، مثل:
العلاقة بين عدد السكان وعدد الحالات المؤكدة (Population vs Confirmed Cases).
العلاقة بين نسبة الوفيات لكل 100 حالة ومعدل التعافي (Deaths / 100 Cases vs Recovered / 100 Cases).
4. اكتشاف القيم الشاذة Outliers
باستخدام الرسوم الصندوقية Boxplots للكشف عن الدول التي تُظهر أرقامًا غير طبيعية.
5. استخدام مكتبات Matplotlib و Seaborn لإنتاج مخططات احترافية مثل:
Barplots
Scatterplots
Boxplots
Heatmaps
? النتائج الرئيسية (Key Findings)
الدول ذات التعداد السكاني الكبير تميل إلى تسجيل حالات إصابة أعلى (خاصة عند التحليل بمقياس لوغاريتمي Log-Log).
كلما زادت معدلات التعافي انخفضت معدلات الوفيات — علاقة عكسية واضحة.
انتشار الفيروس يختلف بشكل كبير بين أقاليم منظمة الصحة العالمية؛ بعض المناطق تظهر نموًا أسبوعيًا أعلى بكثير من غيرها.
بعض الدول تُظهر قيمًا شاذة جدًا سواء في إجمالي الحالات أو الوفيات، مما يشير إلى ظروف خاصة أو اختلافات كبيرة في أساليب الإبلاغ.