تم تنفيذ مشروع تحليلي متكامل لدراسة بيانات حالات فيروس كورونا (COVID-19) على مستوى العالم، بهدف استخراج رؤى مهمة حول انتشار الفيروس وتأثيره عبر الأقاليم والزمن.
يشمل المشروع جميع مراحل تحليل البيانات — من التنظيف حتى استخراج الاستنتاجات النهائية — باستخدام أدوات علم البيانات الاحترافية في Python.
️ الخطوات الأساسية في المشروع
Cleaning Data
معالجة القيم المفقودة في الأعمدة (New_cases, New_deaths).
تحويل الأعمدة الزمنية إلى datetime وحفظ الترتيب الزمني الصحيح.
Feature Engineering
إنشاء متغيرات جديدة مثل Cumulative_cases و Cumulative_deaths.
استخراج ميزات زمنية (السنة، الشهر، يوم الأسبوع) لدراسة الأنماط الموسمية.
Exploratory Data Analysis (EDA)
Univariate Analysis: تحليل التوزيعات العامة للحالات والوفيات.
Bivariate & Multivariate Analysis: دراسة العلاقات بين المتغيرات عبر المخططات الزمنية والإحصاءات الوصفية.
Visualization & Insights
عرض الاتجاهات العالمية لعدد الحالات والوفيات.
تحديد المناطق الأكثر تضررًا حسب منظمة الصحة العالمية (WHO Region).
اكتشاف الأنماط الموسمية والقمم الزمنية (Waves of Outbreaks).
? التقنيات المستخدمة
Python Libraries: Pandas, NumPy, Matplotlib, Seaborn
Data Wrangling & Feature Engineering
Statistical Analysis & Visualization
Jupyter Notebook / Google Colab
النتائج
تحليل بياني واضح لتطور حالات الإصابة والوفاة عالميًا.
استخراج مؤشرات كمية وزمنية يمكن استخدامها في التنبؤ أو رسم السياسات الصحية.
بناء أساس متين لأي نموذج Machine Learning لاحق يعتمد على بيانات COVID-19 المُنظفة والمُهندسة.