? تحليل كوفيد-19
استكشاف البيانات (SQL) وتصوير البيانات (Tableau)
نظرة عامة على المشروع
يستكشف هذا المشروع بيانات كوفيد-19 باستخدام SQL لتحليل مقاييس مختلفة مثل معدلات الإصابة، معدلات الوفيات، وتقدم التطعيم. يعتمد التحليل على تقنيات SQL الرئيسية، بما في ذلك:
Joins (لدمج البيانات من جداول مختلفة)
Common Table Expressions (CTEs) (لتحسين القراءة وإعادة الاستخدام)
Temporary Tables (لتخزين النتائج الوسيطة)
Window Functions (لحساب القيم المتراكمة)
Aggregate Functions (لحساب الإجماليات والمتوسطات)
تحويل أنواع البيانات (لضمان دقة العمليات الحسابية)
️ Views (لاسترجاع البيانات بكفاءة في أدوات التصوير مثل Tableau)
مجموعة البيانات
تتكون البيانات من جدولين:
1️⃣ CovidDeath – يحتوي على إحصائيات حالات كوفيد-19 والوفيات حسب البلد والتاريخ.
2️⃣ CovidVaccinations – يحتوي على بيانات التطعيم حسب البلد والتاريخ.
استكشاف البيانات باستخدام SQL
1️⃣ استكشاف البيانات الأولي
استرجاع جميع البيانات المتاحة من جدول CovidDeath مع استبعاد القيم الفارغة في حقل القارة لإزالة الإحصائيات العالمية المجمعة.
2️⃣ اختيار البيانات الأساسية
استخراج الأعمدة الرئيسية مثل الموقع، التاريخ، إجمالي الحالات، الحالات الجديدة، إجمالي الوفيات، وعدد السكان.
3️⃣ إجمالي الحالات مقابل إجمالي الوفيات
حساب نسبة الوفيات لكل دولة لتحديد احتمالية الوفاة بعد الإصابة بكوفيد-19.
4️⃣ إجمالي الحالات مقابل عدد السكان
تحديد نسبة السكان المصابين في كل دولة.
5️⃣ الدول ذات أعلى معدلات الإصابة
تحديد البلدان التي تمتلك أعلى معدل إصابة بالنسبة لعدد سكانها.
6️⃣ الدول ذات أعلى معدل وفيات مقارنة بعدد السكان
حساب إجمالي عدد الوفيات لكل دولة، مع ترتيب البيانات تنازليًا.
7️⃣ تحليل عدد الوفيات حسب القارات
حساب إجمالي عدد الوفيات لكل قارة.
8️⃣ الإحصائيات العالمية
حساب إجمالي الحالات الجديدة والوفيات عالميًا، بالإضافة إلى النسبة العالمية للوفيات.
9️⃣ إجمالي عدد السكان مقابل عدد الملقحين
استخدام Window Functions لحساب العدد التراكمي للأفراد الذين تم تطعيمهم في كل دولة.
استخدام CTEs لحساب أعداد الملقحين
إنشاء CTE (PopvsVac) لحساب العدد التراكمي للأفراد الملقحين لكل دولة.
1️⃣1️⃣ استخدام الجداول المؤقتة لحساب نسبة السكان الملقحين
إنشاء جدول مؤقت (#PercentPopulationVaccinated) لتخزين بيانات التطعيم وحساب نسبة السكان الملقحين.
1️⃣2️⃣ إنشاء View لتصور البيانات في Tableau
إنشاء View (PercentPopulationVaccinated) لتسهيل استرجاع البيانات في Tableau.
تحليل البيانات باستخدام SQL لتصورها في Tableau
1. التأثير العالمي لكوفيد-19
حساب إجمالي الحالات، إجمالي الوفيات، ونسبة الوفيات عالميًا.
2. إجمالي عدد الوفيات لكل موقع
تجميع العدد الإجمالي للوفيات لكل موقع مع استبعاد القارات والملخصات العالمية.
️ 3. أعلى معدلات الإصابة
تحديد المواقع ذات أعلى معدلات الإصابة بالنسبة لعدد سكانها.
4. اتجاهات الإصابة بمرور الوقت
تتبع تغير معدلات الإصابة لكل موقع عبر الزمن.
5. تقدم عمليات التطعيم
دمج بيانات التطعيم مع بيانات الحالات لتحليل نسبة الأفراد الملقحين لكل دولة.
6. تحليل السكان مقابل التطعيم
استخدام CTEs لحساب معدلات التطعيم التراكمية وتأثيرها على معدلات الإصابة.
️ 7. تحليل اتجاهات معدلات الوفيات
دراسة تطور معدلات الوفيات بمرور الوقت وعبر المناطق المختلفة.
️ التقنيات المستخدمة
1️⃣ SQL Server Management Studio (SSMS) أو أي نظام SQL آخر.
2️⃣ Tableau (للتصورات المستندة إلى Views التي تم إنشاؤها في SQL).
كيفية الاستخدام
تشغيل استعلامات SQL في بيئة قاعدة البيانات.
استخدام الـ View النهائي (PercentPopulationVaccinated) كمصدر للبيانات في Tableau.
تحليل الرؤى المستخلصة من الاستعلامات واستخدام لوحات التحكم للحصول على تمثيل مرئي أفضل.
التحسينات المستقبلية
تحسين المشروع بإضافة Stored Procedures للأتمتة.
تنفيذ Triggers لتحديث البيانات في الوقت الفعلي.
? دمج Python لتحليل إحصائي أعمق والتنبؤ بالاتجاهات المستقبلية.
️ المؤلف: عبدالرحمن الكشكي
اسم المستقل | Abdelrhman E. |
عدد الإعجابات | 0 |
عدد المشاهدات | 4 |
تاريخ الإضافة | |
تاريخ الإنجاز |