قمت بتنفيذ مشروع ETL متكامل باستخدام Python لتحليل بيانات متعلقة بجائحة COVID-19 من مصادر متعددة.
تضمن المشروع المراحل التالية:
استخراج البيانات (Extract): جمع البيانات من قواعد SQL وملفات CSV متعددة.
تحويل البيانات (Transform): تنظيف وتوحيد الحقول والتواريخ، ومعالجة القيم المفقودة باستخدام مكتبات pandas وnumpy لضمان دقة النتائج.
تحميل البيانات (Load): تخزين البيانات النهائية في منصة Snowflake بطريقة منظمة وقابلة للتوسّع.
التحليل والعرض (Visualization): تصميم لوحة تحكم Power BI تفاعلية توضح مؤشرات انتشار الفيروس (عدد الإصابات، معدلات التعافي، الوفيات، الاتجاهات الزمنية حسب الدولة).
المشروع ركّز على بناء Pipeline احترافية لمعالجة البيانات من البداية حتى العرض النهائي، مما سهّل تحليل البيانات بشكل مرئي وسهل الفهم.