قمت بتنفيذ مشروع متكامل لتحليل بيانات الدوري الإنجليزي الممتاز (Premier League) من خلال بناء قاعدة بيانات وتنظيف البيانات وتحليلها وإنشاء لوحة معلومات تفاعلية.
بدأ المشروع بتصميم قاعدة بيانات علائقية (Relational Database) لإدارة بيانات الدوري، حيث شمل النظام الكيانات التالية:
Teams
Seasons
Matches
Appearances
Standings
تم تصميم ERD ثم تنفيذ الجداول باستخدام MySQL Workbench مع إنشاء العلاقات باستخدام Foreign Keys لضمان سلامة البيانات.
بعد ذلك تم إدخال بيانات تحتوي على مشاكل جودة بيانات (Dirty Data) مثل:
قيم مفقودة
أخطاء إملائية
تنسيقات غير متناسقة
قيم غير صحيحة
ثم تم تنفيذ عملية تنظيف البيانات (Data Cleaning) باستخدام:
Power Query في Excel
إزالة القيم الفارغة
توحيد أسماء الأعمدة
إزالة التكرارات
توحيد تنسيق النصوص
معالجة القيم المفقودة
تحويل أنواع البيانات
تصحيح القيم غير الصحيحة
إنشاء أعمدة جديدة مثل Status
بعد تنظيف البيانات تم إعادة استيرادها إلى قاعدة البيانات وتنفيذ مجموعة من SQL Queries لاستخراج التحليلات مثل:
عدد الفرق
متوسط الأهداف
الفرق التي حصلت على أكثر من 60 نقطة
الفرق التي فازت بعدد مباريات أكبر من الخسائر
إجمالي الانتصارات لكل فريق
عدد المواسم التي شارك فيها كل فريق
وأخيراً تم إنشاء Dashboard تفاعلي باستخدام Power BI لعرض أهم المؤشرات مثل:
متوسط النقاط
متوسط الأهداف
عدد الانتصارات لكل فريق
عدد التعادلات
تحليل الأهداف المستقبلة