يوفر هذا المشروع تحليلًا شاملًا لعمليات الطيران عبر المطارات الرئيسية في الولايات المتحدة. تم استخدام مجموعة بيانات أولية كانت خام وغير متسقة، حيث جرى معالجتها مسبقًا باستخدام Python لعمليات تنظيف متقدمة للبيانات، والتعامل مع القيم المفقودة، ودمج جداول الرحلات مع بيانات المطارات، وتوحيد بيانات شركات الطيران.
الأدوات:
Python (Pandas, NumPy)
Power BI
الخطوات:
تنظيف وإعداد البيانات باستخدام Python (معالجة القيم المفقودة، دمج البيانات، توحيد الأكواد).
بناء نموذج Star Schema في Power BI لتمكين تحليلات ديناميكية متعددة الأبعاد.
تطوير لوحة معلومات تفاعلية باستخدام Power BI لتحليل عمليات الطيران عبر المطارات الرئيسية في الولايات المتحدة.
تصور النشاط في المطارات، أداء شركات الطيران، الاتجاهات الموسمية، والتوزيع الجغرافي.
عملية النمذجة:
بعد التنظيف، تم تحميل البيانات إلى Power BI حيث تم بناء نموذج Star Schema قوي يربط جداول الوقائع (Fact Tables) بالأبعاد (Dimensions) مثل: المطارات، شركات الطيران، التواريخ، والمدن. هذا النموذج مكّن من الحصول على رؤى دقيقة وسريعة من خلال التصفية المتقاطعة.
أهم الرؤى التحليلية:
نشاط المطارات:
تحديد المطارات الأكثر نشاطًا وفقًا لإجمالي حجم الرحلات.
عرض أوقات الذروة للإقلاع باستخدام المخططات الخطية والدائرية.
إظهار الاتجاهات الموسمية وأيام الأسبوع مع ملاحظة ارتفاعات واضحة في فترات الأعياد.
اتجاهات الرحلات حسب الأيام:
رصد اتجاه تصاعدي في إجمالي الرحلات مع ذروة في أشهر معينة يليها انخفاض.
تقسيم تفصيلي حسب الشهر وأيام الأسبوع لفهم أنماط التشغيل.
أداء شركات الطيران:
تحليل مقارن بين كبرى شركات الطيران من حيث عدد الرحلات والالتزام بالمواعيد.
المخططات الخطية والعمودية توضح أنماط التأخير والالتزام بالمواعيد لكل شركة.
التوزيع الجغرافي:
خريطة تفاعلية تعرض توزيع المطارات وأحجام الرحلات عبر الولايات المتحدة.
أنماط الحركة الجوية الإقليمية توفر رؤى استراتيجية لدعم القرارات اللوجستية وخطط التوسع.
تنظيف البيانات المتقدم باستخدام Python:
إزالة التكرارات والطوابع الزمنية غير الصحيحة.
توحيد أكواد شركات الطيران والمطارات.
إنشاء أعمدة مشتقة مثل: وقت اليوم، يوم الأسبوع، والشهر.
معالجة القيم المفقودة باستخدام الاستيفاء (Interpolation) والتعويض الشرطي.
ضمان تكامل العلاقات المرجعية (Referential Integrity) لتوافق نموذج Power BI.