في هذا المشروع قمت بتحليل بيانات رحلات جوية ضخمة بهدف دراسة معدلات التأخير وأداء شركات الطيران.
كانت البيانات تعاني من مشكلة عدم توازن (Imbalanced Data) بين الرحلات المتأخرة وغير المتأخرة، لذلك قمت بتطبيق تقنية Random Undersampling لإنشاء عينة متوازنة تتيح تحليلًا أكثر دقة وعدالة.
خطوات العمل شملت:
تنظيف البيانات وتجهيزها للتحليل
معالجة عدم توازن الفئات (Class Imbalance)
حساب النسب المئوية للتأخير لكل شركة طيران
إنشاء رسوم بيانية توضيحية باستخدام Seaborn وMatplotlib
استخراج مؤشرات واضحة حول أداء شركات الطيران
يعرض المشروع مقارنة بصرية واضحة بين الرحلات المتأخرة والرحلات في موعدها لكل شركة طيران، مما يساعد على فهم أنماط التأخير واتخاذ قرارات مبنية على البيانات.