في هذا المشروع قمت بتحليل مجموعة بيانات حقيقية لرحلات الطيران، تشمل معلومات شركات الطيران، المدن، أوقات الرحلات، وأسعار التذاكر، للإجابة على أسئلة تجارية مهمة تخص قطاع الطيران.
الهدف من المشروع:
استخراج رؤى مفيدة من بيانات الطيران تساعد المسافرين وشركات الطيران على فهم عوامل تسعير التذاكر واختيار أفضل الرحلات من حيث السعر والوقت.
البيانات المستخدمة:
شركة الطيران، مدينة الإقلاع، مدينة الوصول، وقت الإقلاع، وقت الوصول، درجة الجلوس (اقتصادي/أعمال)، عدد الأيام المتبقية قبل الرحلة، سعر التذكرة.
أبرز التحليلات
- تكرار كل شركة طيران في البيانات
- توزيع أوقات الإقلاع والوصول
- أكثر مدن الإقلاع والوصول شيوعاً
- هل يختلف السعر من شركة لأخرى؟
- تأثير وقت الإقلاع والوصول على السعر
- تأثير المسار (المدينة → المدينة) على السعر
- كيف يرتفع السعر عند الحجز قبل يوم أو يومين فقط؟
- الفرق في السعر بين الدرجة الاقتصادية والأعمال
- متوسط سعر رحلة محددة لشركة بعينها بين مدينتين
التقنيات المستخدمة:
- Python
- Pandas - لقراءة وتحليل البيانات
- Matplotlib - للرسوم البيانية الأساسية
- Seaborn - لرسوم catplot و relplot المتقدمة
- Jupyter Notebook - بيئة التحليل
مميزات المشروع:
- يجيب على 9 أسئلة تجارية حقيقية بالبيانات
- رسوم بيانية واضحة لكل سؤال
- يمكن تطبيقه على أي dataset مشابه بتعديل بسيط
- الكود منظّم ومقروء وسهل الفهم