تفاصيل العمل

خطوات التنظيف

**التنظيف باستخدام Excel Power Query:**

1. إزالة القيم المكررة.

2. تغيير نوع البيانات لوقت الشراء، وزمن الوصول بين الرحلات، ووقت الوصول الفعلي إلى نوع وقت.

3. إضافة عمود باسم "فترة وقت الشراء" لتحديد صباحًا أو مساءً.

4. تقسيم عمود "محطات الوصول" إلى "مدينة محطة الوصول" و"مكان محطة الوصول" لتسهيل التحليل حسب المدينة وعرض خريطة.

5. إضافة حقل محسوب باسم "تأخير الوصول" [وقت الوصول الفعلي - وقت الوصول].

6. إضافة حقل محسوب باسم "مدة الرحلة" [وقت الوصول الفعلي - وقت المغادرة].

لتنظيف باستخدام Python

1. ملء القيم الفارغة في حقل "سبب التأخير" بـ "لم يتم الإلغاء أو التأخير".

2. اكتشاف القيم الشاذة في حقل السعر، ولكن لم نقم بحذفها لأنها ليست أخطاء في البيانات.

ثم:

قمنا بإنشاء داشبورد رائع والحصول على النتائج التالية:

البيانات تحتوي على 32 ألف صف.

الإيرادات تساوي 741.9 ألف دولار.

نسبة الوصول في الوقت المحدد 86.82%.

نسبة أنواع التذاكر:

1. Anytime: 47.61%.

2. Off-Peak: 31%.

3. Advanced: 21.39%.

متوسط سعر أنواع التذاكر:

1. Anytime: 39.2 دولار.

2. Off-Peak: 25.5 دولار.

3. Advanced: 17.6 دولار.

عدد عوامل المساهمة في التأخير:

1. الطقس: 995.

2. أعطال الإشارات: 970.

3. سبب التأخير: 707.

4. نقص الموظفين: 410.

5. الازدحام: 314.

أفضل 5 وجهات:

1. Durham: 258.

2. Didcot: 48.

3. Cardiff Central: 16.

4. Wakefield: 15.

5. Warrington: 15.

متوسط الإيرادات لكل شهر:

1. أعلى متوسط إيرادات كان في فبراير.

2. أقل متوسط إيرادات كان في أكتوبر.

إيرادات فئات التذاكر:

1. Standard, Online: 303,198 دولار.

2. Standard, Station: 289,324 دولار.

3. First Class, Online: 79,556 دولار.

4. First Class, Station: 69.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
3
تاريخ الإضافة
تاريخ الإنجاز
المهارات