تفاصيل العمل

تم استيراد مجموعة البيانات إلى خادم SQL كجداول منفصلة. تم تحديد أنواع جميع الأعمدة بشكل صريح باستخدام عبارات ALTER TABLE لضمان سلامة البيانات قبل تطبيق أي قيود. تم تعريف المفاتيح الأساسية في جميع الجداول التسعة - تم استخدام مفاتيح أساسية مركبة لجداول ticket_flights و boarding_passes و seats، حيث لم يكن عمود واحد كافيًا لضمان تفرد الصفوف. على سبيل المثال، يستخدم جدول ticket_flights المفتاح المركب (ticket_no, flight_id) لأن التذكرة الواحدة يمكن أن تشمل عدة رحلات متصلة.

ثم تم تطبيق قيود المفاتيح الخارجية على جميع الجداول ذات الصلة لفرض سلامة البيانات المرجعية - ربط التذاكر بالحجوزات، وجدول ticket_flights بالتذاكر والرحلات الجوية، وجدول boarding_passes بالتذاكر والرحلات الجوية، وجدول الرحلات الجوية بالمطارات والطائرات، وجدول seats بالطائرات، وجدول reviews بالتذاكر والرحلات الجوية والمطارات والطائرات.

تمت كتابة استعلامات استكشافية لفهم مجموعة البيانات: كشف توزيع شروط الأجرة أن الدرجة السياحية هي الفئة السائدة، وأظهر تحليل حالة الرحلة أن معظم الرحلات مجدولة أو وصلت مع نسبة صغيرة متأخرة أو ملغاة، وحدد تحليل مطارات المغادرة الرئيسية مجموعة صغيرة من أظهرت المحاور التي تقود غالبية حركة المرور، والطرق الرئيسية التي أبرزت أكثر أزواج المدن ازدحامًا، وتحليل الطائرات الأكثر استخدامًا اعتمادًا مركزًا على عدد قليل من الطرازات.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
المهارات