تفاصيل العمل

يهدف هذا المشروع إلى تحليل بيانات حجوزات الفنادق لفهم سلوك العملاء، واستخراج الأنماط التي تؤثر على قرارات الحجز، ومعرفة العوامل التي تؤدي إلى إلغاء الحجوزات أو نجاحها. يساعد هذا التحليل الفنادق على تحسين استراتيجيات التسعير، وإدارة الموارد، وزيادة معدلات الإشغال.

تنظيف البيانات ومعالجتها (Data Cleaning & Preprocessing)

إزالة القيم المفقودة والتأكد من جودة البيانات.

التعامل مع البيانات غير المتسقة وتحويلها إلى صيغ مناسبة للتحليل.

تحويل البيانات الفئوية (Categorical Data) إلى بيانات رقمية (Numerical Data) لاستخدامها في التحليل والنمذجة.

2️⃣ تحليل البيانات واستخراج الرؤى (Exploratory Data Analysis - EDA)

Matplotlib وSeaborn لإنشاء المخططات البيانية مثل:

تحليل معدل إشغال الفنادق حسب الأشهر.

تأثير مدة الإقامة على احتمالية إلغاء الحجز.

مقارنة نسب الإلغاء بين أنواع العملاء المختلفين.

دراسة تأثير العروض الترويجية على عدد الحجوزات.

تحليل العوامل المؤثرة على الحجوزات:

هل يؤثر وقت الحجز على احتمال الإلغاء؟

أي نوع من الغرف يتم حجزه أكثر؟

كيف يؤثر الموقع الجغرافي للعميل على قرارات الحجز؟

التنبؤ بإلغاء الحجوزات (Cancellation Prediction - ML Model)

? بناء نموذج تعلم آلي (Machine Learning) للتنبؤ بما إذا كان العميل سيقوم بإلغاء الحجز أم لا باستخدام Scikit-Learn.

الخوارزميات المستخدمة:

Logistic Regression

Random Forest Classifier

Decision Tree

Gradient Boosting (مثل XGBoost وAdaBoost)

تقييم النموذج باستخدام:

الدقة (Accuracy) - Recall - Precision - F1 Score

مصفوفة الارتباك (Confusion Matrix)

رسم ROC Curve لقياس جودة النموذج

تحسين استراتيجيات الحجز (Business Insights)

تحديد العوامل التي تزيد من احتمالية إلغاء الحجز.

تحليل الفترات الزمنية التي يكون فيها معدل الإلغاء مرتفعًا.

تقديم توصيات للفنادق لتقليل الإلغاءات وزيادة الأرباح.

ملفات مرفقة