تنظيف البيانات (Data Cleaning)
بيتم التعامل مع القيم المفقودة (missing values) في البيانات، سواء بحذفها أو بتعويضها بقيم مناسبة (زي المتوسط أو الوسيط).
الهدف هنا هو تجهيز البيانات بشكل صالح للتدريب بدون أخطاء.
تحويل المتغيرات الفئوية (Encoding Categorical Features)
يتم تحويل الأعمدة النصية أو الفئوية إلى أرقام باستخدام One-Hot Encoding.
ده ضروري لإن XGBoost ما بيقبلش مدخلات نصية.
بناء نموذج XGBoost
يتم استخدام XGBRegressor من مكتبة xgboost مع إعدادات مثل:
n_estimators=1000 (عدد الأشجار)
learning_rate=0.05
max_depth=4
الهدف هو إنشاء نموذج قوي لتوقع الأسعار بدقة بدون overfitting.
4. تدريب النموذج (Model Training)
النموذج بيتدرّب على البيانات المُجهزة.
غالبًا بيتم استخدام مجموعة التدريب بالكامل بدون تقسيم داخلي.