هذا المشروع عبارة عن بايبلاين للتعلم الآلي مخصص لتوقع أسعار العقارات باستخدام مجموعة بيانات Kaggle House Prices. يشمل سير العمل: معالجة البيانات، اختيار الميزات، تدريب النماذج، وتقييمها.
خطوات المشروع
1. معالجة البيانات (Data Preprocessing)
التعامل مع القيم المفقودة
ترميز المتغيرات الفئوية (Ordinal + One-Hot Encoding)
مقياس للمتغيرات العددية باستخدام StandardScaler
معالجة القيم الشاذة (Clipping & Removal)
2. اختيار الميزات (Feature Selection)
استخدام Lasso Regression (LassoCV) للاختيار التلقائي للميزات.
اختيار أهم 15 ميزة مؤثرة.
3. النماذج المطبقة (Models Implemented)
الانحدار الخطي (Linear Regression)
الغابة العشوائية (Random Forest Regressor)
الانحدار المعزز (Gradient Boosting Regressor)
4. مقاييس التقييم (Evaluation Metrics)
معامل التحديد R² Score
متوسط الخطأ المطلق MAE
جذر متوسط مربع الخطأ RMSE