تفاصيل العمل

في هذا المشروع، قمت بتطوير نظام للتنبؤ بأسعار المنازل (House Price Prediction) باستخدام تقنيات التعلم الآلي (Machine Learning). الهدف الأساسي للمشروع هو بناء نموذج دقيق يمكنه تقدير القيمة السوقية للمنازل بناءً على مجموعة من البيانات الجغرافية والديموغرافية.

بدأت المشروع بمرحلة تحليل البيانات الاستكشافي (EDA) لفهم طبيعة البيانات، حيث قمت بتحليل العلاقات بين المتغيرات المختلفة مثل:

Longitude, Latitude, Housing Median Age, Total Rooms, Population, Median Income, Ocean Proximity.

كما تضمن التحليل استخدام الرسوم البيانية لفحص توزيع البيانات واكتشاف القيم الشاذة والعلاقات الارتباطية باستخدام:

- Histogram

- Scatter Plot

- Correlation Heatmap

بعد ذلك، انتقلت إلى مرحلة معالجة البيانات (Data Preprocessing) والتي شملت:

- معالجة القيم المفقودة (Handling Missing Values) في عمود total_bedrooms.

- تحويل المتغيرات الفئوية باستخدام OneHotEncoder للميزة ocean_proximity.

- تطبيق التحويلات الرياضية (Log Transformation) لمعالجة التوزيعات غير المتماثلة.

- تقسيم البيانات إلى مجموعات تدريب واختبار (Training and Test sets).

- استخدام StandardScaler لتوحيد مقاييس الميزات (Feature Scaling).

لتطوير النموذج، قمت بتجربة ومقارنة مجموعة واسعة من خوارزميات التعلم الآلي:

- Linear Regression

- Ridge & Lasso Regression

- K-Neighbors Regressor (KNN)

- Decision Tree Regressor

- Random Forest Regressor

- Gradient Boosting & XGBoost

- AdaBoost & Bagging Regressor

كما استخدمت تقنية GridSearchCV لإجراء عملية ضبط المعلمات (Hyperparameter Tuning) للوصول إلى أفضل إعدادات لكل نموذج. تم تقييم النماذج بناءً على مقاييس أداء عالمية مثل:

- R2 Score

- RMSE (Root Mean Squared Error)

- MAE (Mean Absolute Error)

في النهاية، تم تحديد النموذج الأفضل بناءً على أقل قيمة للخطأ وأعلى دقة، وقمت بحفظ النموذج النهائي والمقياس (Scaler) باستخدام مكتبة Joblib ليكون جاهزاً للنشر والاستخدام المستقبلي.

التقنيات المستخدمة:

- Python

- Pandas & NumPy

- Scikit-learn

- XGBoost

- Matplotlib & Seaborn

ناتج المشروع:

بناء نموذج تعلم آلي متكامل يتنبأ بأسعار المنازل بدقة عالية، مما يساعد في اتخاذ قرارات استثمارية وعقارية مستنيرة بناءً على مؤشرات البيانات الحقيقية.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
1
تاريخ الإضافة
تاريخ الإنجاز
المهارات