مشروع لتوقع أسعار المنازل باستخدام بيانات Kaggle (House Prices Dataset).
تضمنت خطوات العمل:
معالجة البيانات (التعامل مع القيم المفقودة، ترميز البيانات الفئوية، تطبيع الخصائص).
استكشاف البيانات بصريًا باستخدام Seaborn و Matplotlib (Boxplots, Line plot, Correlation Heatmaps) لفهم التوزيعات والعلاقات بين المتغيرات.
تدريب 3 نماذج تعلم آلي: Linear Regression، Random Forest Regressor، XGBoost.
تقييم الأداء باستخدام Root Mean Squared Error (RMSE) ومقارنة نتائج النماذج.
In English:
This project predicts house prices using Kaggle’s House Prices Dataset.
The workflow included:
Data preprocessing (handling missing values, categorical encoding, normalization).
Exploratory Data Analysis (EDA) using Seaborn & Matplotlib (Boxplots, Histograms, Scatterplots, Correlation Heatmaps) to understand distributions and relationships.
Training 3 machine learning models: Linear Regression, Random Forest Regressor, XGBoost.
Evaluation based on Root Mean Squared Error (RMSE) with comparison across models.
Tools & Libraries: Python, Pandas, Scikit-learn, Seaborn, Matplotlib, XGBoost