في هذا المشروع عملتُ على مجموعة بيانات عقارية بهدف التنبؤ بأسعار العقارات بالاعتماد على خصائص متعددة مثل (المساحة، عدد الغرف، الموقع، عمر العقار، إلخ).
خطوات العمل التي قمت بها:
تنظيف البيانات: معالجة القيم المفقودة، اكتشاف القيم الشاذة (Outliers) والتعامل معها، وتوحيد الوحدات والأنماط المختلفة في البيانات.
تحليل البيانات (EDA): دراسة العلاقة بين الخصائص المختلفة وسعر العقار باستخدام التوزيعات الإحصائية والرسوم البيانية (مثل العلاقة بين الموقع والسعر، أو بين عدد الغرف والسعر).
تجهيز البيانات للنمذجة:
تحويل المتغيرات الفئوية (Categorical) إلى متغيرات رقمية (Encoding).
مقياس القيم الرقمية باستخدام Normalization/Standardization.
تدريب عدة نماذج: قمت بتجربة أكثر من خوارزمية تعلم آلي مثل:
Linear Regression
Decision Tree
Random Forest
Gradient Boosting
المقارنة بين النماذج: تم تقييم النماذج باستخدام مؤشرات الدقة مثل RMSE (Root Mean Squared Error) و R² Score، وتم اختيار النموذج الأفضل لتحقيق أعلى دقة في التنبؤ بأسعار العقارات.