تحليل وتنظيف بيانات عقارية وتدريب نماذج تنبؤية

تفاصيل العمل

في هذا المشروع عملتُ على مجموعة بيانات عقارية بهدف التنبؤ بأسعار العقارات بالاعتماد على خصائص متعددة مثل (المساحة، عدد الغرف، الموقع، عمر العقار، إلخ).

خطوات العمل التي قمت بها:

تنظيف البيانات: معالجة القيم المفقودة، اكتشاف القيم الشاذة (Outliers) والتعامل معها، وتوحيد الوحدات والأنماط المختلفة في البيانات.

تحليل البيانات (EDA): دراسة العلاقة بين الخصائص المختلفة وسعر العقار باستخدام التوزيعات الإحصائية والرسوم البيانية (مثل العلاقة بين الموقع والسعر، أو بين عدد الغرف والسعر).

تجهيز البيانات للنمذجة:

تحويل المتغيرات الفئوية (Categorical) إلى متغيرات رقمية (Encoding).

مقياس القيم الرقمية باستخدام Normalization/Standardization.

تدريب عدة نماذج: قمت بتجربة أكثر من خوارزمية تعلم آلي مثل:

Linear Regression

Decision Tree

Random Forest

Gradient Boosting

المقارنة بين النماذج: تم تقييم النماذج باستخدام مؤشرات الدقة مثل RMSE (Root Mean Squared Error) و R² Score، وتم اختيار النموذج الأفضل لتحقيق أعلى دقة في التنبؤ بأسعار العقارات.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
4
تاريخ الإضافة
تاريخ الإنجاز
المهارات