يتضمن هذا المشروع تطوير نموذج تنبؤي دقيق لأسعار الوحدات السكنية باستخدام تقنيات تعلم الآلة المتقدمة في لغة Python. مر المشروع بالمراحل التالية:
استكشاف وتجهيز البيانات (EDA): التعامل مع قاعدة بيانات تحتوي على أكثر من 20,000 سجل، وتجهيزها من خلال مكتبة Pandas و Numpy لضمان جودة المدخلات.
تحجيم البيانات (Feature Scaling): تطبيق تقنيات الـ Scaling على البيانات لضمان توافق المتغيرات وتحسين أداء النماذج الرياضية.
بناء النماذج وتدريبها: تم تدريب واختبار عدة نماذج، مع التركيز بشكل أساسي على خوارزمية Random Forest Regressor.
تقييم الأداء: قياس كفاءة النموذج باستخدام معايير إحصائية دقيقة مثل R-squared (R2)، حيث حقق النموذج نسبة دقة تصل إلى 80% تقريباً في التنبؤ، بالإضافة إلى حساب Mean Absolute Error (MAE) و RMSE.
الأدوات المستخدمة: تم استخدام بيئة عمل Jupyter Notebook مع مكتبات Scikit-learn لبناء النموذج، و Matplotlib للتمثيل البياني.
هذا المشروع يبرز قدرتي على معالجة البيانات الضخمة وبناء نماذج تنبؤية تساعد في اتخاذ قرارات عقارية مبنية على البيانات.