برز ما تم إنجازه في المشروع (Technical Highlights):
معالجة البيانات (Data Preprocessing):
التعامل مع القيم المفقودة (Missing Values) في أعمدة أساسية مثل المساحة (Size) والإيجار (Rent).
تنظيف البيانات من القيم المكررة والتأكد من توافق أنواع البيانات.
هندسة الميزات (Feature Engineering): تحويل تواريخ النشر واستخراج أرقام الطوابق، وتحويل المتغيرات النصية إلى قيم رقمية باستخدام تقنيات (One-Hot Encoding).
تطبيع البيانات (Scaling): استخدام MinMaxScaler لتوحيد نطاق الميزات العددية لتحسين أداء النماذج.
التحليل الاستكشافي (EDA):
استخدام مكتبات Seaborn وMatplotlib لتصور توزيع الأسعار وعلاقة المساحة وعدد الغرف (BHK) بقيمة الإيجار.
بناء النماذج وتوقع النتائج (Machine Learning):
تطبيق نموذج الانحدار الخطي (Linear Regression) كنموذج أساسي للمقارنة.
تطبيق نموذج أشجار القرار (Decision Tree Regressor) لتحقيق دقة توقع أعلى.
تقييم الأداء باستخدام معايير إحصائية دقيقة مثل R2 Score، و MAE (متوسط الخطأ المطلق)، و RMSE (جذر متوسط مربعات الخطأ).
الأدوات والتقنيات المستخدمة:
اللغة: Python.
المكتبات الأساسية: Pandas, NumPy.
الرسم البياني: Matplotlib, Seaborn.
تعلم الآلة: Scikit-Learn.