قمت بتنفيذ مشروع للتنبؤ بأسعار المنازل باستخدام تقنيات Machine Learning، بهدف تقدير سعر أي منزل بناءً على مجموعة من الخصائص.
هدف المشروع
التنبؤ بسعر المنزل بدقة
مساعدة المستخدم أو المستثمر في اتخاذ قرار الشراء أو البيع
فهم العوامل التي تؤثر على الأسعار
البيانات المستخدمة
البيانات تحتوي على خصائص مثل:
المساحة (Area)
عدد الغرف (BHK)
عدد الحمامات
الموقع (Location)
عدد الأدوار
عمر العقار
الأدوات المستخدمة
Python
Pandas → لمعالجة البيانات
NumPy → العمليات الحسابية
Seaborn / Matplotlib → Visualization
Scikit-learn → بناء الموديلات
خطوات العمل
1. Data Preprocessing
تنظيف البيانات (حذف القيم الناقصة)
إزالة القيم الشاذة (Outliers)
تحويل البيانات النصية إلى أرقام (Encoding)
2. Data Analysis
تحليل العلاقة بين المتغيرات
استخدام الرسومات لفهم البيانات
معرفة أهم العوامل المؤثرة في السعر
3. Feature Engineering
إنشاء Features جديدة مثل:
السعر لكل متر
عدد الغرف بالنسبة للمساحة
4. Model Building
قمت بتجربة أكثر من نموذج:
Linear Regression
Lasso
Ridge
Polynomial Regression
5. Model Evaluation
استخدمت:
R² Score → لقياس جودة النموذج
MSE → لقياس الخطأ
6. Prediction
إدخال بيانات منزل جديد
النموذج يتنبأ بالسعر المتوقع
التحديات
وجود Outliers أثرت على النتائج
التعامل مع البيانات غير المتوازنة
اختيار أفضل نموذج
النتائج
حصلت على نموذج بدقة جيدة (R² عالي)
تمكنت من التنبؤ بأسعار قريبة من الواقع
الخلاصة
المشروع ساعدني على:
فهم Regression Models بشكل عملي
تحسين مهارات Data Preprocessing
التعامل مع بيانات حقيقية