قمت بتطوير نموذج تعلم آلة للتنبؤ بأسعار المنازل باستخدام خوارزمية Linear Regression اعتمادًا على مجموعة من الخصائص مثل مساحة المنزل والموقع وعدد الغرف. يهدف المشروع إلى تحليل البيانات واكتشاف العوامل الأكثر تأثيرًا في تحديد سعر المنزل.
بدأ المشروع بمرحلة استكشاف البيانات (EDA) باستخدام الرسوم البيانية مثل histograms وboxplots وscatter plots لفهم توزيع الأسعار والعلاقة بينها وبين الخصائص المختلفة.
بعد ذلك تم تنظيف البيانات ومعالجتها من خلال التعامل مع القيم المفقودة وترميز المتغيرات الفئوية باستخدام One-Hot Encoding، ثم تقسيم البيانات إلى مجموعة تدريب واختبار لضمان تقييم النموذج بشكل صحيح.
تم أيضًا تنفيذ Feature Engineering لإنشاء خصائص جديدة مثل عمر المنزل وإجمالي المساحة، مما ساعد على تحسين أداء النموذج.
في النهاية تم بناء وتدريب نموذج Linear Regression باستخدام مكتبة scikit-learn وتقييم أدائه باستخدام مقياس Root Mean Squared Error (RMSE) مع تحليل معاملات النموذج لمعرفة أكثر العوامل تأثيرًا على السعر.