قمت بتحليل بيانات أسعار المساكن في كاليفورنيا باستخدام أدوات Python, Pandas, NumPy, Matplotlib, Seaborn, Scikit-learn.
اشتمل المشروع على خطوات Data Cleaning و Exploratory Data Analysis (EDA) لفهم العلاقة بين الخصائص المختلفة وسعر المنزل، بالإضافة إلى بناء نموذج تنبؤي (Predictive Model) يعتمد على Ridge Regression بعد تطبيق Feature Scaling.
أظهرت النتائج أن متوسط دخل الأسر (Median Income) هو العامل الأكثر تأثيرًا على الأسعار، يليه الموقع الجغرافي (Latitude & Longitude) و عدد الغرف المتوسط. كما أوضحت الرسوم البيانية أن المنازل الساحلية عادةً ما تكون أغلى من المنازل في المناطق الداخلية.
النموذج حقق دقة تنبؤية تقارب 85% (باستخدام Cross-Validation)، مما يوضح فعاليته في تقدير أسعار المساكن بشكل موثوق.
هذا المشروع يعكس قدرتي على تحويل بيانات خام إلى Insights عملية وبناء نماذج Machine Learning تقدم قيمة حقيقية.