الخطوات والتقنيات المطبقة:
تنظيف وتجهيز البيانات: التعامل مع القيم المفقودة باستخدام SimpleImputer، ومعالجة القيم النصية، وإنشاء ميزات جديدة (Feature Engineering) مثل 'سعر القدم المربع'.
التحليل الإحصائي والبصري:
دراسة توزيع الأسعار باستخدام Histograms.
تحليل العلاقة بين المناطق والأسعار باستخدام Boxplots.
فهم ارتباط المتغيرات ببعضها (Correlation) باستخدام Heatmaps.
تقليل الأبعاد (Dimensionality Reduction):
تطبيق PCA (Principal Component Analysis) لتقليل تعقيد البيانات مع الحفاظ على 90% من التباين (Variance).
استخدام StandardScaler لتوحيد المقاييس قبل التحليل.
تحليل نسبة التباين المفسر (Explained Variance Ratio) لتحديد أهم المكونات.
هذا المشروع يبرز المهارة في التعامل مع البيانات عالية الأبعاد وتجهيزها لنماذج التعلم الآلي.