الوصف:
مشروع عملي باستخدام SQL Server لتنظيف وتحضير بيانات العقارات في مدينة ناشفيل.
الهدف من المشروع هو معالجة البيانات الخام وتجهيزها للتحليل أو بناء النماذج، عن طريق:
توحيد صيغة التواريخ.
ملء القيم المفقودة (Nulls) بالاعتماد على مفاتيح مشتركة مثل ParcelID.
فصل العناوين (Property & Owner Address) إلى أعمدة منفصلة (عنوان، مدينة، ولاية).
توحيد القيم النصية (مثل تحويل Y/N إلى Yes/No).
إزالة البيانات المكررة باستخدام CTE و ROW_NUMBER.
حذف الأعمدة غير المستخدمة وإنشاء نسخة نظيفة من الجدول.
طريقة التنفيذ:
إنشاء قاعدة بيانات جديدة DataCleaning.
استيراد بيانات العقارات الخام.
كتابة استعلامات SQL خطوة بخطوة لتنظيف وتوحيد البيانات.
حفظ نسخة نهائية نظيفة في جدول جديد NashvilleHousing_Cleaned.
المهارات والأدوات المستخدمة:
SQL Server
Data Cleaning
Handling Nulls & Duplicates
String Manipulation (SUBSTRING, PARSENAME)
CTE & Window Functions