استخراج بيانات العقارات في شيكاغو من الويب (Chicago Real Estate Web Scraping)

تفاصيل العمل

مشروع "استخراج بيانات العقارات في شيكاغو"

وصف المشروع:

يتضمن هذا المشروع استخراج بيانات العقارات من عدة قوائم في مدينة شيكاغو باستخدام برنامج استخراج البيانات (Web Scraper). يقوم البرنامج بجمع معلومات أساسية حول المنازل مثل عدد غرف النوم، عدد الحمامات، المساحة الإجمالية، العنوان، والسعر من 135 صفحة. مجموعة البيانات الناتجة تحتوي على 3,264 صفًا و5 أعمدة. تم تنظيف البيانات وتحضيرها بشكل دقيق ثم حفظها في ملف CSV.

1. ميزات مجموعة البيانات:

مجموعة البيانات تتضمن الأعمدة التالية:

- غرف النوم (Bedrooms): عدد غرف النوم في المنزل.

- الحمامات (Baths): عدد الحمامات في المنزل.

- المساحة (Square Feet): إجمالي المساحة بالأقدام المربعة.

- العنوان (Address): العنوان الفعلي للعقار.

- السعر (Price): السعر المعروض للمنزل.

2. تحضير البيانات (Data Preparation):

بعد استخراج البيانات، تم تحضيرها بشكل مناسب للتحليل من خلال عدة خطوات:

- تنظيف البيانات (Data Cleaning): تم التأكد من أن البيانات خالية من التكرارات والأخطاء مثل القيم الفارغة أو القيم غير المنطقية.

- تحليل التوزيع والارتباط (Distribution and Correlation Analysis): تم فحص توزيعات البيانات باستخدام الرسوم البيانية المختلفة وتحليل الارتباطات بين المتغيرات (مثل العلاقة بين السعر وعدد غرف النوم).

- الحفظ في CSV (Saving to CSV): بعد تنظيف البيانات، تم حفظها في ملف CSV لسهولة الوصول إليها وتحليلها في المستقبل.

3. التقنيات المستخدمة:

استخراج البيانات (Web Scraping):

تم استخدام مكتبة BeautifulSoup في Python لاستخراج البيانات من صفحات الإنترنت.

تم استخدام Requests لجلب المحتوى من صفحات الويب.

تحليل البيانات (Data Analysis):

Pandas لتحليل وتنظيف البيانات.

Matplotlib و Seaborn لرسم الرسوم البيانية وتحليل التوزيعات.

حفظ البيانات (Saving Data):

تم حفظ البيانات في ملف CSV باستخدام مكتبة Pandas.

ملفات مرفقة

بطاقة العمل

اسم المستقل مازن ا.
عدد الإعجابات 0
عدد المشاهدات 7
تاريخ الإضافة
تاريخ الإنجاز