مشروع متكامل لتحليل البيانات يغطي دورة حياة البيانات بالكامل، بدءاً من استخراج البيانات من الويب (Web Scraping) وصولاً إلى التنبؤ بالأسعار باستخدام تعلم الآلة.
أبرز مكونات المشروع:
- استخراج البيانات: تطوير أدوات كشط مخصصة لجمع بيانات أكثر من 251,000 عقار في 10 مدن أوروبية باستخدام Playwright.
- معالجة البيانات: تنظيف ودمج البيانات وبناء مستودع بيانات (Data Warehouse) باستخدام SQL Server.
- التحليل الإحصائي: إجراء اختبارات ANOVA و MANOVA باستخدام لغة R.
- لوحات البيانات: بناء لوحات تفاعلية في Power BI لتحليل السوق.
- تطبيق الويب: تطوير تطبيق تفاعلي باستخدام Streamlit يتيح للمستخدمين التنبؤ بأسعار الإقامة في الوقت الفعلي باستخدام نموذج CatBoost.
التقنيات المستخدمة: Python, R, SQL Server, Power BI, Streamlit, Playwright, CatBoost.