بناءً على طلب أحد العملاء، قمت باستخراج بيانات عقارات من موقع Dubizzle (OLX سابقًا).
شملت البيانات المستخرجة جميع التفاصيل المطلوبة مثل:
- السعر
- الموقع
- عدد الغرف
- الوصف التفصيلي
- رابط صفحة البائع
- رقم التواصل مع البائع
نظرًا لأن الموقع يعتمد على محتوى ديناميكي، تم استخدام Selenium مع Python لبناء كود برمجي يحاكي المتصفح ويقوم بجمع البيانات بدقة.
أصعب جزء في العملية كان استخراج أرقام الهاتف، إذ لم تكن ظاهرة بشكل مباشر، ولكن تم التغلب على ذلك باستخدام أساليب متقدمة في الأتمتة (Automation)، مما أتاح الحصول على جميع الأرقام بنجاح.
مرفق عينة من البيانات التي تم استخراجها كمثال على جودة ودقة النتائج.