استخراج بيانات المنتجات من موقع جوميا باستخدام Selenium وتخزينها في قاعدة MongoDB

تفاصيل العمل

هل ترغب في مراقبة أسعار المنتجات على موقع جوميا وتحليل التخفيضات تلقائيًا؟

قمت بتطوير أداة احترافية تقوم بجمع بيانات المنتجات من أقسام محددة على موقع Jumia (مثل الهواتف والإلكترونيات)، باستخدام تقنيات Web Scraping الحديثة مع Selenium.

تجمع الأداة اسم المنتج، رابطه، السعر الحالي، السعر القديم، ونسبة التخفيض تلقائيًا.

تُخزّن البيانات في قاعدة MongoDB بعد التأكد من عدم تكرارها، مع إمكانية التحديث الدوري.

تم تحسين الكود ليعمل بشكل مستقر مع الانتظار الديناميكي وإغلاق النوافذ المنبثقة.

هذه الأداة مثالية لأصحاب المتاجر الإلكترونية، المسوّقين، والمطورين الذين يحتاجون إلى تتبع الأسعار أو تغذية قاعدة بيانات منتجاتهم تلقائيًا.

المهارات المستخدمة في المشروع:

* لغة Python

* مكتبة Selenium WebDriver

* مكتبة Pymongo (للاتصال بـ MongoDB)

* CSS Selectors

* Regex (التعبيرات النمطية لتحليل الأسعار)

* التعامل مع JSON وملفات الإعدادات

* تنظيم الكود على شكل وحدات قابلة للتعديل

وصف دقيق لطريقة عمل المشروع (مبسط للعميل):

1. يتم فتح موقع جوميا عبر متصفح Firefox مخصص (بدون واجهة في وضع Headless إن لزم الأمر).

2. تنتقل الأداة تلقائيًا إلى الصفحات المختلفة لكل فئة (مثل الهواتف والإلكترونيات).

3. تُحلل كل صفحة وتستخرج بيانات المنتجات: الاسم، الرابط، السعر الحالي، السعر القديم، نسبة التخفيض.

4. تُخزَّن البيانات في قاعدة بيانات MongoDB مع تجنّب التكرار.

5. يتم تحديث الأسعار تلقائيًا عند تغيّرها، مع تسجيل الوقت.

ملفات مرفقة

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
5
تاريخ الإضافة
تاريخ الإنجاز
المهارات