استخراج بيانات المنتجات "قسم الإلكترونيات" من موقع أمازون

تفاصيل العمل

قمت بتطوير سكربت متقدم باستخدام لغة Python وأداة Selenium لأتمتة عملية جمع البيانات من موقع أمازون مصر. يهدف المشروع إلى استخراج معلومات المنتجات (الأسماء والأسعار) من صفحات الويب الديناميكية وتحويلها إلى بيانات مهيكلة يمكن استخدامها في تحليل الأسعار أو دراسة السوق.

المميزات التقنية (ماذا فعلت في الكود؟):

الأتمتة الكاملة (Automation): استخدام WebDriver لمحاكاة سلوك المستخدم الحقيقي في تصفح الموقع والوصول إلى الروابط المستهدفة آلياً.

تحديد العناصر بدقة (XPath): الاعتماد على مسارات XPath دقيقة لاستخراج النصوص من داخل بنية الـ HTML المعقدة للموقع.

معالجة البيانات المفقودة (Robust Error Handling): تصميم نظام ذكي باستخدام try-except لضمان استمرارية عمل السكربت عند مواجهة منتجات لا تحتوي على أسعار، مع طباعة تنبيهات توضح حالة كل عنصر.

هيكلة البيانات: تجميع البيانات المستخرجة في قوائم (Lists) منظمة لتسهيل عملية تصديرها لاحقاً إلى تنسيقات مثل CSV أو Excel.

الأدوات والمكتبات المستخدمة:

Python: لبرمجة المنطق الأساسي للأداة.

Selenium: للتحكم الآلي في المتصفح والتعامل مع العناصر الديناميكية.

XPath: لتحديد مواقع البيانات (Scraping Points) داخل كود الصفحة.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
5
تاريخ الإضافة
تاريخ الإنجاز
المهارات