تمتة جمع البيانات (Web Scraping) واستخراجها إلى ملفات Excel احترافية

تفاصيل العمل

هيكلة البيانات: استخراج تصنيفات الكتب (Categories) ديناميكياً والتنقل داخل كل قسم على حدة.

التعامل مع الصفحات (Pagination): برمجة منطق ذكي للانتقال بين الصفحات (Next Button) لضمان سحب كافة البيانات مهما كان عددها.

استخراج تفاصيل دقيقة: سحب (عنوان الكتاب، السعر، التقييم، حالة التوفر، والقسم التابع له).

تنظيم البيانات: تحويل البيانات الخام من HTML إلى هيكل بيانات منظم باستخدام مكتبة Pandas.

المخرجات: تصدير البيانات النهائية إلى ملف Excel (.xlsx) احترافي جاهز للتحليل.

الأدوات المستخدمة (Tech Stack):

BeautifulSoup & Requests: للتعامل مع طلبات الويب وتحليل محتوى الصفحات.

LXML: كمحلل (Parser) سريع وعالي الأداء.

Pandas: لإدارة الجداول وتصدير الملفات.

بطاقة العمل

اسم المستقل
عدد الإعجابات
0
عدد المشاهدات
2
تاريخ الإضافة