يوضح هذا المشروع كيفية استخلاص البيانات (Scraping) سواء كانت منظمة أو غير منظمة من صفحة ويب باستخدام Python و BeautifulSoup.
يقوم السكربت باستخراج:
العناوين (<h1>، <h2>)
الفقرات (<p>) وعناصر القوائم (<li>)
بيانات جدول المنتجات: (اسم المنتج، السعر، حالة التوفر)
بيانات بطاقات الكتب: (عنوان الكتاب، السعر، مدى التوفر، ونص الزر)
بيانات النماذج (Forms): (اسم الحقل، نوعه، والقيم الافتراضية)
رابط الفيديو
بيانات قسم المنتجات المميزة (المخرجات المتوقعة كقاموس Dictionary)
يتم حفظ جميع البيانات المستخرجة في ملفات CSV أو JSON.