قمت بتنفيذ مشروع برمجي باستخدام لغة Python ومكتبتي Requests وBeautifulSoup لاستخلاص بيانات من موقع إلكتروني يحتوي على اقتباسات متعددة الصفحات.
تفاصيل المشروع:
- استخراج الاقتباسات (النص)
- استخراج اسم المؤلف
- استخراج الوسوم المرتبطة بكل اقتباس
يتم حفظ البيانات في ملف CSV منسق يحتوي على ثلاثة أعمدة:
(الاقتباس - المؤلف - الوسوم)
الكود يتعامل تلقائيًا مع جميع الصفحات باستخدام تقنية الـ Pagination.
تمت إضافة رؤوس HTTP (User-Agent) لتجنب حظر الطلبات من الموقع المستهدف.
اسم الملف الناتج يتضمن تاريخ التنفيذ لتسهيل التتبع.
هذا المشروع قابل للتعديل ليعمل على مواقع أخرى مشابهة حسب الطلب.